← Volver a VERBOS.GAL

Como funciona VERBOS.GAL

VERBOS.GAL é, ata onde sabemos, o primeiro asistente conversacional especializado en verbos en galego. Aquí explicamos como funciona por dentro.

Que é VERBOS.GAL

Un chat onde podes preguntar en linguaxe natural sobre verbos en galego: conxugacións, significados, usos, tempos verbais, perífrases, irregularidades, casos de uso, exercicios... O sistema non se limita a devolver datos dunha táboa: entende a túa pregunta, busca a información relevante e constrúe unha resposta conversacional en galego.

É un proxecto de As Chaves da Lingua.

Que pasa cando fas unha pregunta

Cada vez que escribes algo no chat, a túa pregunta percorre un proceso en varios pasos antes de que vexas a resposta. O sistema decide automaticamente que ferramentas necesita segundo o tipo de consulta:

A túa pregunta
Modelo de linguaxe
Busca de información
Resposta final

O modelo de linguaxe recibe a túa pregunta e decide que tipo de información necesita. Pode activar unha ou varias ferramentas ao mesmo tempo:

Conxugacións: busca as formas verbais completas (todos os tempos e modos) na nosa propia base de datos ou no Dicionario da Real Academia Galega.

Definicións: consulta o significado do verbo, con acepcións e exemplos de uso extraídos do Dicionario da Real Academia Galega.

Teoría gramatical: fai unha busca semántica na documentación interna para atopar explicacións sobre tempos verbais, perífrases, regras ortográficas, resolución de exercicios, exemplos etc.

Coa información recuperada, o modelo xera a resposta en galego natural, integrando datos e explicacións nunha conversa coherente.

A técnica: Retrieval-Augmented Generation (RAG)

VERBOS.GAL emprega unha arquitectura coñecida como RAG (Retrieval-Augmented Generation). (Se queres saber máis, preme aquí). A idea é sinxela: no canto de confiar unicamente na "memoria" do modelo de IA, cada pregunta desencadea unha busca activa en fontes de datos propias. O modelo recibe esa información como contexto e úsaa para construír a resposta.

Isto ten dúas vantaxes importantes:

Precisión: as respostas baséanse en datos verificados e documentación específica, non só no coñecemento xeral do modelo, que para o idioma galego é extremadamente escaso.

Transparencia: a información procede de fontes identificables (documentación propia e o dicionario da Real Academia Galega, principalmente) e non de "caixas negras".

A base documental

O corazón do sistema é unha base documental propia de máis de 20.000 palabras sobre gramática verbal, dividida en 85 fragmentos temáticos indexados para busca semántica. Esta documentación foi compilada e redactada a partir de diferentes fontes documentais e académicas

Ademais, a nosa propia base de datos contén centos de verbos con todas as súas formas e modos.

A busca semántica híbrida

Cando o modelo necesita información teórica, non busca por coincidencia literal de palabras. Fai unha busca semántica. Isto significa que entende o significado da túa pregunta e atopa documentos relevantes aínda que non usen as mesmas palabras exactas.

Para que isto funcione, cada fragmento da documentación converteuse nunha representación numérica chamada embedding — un vector de centos de dimensións que captura o seu significado. A túa pregunta transfórmase tamén nun embedding e o sistema calcula cales son os fragmentos máis semellantes.

Os embeddings xeráronse co modelo embed-multilingual-v3.0 de Cohere, un dos máis precisos dispoñibles actualmente para capturar significados en múltiples linguas, incluído o galego.

A busca combina dúas técnicas cunha ponderación específica:

65% busca semántica (por significado, usando os embeddings)
35% busca por palabras clave (coincidencia directa de termos en galego, con normalización de acentos e filtrado de stopwords)

Esta combinación híbrida mellora os resultados: a busca semántica entende "cando uso o copretérito" aínda que a documentación fale de "pretérito imperfecto", e a busca por palabras clave garante que termos técnicos específicos non se perdan.

O modelo de linguaxe

As respostas de VERBOS.GAL son xeradas por GPT-5 mini, un modelo de linguaxe de OpenAI. É un modelo compacto pero moi capaz, optimizado para xerar texto fluído e preciso.

O modelo non inventa a información: recibe como contexto os datos recuperados polas ferramentas de busca (conxugacións, definicións, documentación gramatical) e constrúe a resposta a partir deles. O seu traballo é presentar esa información de forma clara, natural e en galego correcto.

Unha peza clave é o system prompt: un conxunto de instrucións detalladas que lle indica ao modelo como debe comportarse, que ton usar, como citar fontes e cando recoñecer que non ten información suficiente para responder.

Limitacións

VERBOS.GAL é un modelo experimental en fase de probas. Malia o coidado posto na documentación e na arquitectura, é importante ter en conta que:

As respostas poden conter erros ou imprecisións, especialmente en casos gramaticais complexos ou ambiguos.

A base de datos de verbos está en crecemento e aínda non cobre todo o léxico verbal galego.

O sistema non substitúe as fontes oficiais nin o criterio de profesionais da lingua.

Recomendamos usar VERBOS.GAL como ferramenta experimental e contrastar as respostas coas fontes cando sexa necesario.

Feedback

Cada resposta do chat inclúe botóns de valoración. Se a resposta é correcta e útil, dálle un positivo. Se contén un erro ou non che convence, dálle un negativo e, se queres, engade un comentario explicando que fallou.

Ese feedback é fundamental: permítenos detectar erros na documentación, mellorar o system prompt e identificar que tipo de consultas necesitan máis traballo. VERBOS.GAL mellora grazas a quen o usa.