ARQUITECTURAS

RAG

4 min de lectura 0 lecturas 26 abr. 2026

RAG, o generacion aumentada por recuperacion, combina busqueda de informacion externa con generacion de lenguaje para responder con contexto mas actualizado y verificable.

Que es RAG

RAG significa Retrieval-Augmented Generation. La idea es sencilla: antes de responder, el sistema busca informacion relevante en una fuente externa y entrega ese contexto al modelo generativo. Asi el modelo no depende solo de lo aprendido durante entrenamiento.

Por que importa

Es importante porque muchas aplicaciones empresariales necesitan responder sobre politicas internas, contratos, manuales, papers, tickets o documentos que cambian con frecuencia. RAG permite conectar un modelo de lenguaje con conocimiento vivo sin reentrenarlo cada vez.

Limites y riesgos

Sus limites aparecen cuando la recuperacion falla. Si el sistema trae documentos equivocados, fragmentos incompletos o informacion contradictoria, el modelo puede responder con seguridad pero sobre una base debil. La calidad de RAG depende tanto del buscador, los embeddings y el chunking como del modelo generativo.

Ejemplo practico

Un caso comun es un asistente interno que responde preguntas sobre procedimientos de una empresa. El modelo recibe la consulta, recupera fragmentos de la base documental y genera una respuesta citando o usando ese material como evidencia.

Actores clave
Meta AI Pinecone, Weaviate, Milvus