MACHINE LEARNING

Embeddings

4 min de lectura 0 lecturas 26 abr. 2026

Un embedding es una representacion numerica que captura relaciones semanticas entre textos, imagenes, productos, usuarios u otros objetos.

Que es Embeddings

Un embedding transforma un objeto en una lista de numeros. Ese objeto puede ser una palabra, una frase, un documento, una imagen, un producto o incluso un usuario. La gracia es que objetos con significado parecido quedan cerca dentro de un espacio vectorial.

Por que importa

Esto permite hacer busqueda semantica. En vez de buscar solo palabras exactas, el sistema puede encontrar contenido por significado. Si alguien pregunta por "costos de entrenamiento de modelos", puede recuperar documentos sobre computo, eficiencia o infraestructura aunque no usen exactamente esas palabras.

Limites y riesgos

El riesgo es olvidar que los embeddings no entienden en sentido humano. Capturan patrones estadisticos y relaciones aprendidas. Pueden arrastrar sesgos, mezclar conceptos cercanos pero no equivalentes o degradarse si el dominio es muy especifico y el modelo no fue ajustado para el contexto.

Ejemplo practico

En una aplicacion RAG, cada documento se divide en fragmentos, se convierte en embeddings y se guarda en una base vectorial. Cuando llega una pregunta, tambien se convierte en embedding y se buscan los fragmentos mas cercanos.

Actores clave
Google OpenAI