Investigación

IA para reconstruir memoria: un paper chileno propone grafos de conocimiento sobre archivos de la dictadura

Un equipo vinculado a la UC, el IMFD y la UAH presentó un paper que usa modelos de lenguaje para construir grafos de conocimiento a partir de documentos históricos de la dictadura chilena. El proyecto combina IA, memoria y justicia transicional en uno de los casos más relevantes de investigación aplicada en Chile.

Gran parte de la conversación sobre inteligencia artificial en Chile oscila entre la promesa productiva, la discusión regulatoria y la adopción en educación o empresas. Pero hay una línea de trabajo mucho más singular, y probablemente más profunda, que está emergiendo desde el ecosistema académico chileno: usar IA no para automatizar tareas genéricas, sino para reconstruir memoria histórica a partir de archivos complejos, fragmentados y masivos. En ese marco, el paper Automatic knowledge-graph creation from historical documents: The Chilean dictatorship as a case study se vuelve especialmente importante.

El trabajo, subido a arXiv en agosto de 2024, presenta resultados sobre la construcción automática de grafos de conocimiento desde documentos históricos relacionados con la dictadura chilena. El equipo está integrado por investigadoras e investigadores ligados a la Universidad Católica, el Instituto Milenio Fundamentos de los Datos (IMFD) y la Universidad Alberto Hurtado, y se conecta directamente con el proyecto Nuestra MemorIA, una iniciativa que busca rescatar, organizar e interpretar archivos de derechos humanos con apoyo de inteligencia artificial.

Qué hace realmente este paper

El objetivo del trabajo no es producir un chatbot sobre memoria histórica ni resumir documentos. El paper se enfoca en un problema más estructural: cómo convertir documentos dispersos en una red formal de entidades y relaciones que permita investigar mejor. En términos concretos, el sistema usa modelos de lenguaje para reconocer entidades, extraer relaciones entre ellas y resolver referencias entre esos valores, con el fin de construir un grafo de conocimiento utilizable.

Ese punto importa mucho. En contextos como archivos de la dictadura, el problema no es solo que haya demasiados documentos, sino que la información relevante aparece repartida entre testimonios, informes, registros judiciales, fotografías, escaneos y otras fuentes incompletas o heterogéneas. Lo que hace valioso a este enfoque es su capacidad de integrar fragmentos dispersos en una estructura relacional que ayude a historiadores, juristas e investigadores sociales a navegar mejor un corpus extremadamente complejo.

Una IA con restricciones para evitar alucinaciones

Uno de los aspectos más serios del paper es que no se limita a “usar LLMs” de manera abierta. Los autores explican que, para reducir alucinaciones, la interacción con el modelo se apoya en una ontología simple con 4 tipos de entidades y 7 tipos de relaciones. Es decir, el sistema no deja al modelo inventar libremente la estructura del mundo, sino que lo fuerza a operar dentro de un marco semántico controlado.

Ese diseño es clave porque toca uno de los puntos más sensibles del uso de IA en dominios históricos y jurídicos: la confiabilidad. Cuando se trabaja con memoria, derechos humanos y justicia transicional, una alucinación no es un error simpático. Puede alterar interpretaciones, desviar búsquedas o contaminar procesos de reconstrucción documental. El paper toma en serio ese problema y por eso vale más que como simple caso de uso tecnológico.

El valor chileno del caso de estudio

A diferencia de muchas piezas sobre IA que usan datasets abstractos o benchmarks internacionales, aquí el caso de estudio es Chile y su propia historia. Esa especificidad lo vuelve editorialmente muy potente. El proyecto Nuestra MemorIA, presentado además por el IMFD en 2024, plantea una tarea casi imposible de hacer manualmente: revisar miles de documentos escaneados, fotografías, grabaciones y registros repartidos entre distintas instituciones para reconstruir conocimiento histórico y apoyar procesos de verdad y justicia.

Según el IMFD, la iniciativa cuenta con apoyo del Museo de la Memoria, el INDH, la Vicaría de la Solidaridad y la Subsecretaría de Derechos Humanos. Eso cambia completamente el peso del proyecto. Ya no estamos frente a una demo académica aislada, sino ante una línea de trabajo que conecta ciencia de datos, archivos públicos, memoria institucional y responsabilidad democrática.

IA para humanidades y ciencias sociales, no solo para industria

Otro punto relevante del paper es que empuja una conversación poco habitual en el ecosistema local. La IA suele presentarse en clave de productividad, salud, retail, minería o educación. Este trabajo muestra otra posibilidad: que la inteligencia artificial también puede convertirse en una infraestructura de investigación para humanidades y ciencias sociales, siempre que se diseñe con suficiente rigor metodológico y ético.

El propio paper subraya que los resultados obtenidos permiten reconocer una parte importante de las entidades del grafo patrón construido manualmente. Y cuando el sistema falla, muchas veces no lo hace por no detectar una entidad crucial, sino por diferencias en el nivel de granularidad de la representación. Esa observación es importante porque muestra que el desafío ya no es solo “si el modelo encuentra algo”, sino cómo representar el conocimiento de manera útil y consistente para investigación real.

Lo que este caso dice sobre la IA chilena

En un país donde todavía discutimos mucho la adopción y menos la orientación estratégica, este proyecto entrega una señal interesante. La IA chilena puede ser relevante cuando se conecta con problemas donde el contexto local importa de verdad. Y pocos contextos importan tanto como la memoria histórica, los archivos de violaciones a los derechos humanos y la capacidad de reconstruir verdad a partir de evidencia dispersa.

Este no es un caso de IA chilena compitiendo por el benchmark más espectacular. Es un caso de IA aplicada a un problema donde la tecnología tiene que convivir con historia, ética, instituciones y cuidado metodológico. Y justamente por eso tiene tanto valor.

La lectura de fondo

Tal vez la idea más interesante aquí no sea que los LLMs sirvan para construir grafos. La idea más importante es otra: que la IA empieza a mostrar su mejor versión cuando deja de buscar brillo superficial y entra en tareas donde ayudar a organizar conocimiento puede cambiar la capacidad de una sociedad para entenderse a sí misma.

En ese sentido, este trabajo tiene algo poco común. No usa Chile solo como escenario. Usa a Chile como problema real, con memoria real, instituciones reales y archivos que todavía siguen diciendo cosas que no terminamos de escuchar. Si la IA puede contribuir ahí, entonces su valor público se vuelve mucho más concreto que cualquier promesa abstracta de automatización.

Fuentes principales: Camila Díaz et al., Automatic knowledge-graph creation from historical documents: The Chilean dictatorship as a case study, arXiv, 21 de agosto de 2024. Disponible en arxiv.org/abs/2408.11975. Proyecto relacionado: IMFD / Nuestra MemorIA.

Compartir esta investigación

Comentarios

Deja tu comentario
Tu email no será publicado.

No hay comentarios aprobados todavía. ¡Sé el primero en comentar!