El 22 de junio de 2023, el juez Kevin Castel de la Corte Distrital del Distrito Sur de Nueva York sancionó a dos abogados con cinco mil dólares cada uno. Peter LoDuca y Steven Schwartz, del estudio Levidow, Levidow & Oberman, habían presentado un escrito con seis casos jurisprudenciales en el caso Mata v. Avianca. Los casos tenían todo lo que se espera de una cita bien construida: nombres de partes, números de expediente, extractos de sentencias, referencias a tribunales superiores. Ninguno existía. Los había generado ChatGPT, y el abogado que los usó no los verificó antes de firmar el escrito.1
Lo que hace notable a Mata v. Avianca no es que haya ocurrido, sino que era predecible. Los modelos de lenguaje no funcionan como motores de búsqueda. No consultan bases de datos en tiempo real ni tienen acceso a LexisNexis o Westlaw. Lo que hacen, con una precisión estadística extraordinaria, es predecir cuál es la siguiente palabra más probable dado el contexto. Cuando se les pide jurisprudencia, producen texto con la estructura exacta de una cita legal —partes, tribunal, año, ratio decidendi— porque esa estructura está abundantemente representada en sus datos de entrenamiento. El formato es impecable. El caso puede no existir.
Ese mecanismo produce dos tipos de error distintos. El primero es la alucinación incorrecta: el modelo describe la ley de forma directamente falsa. El segundo es más sutil y, en la práctica, más peligroso: la alucinación desvinculada, en la que la norma citada existe pero se atribuye a una fuente que no la respalda, o a un fallo que nunca fue dictado. Esta segunda variante puede pasar el primer filtro de revisión precisamente porque el marco jurídico invocado es real. Lo que no existe es la sentencia que supuestamente lo establece.
Un estudio publicado en el Journal of Empirical Legal Studies en 2025, basado en investigación de Stanford HAI, cuantificó el problema con precisión: los modelos generativos alucinan en al menos uno de cada seis casos en contextos de investigación legal.2 Más revelador aún es lo que ocurre con las herramientas diseñadas específicamente para uso jurídico: Lexis+ AI registra una tasa de alucinación del 17%; Westlaw AI-Assisted Research, del 33%. Estas plataformas integran bases de datos legales verificadas y aun así fallan en proporciones que en cualquier otro campo profesional serían inaceptables. La diferencia respecto a los modelos genéricos es real, pero no convierte a ninguna herramienta en confiable por sí sola.
Mata v. Avianca abrió una grieta que no se ha cerrado. En agosto de 2024, la jueza Alison Bachus del Distrito de Arizona sancionó a la abogada Maren Bam en el caso Mavy v. Commissioner of Social Security Administration: doce de los diecinueve casos citados en su escrito eran fabricados, engañosos o insostenibles. Le revocaron la admisión pro hac vice y le retiraron el escrito.3 En abril de 2025, en Colorado, los abogados Christopher Kachouroff y Jennifer DeMaster fueron multados con tres mil dólares cada uno por aproximadamente treinta citas defectuosas en un escrito del caso Coomer v. Lindell.4 Al momento de escribir esta columna, se contabilizan globalmente más de 1.400 casos documentados de alucinaciones de IA en procesos judiciales.5
El patrón que emerge de estos casos no es el de abogados negligentes o deshonestos. Es el de profesionales que confiaron en una herramienta sin entender sus límites fundamentales. La IA genera texto con una seguridad que no admite matices: no dice "podría ser" ni "verifique esta referencia". Afirma. Y esa confianza aparente —esa ausencia de señales de duda— es exactamente lo que hace peligroso usarla en contextos donde la verificación no es opcional.
Chile no tiene casos públicamente documentados de sanciones por este motivo. Todavía. Pero los abogados chilenos usan ChatGPT y Claude, como los usan en cualquier otro país. Y el sistema judicial chileno no tiene ninguna propiedad especial que lo proteja de este tipo de error. Lo que sí tiene Chile es un proceso legislativo en curso: el proyecto de ley que regula los sistemas de inteligencia artificial fue aprobado por la Cámara de Diputados el 13 de octubre de 2025 y enviado al Senado.6 El proyecto clasifica los sistemas de IA aplicados en contextos judiciales como alto riesgo, con exigencias de documentación, supervisión humana y evaluación previa. Es un avance real. Pero regula a quienes desarrollan y despliegan los sistemas, no al abogado que usa ChatGPT en su computador para preparar un escrito. Esa brecha no la cierra ninguna ley por sí sola.
La discusión sobre IA en el derecho tiende a polarizarse entre quienes ven en estas herramientas una amenaza a la profesión y quienes las abrazan sin reservas como una ganancia neta de productividad. Ambas posiciones pasan por alto algo más preciso: la IA es extraordinariamente útil para tareas donde el margen de error tiene consecuencias manejables —resumir contratos extensos, identificar cláusulas relevantes, organizar expedientes, redactar borradores iniciales— y profundamente inadecuada para tareas donde ese margen es cero. Citar jurisprudencia ante un tribunal es una de esas tareas. Un caso inventado no es un dato impreciso en un resumen interno: es un argumento que no existe, presentado bajo firma profesional, ante un juez que tomará decisiones con consecuencias reales para un cliente real.
La responsabilidad profesional no se delega al modelo. El abogado firma el escrito. Cuando el caso citado no existe, la sanción recae sobre quien lo presentó. Eso no cambia con ninguna actualización de ChatGPT ni con ninguna herramienta especializada, por más sofisticada que sea. Lo que cambia es la probabilidad del error, no la titularidad de la responsabilidad.
La inteligencia artificial va a transformar el ejercicio legal. Eso ya está ocurriendo y en muchos aspectos es bienvenido. Pero la velocidad de adopción no puede superar la capacidad de verificación. En el derecho, más que en casi cualquier otro campo, la distancia entre lo que parece verdad y lo que es verdad tiene consecuencias que no se deshacen con una corrección posterior. Mientras los modelos de lenguaje no puedan distinguir entre generar texto plausible y decir la verdad —y hoy no pueden— esa distinción es la que el abogado tiene que seguir haciendo. No como un límite de la tecnología que eventualmente se resolverá, sino como una condición estructural del trabajo profesional que no desaparece porque la herramienta sea más convincente.
Fuentes
- Mata v. Avianca, Inc., No. 22-cv-1461 (S.D.N.Y. jun. 22, 2023). Orden de sanción disponible en Justia. Ver también Wikipedia: Mata v. Avianca.
- Magesh, A. et al. (2024). "Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools". Journal of Empirical Legal Studies, 2025. Resumen en Stanford HAI. Artículo completo en Wiley Online Library.
- Mavy v. Commissioner of Social Security Administration, No. 2:24-cv-03617 (D. Ariz. ago. 2024). Orden disponible en Justia.
- Coomer v. Lindell (D. Colo. abr. 2025). Cobertura en National Law Review.
- Registro actualizado de casos documentados en damiencharlotin.com/hallucinations.
- Proyecto de ley Boletín 16821-19, aprobado por la Cámara de Diputados el 13 de octubre de 2025. Cobertura en BioBioChile.
Comentarios
Deja tu comentario
No hay comentarios aprobados todavía. ¡Sé el primero en comentar!