Saltar al contenido principal
INVESTIGACIÓN

ConocIA Papers

Papers de arXiv explicados en español. Ciencia de frontera, sin la barrera del idioma.

Actualizado 2 veces por semana desde arXiv
cs.AI Intermedio 4 min 15 abr. 2026

MERRIN: cuando los agentes salen a la web real y descubren que buscar bien sigue siendo difícil

MERRIN: A Benchmark for Multimodal Evidence Retrieval and Reasoning in Noisy Web Environments

MERRIN lleva a los agentes a un entorno web ruidoso y multimodal. El resultado es un baño de realidad: todavía fallan mucho más de lo que el mercado sugiere.

Autores

Han Wang, David Wan, Hyunji Lee et al.

Leer paper
cs.AI Intermedio 6 min 10 abr. 2026

HealthAdminBench: por que los agentes de IA aun fallan en la burocracia de la salud

HealthAdminBench: Evaluating Computer-Use Agents on Healthcare Administration Tasks

Stanford presenta HealthAdminBench, un benchmark para evaluar agentes de IA en tareas administrativas de salud. Aunque algunos sistemas logran buen rendimiento en subtareas, el mejor agente completo solo resolvio 36,3% de los fluj...

Autores

Suhana Bedi, Ryan Welch, Ethan Steinberg et al.

Leer paper
cs.AI Intermedio 4 min 9 mar. 2026

Agentes científicos: la próxima frontera depende tanto de buscar bien como de razonar

AI Agents, Language, Deep Learning and the Next Revolution in Science

El paper sobre agentes científicos es estratégico por una razón simple: muestra que escalar ciencia con IA exige no solo modelos mejores, sino retrieval, trazabilidad y supervisión humana.

Autores

Autores del paper sobre agentes científicos

Leer paper
cs.AI Intermedio 4 min 10 feb. 2026

ARK: por qué recuperar contexto multimodal con conocimiento sigue siendo una deuda en IA

ARK: A Benchmark for Multimodal Retrieval-Augmented Reasoning with Knowledge

ARK apunta a una debilidad menos visible: los modelos todavía tropiezan cuando deben recuperar evidencia compleja y combinarla con conocimiento especializado.

Autores

Autores del paper ARK

Leer paper