Abril de 2026
Los benchmarks más interesantes del momento apuntan en la misma dirección: la IA todavía necesita recuperar mejor evidencia antes de poder razonar con consistencia.
- MERRIN refuerza los límites reales de los agentes en web abierta
- ARK expone la deuda entre retrieval multimodal y conocimiento
- La ciencia con agentes necesita trazabilidad además de modelos fuertes