Las IA siguen siendo muy pobres en los problemas matemáticos más complejos

Foto del autor

By Rita Ora

yointeligencia artificiala pesar de los extraordinarios avances en diversos campos, muestra importantes lagunas en la resolución de problemas matemáticos avanzados. Según un informe del equipo de investigación Época IAlos principales sistemas de IA resuelven menos del 2% de los problemas planteados por el nuevo punto de referencia FrontierMath. Esta prueba contiene cientos de preguntas de nivel académico, desarrolladas con la contribución de más de 60 matemáticos de alto perfil, incluidos los ganadores de la medalla Fields, Terence Tao y Timothy Gowers.

Si bien modelos como GPT-4 y Gemini 1.5 Pro logran una precisión del 90% en pruebas de matemáticas tradicionales, tienen grandes dificultades con los problemas de FrontierMath, que cubren disciplinas complejas como la teoría computacional de números y la geometría algebraica.

Problemas diseñados para desafiar incluso a los expertos

Terence Tao describió los problemas de FronteraMatemáticas como “extremadamente desafiante” y requiere una combinación de habilidades avanzadas, herramientas matemáticas y soporte tecnológico para resolverlo. Las soluciones se hacen intencionalmente “a prueba de azar”, con enormes respuestas numéricas u objetos matemáticos altamente complejos. Esto evita enfoques intuitivos o superficiales, enfatizando la necesidad de un razonamiento profundo y riguroso.

Límites y potencial futuro

Si bien estos hallazgos resaltan las limitaciones actuales de la IA en matemáticas avanzadas, también representan una oportunidad para mejorar las capacidades de razonamiento algorítmico. FrontierMath y otros puntos de referencia conceptualmente similares pronto podrían convertirse en un valioso banco de pruebas para desarrollar sistemas más avanzados, con implicaciones en cascada extremadamente positivas para el mundo de la investigación científica.