Italy🔬 Cienciahace 18 d

La IA es derrotada por los humanos en una difícil prueba de matemáticas.

En una prueba matemática rigurosa, cuatro modelos de IA, incluido ChatGPT 5.5 Pro, fueron evaluados en relación con el rendimiento humano. Ninguno de los modelos respondió correctamente a las 10 preguntas. El modelo de mejor rendimiento fue desarrollado por ETH Zurich, resolviendo seis de cada diez problemas. La prueba, parte del proyecto independiente First Proof, tenía como objetivo evaluar las capacidades de IA en la investigación matemática. Las preguntas no se publicaron previamente para evitar que los modelos se basaran en datos de capacitación previa. Un grupo de 30 matemáticos verificaron las respuestas.

Ir a las fuentes primarias (1)

Las fuentes oficiales en las que se basa la cobertura. Léelas directamente para evitar el encuadre.

Documento fuenteNature

1 informaciones

ANSAIndependienteCentrohace 18 d

La IA es derrotada por los humanos en una difícil prueba de matemáticas.

Lectura del sesgo (Centro): El artículo presenta los resultados de hecho de una prueba de benchmarking de IA sin favorecer abiertamente a ningún lado.

Mantengamos las noticias honestas.

ObjectiveNews se financia con los lectores y no tiene anuncios: te mostramos el sesgo en lugar de ocultarlo. Apoya el periodismo independiente por 5 €/mes.

Hazte suscriptor

Historias relacionadas

Tres cosas a tener en cuenta en medio de la última disputa de Anthropic con el gobierno

27 fuenteshace 18 h

NSW government ‘absolutely thrilled’ to welcome OpenAI ... until someone mentioned the Terminator films

1 fuentehace 19 h

Journalist Karen Hao on Sam Altman, OpenAI & the "Quasi-Religious" Push for Artificial Intelligence

1 fuentehace 22 h

¿Por qué Wall Street piensa que el fabricante de memorias de EE.UU. Micron es el próximo Nvidia

18 fuenteshace 22 h

OpenAI: Grecia, Alemania e Italia están en mayor riesgo por la inteligencia artificial

2 fuentesayer

OpenAI habría propuesto ceder un 5% de la compañía al gobierno de los Estados Unidos para reducir las presiones políticas

1 fuenteayer