En el proyecto First Proof, cuatro sistemas de IA fueron probados en diez problemas matemáticos de nivel de investigación. Ninguno de los modelos de IA se desempeñó tan bien como los mejores matemáticos, obteniendo solo 6 de 10 en promedio. La prueba fue diseñada para cumplir con tres criterios: usar problemas matemáticos de nivel de investigación, evitar problemas presentes en los datos de capacitación de la IA y ser clasificados formalmente por matemáticos humanos. Los resultados fueron publicados en el sitio web de First Proof el 10 de junio. Esto sigue a los avances recientes en IA, como un chatbot que resuelve un problema matemático de 80 años.
Lectura del sesgo (Centro): El artículo presenta información factual sobre una prueba de rendimiento de IA sin tomar una postura sobre las implicaciones o resultados.






