Dans le projet First Proof, quatre systèmes d'IA ont été testés sur dix problèmes de mathématiques de niveau de recherche. Aucun des modèles d'IA n'a bien fonctionné que les meilleurs mathématiciens, n'obtenant en moyenne que 6 sur 10. Le test a été conçu pour répondre à trois critères: utiliser des problèmes de mathématiques de niveau de recherche, éviter les problèmes présents dans les données de formation de l'IA et être officiellement classés par des mathématiciens humains. Les résultats ont été publiés sur le site Web de First Proof le 10 juin.
Lecture du biais (Centre): L'article présente des informations factuelles sur un test de performance d'IA sans prendre de position sur les implications ou les résultats. Il rapporte les résultats de manière objective, mentionnant à la fois les limites de l'IA et les progrès récents sans langage biaisé ou accent.






