Nel progetto First Proof, quattro sistemi di IA sono stati testati su dieci problemi di matematica di livello di ricerca. Nessuno dei modelli di AI ha eseguito bene come i migliori matematici, ottenendo solo 6 punteggi su 10 in media. Il test è stato progettato per soddisfare tre criteri: utilizzare problemi di matematica di livello di ricerca, evitare problemi presenti nei dati di formazione dell'AI e essere formalmente classificati dai matematici umani. I risultati sono stati pubblicati sul sito web First Proof il 10 giugno. Questo segue i recenti progressi nell'IA, come un chatbot che risolve un problema di matematica di 80 anni.
Lettura del bias (Centro): L'articolo presenta informazioni factuali su un test di prestazioni di IA senza prendere posizione sulle implicazioni o sui risultati.






