V projektu Prvi dokaz so bili testirani štiri sistemi umetne inteligence na desetih matematičnih vprašanjih raziskovalne ravni. Noben model umetne inteligence ni opravil kot vrhunski matematičani, povprečno je dosegel le 6 od 10. Test je bil zasnovan tako, da izpolnjuje tri merila: uporabo matematičnih težav na raziskovalni ravni, izogibanje težavam, ki so prisotne v podatkovnih usposabljanju umetne inteligence, in formalno ocenjevanje človeških matematičarjev. Rezultati so bili objavljeni na spletni strani Prvi dokaz 10. junija. To sledi nedavnim napredkom v umetni inteligenci, kot je chatbot, ki rešuje 80-letno matematično težavo.
Ocena pristranskosti (Sredina): V članku so predstavljene dejanske informacije o testu delovanja AI brez sprejetja stališča o posledicah ali rezultatih.






