V strogem matematičnem testu so bili ocenjeni štiri modeli AI, vključno z ChatGPT 5.5 Pro, glede na človeško učinkovitost. Nihče od modelov ni pravilno odgovoril na vse 10 vprašanj. Najboljši model je razvil ETH Zurich, ki je rešil šest od deset problemov.
Ocena pristranskosti (Sredina): V članku so predstavljeni dejanski rezultati AI-ovih primerjalnih testov, ne da bi javno podprli katero koli stran.





