Italy🔬 Wissenschaftvor 18 Tagen

KI, die von Menschen in einem schwierigen Mathematik-Test besiegt wurde

In einem strengen mathematischen Test wurden vier KI-Modelle, darunter ChatGPT 5.5 Pro, gegen menschliche Leistung bewertet. Keines der Modelle beantwortete alle 10 Fragen korrekt. Das am besten leistende Modell wurde von der ETH Zürich entwickelt, um sechs von zehn Problemen zu lösen. Der Test, Teil des unabhängigen Projekts First Proof, zielte darauf ab, KI-Fähigkeiten in der mathematischen Forschung zu beurteilen. Fragen wurden zuvor unveröffentlicht, um zu verhindern, dass Modelle auf vorherige Trainingsdaten angewiesen sind. Eine Gruppe von 30 Mathematikern überprüfte die Antworten.

Wie jede Seite berichtete

Dasselbe Ereignis, gruppiert nach der politischen Ausrichtung der berichtenden Medien.

Wie jede Seite berichtete

Unterstütze unabhängige, biasbewusste Nachrichten und schalte den Social-Puls, das Community-Voting und deinen persönlichen Für-dich-Feed frei.

Unterstützer werden

Zu den Primärquellen (1)

Die offiziellen Quellen, auf denen die Berichterstattung beruht. Lies sie direkt, um Framing zu umgehen.

QuelldokumentNature

1 Berichte

ANSAUnabhängigMittevor 18 Tagen

KI, die von Menschen in einem schwierigen Mathematik-Test besiegt wurde

Tendenz-Einschätzung (Mitte): Der Artikel stellt die tatsächlichen Ergebnisse eines AI-Benchmarking-Tests vor, ohne offen jede Seite zu begünstigen.

Halte die Nachrichten ehrlich.

ObjectiveNews ist leserfinanziert und werbefrei – wir zeigen dir den Bias, statt ihn zu verstecken. Unterstütze unabhängigen Journalismus für 5 €/Monat.

Unterstützer werden

Ähnliche Themen

Drei Dinge, auf die man bei Anthropics jüngster Fehde mit der Regierung achten sollte

27 Quellenvor 22 Std.

NSW government ‘absolutely thrilled’ to welcome OpenAI ... until someone mentioned the Terminator films

1 Quellevor 22 Std.

Journalist Karen Hao on Sam Altman, OpenAI & the "Quasi-Religious" Push for Artificial Intelligence

1 Quellegestern

Warum Wall Street denkt, dass der US-amerikanische Speicherhersteller Micron die nächste Nvidia ist

18 Quellengestern

OpenAI: Griechenland, Deutschland und Italien sind am stärksten von künstlicher Intelligenz bedroht

2 Quellengestern

OpenAI hat angeblich vorgeschlagen, 5 Prozent des Unternehmens an die US-Regierung abzugeben, um den politischen Druck zu reduzieren.

1 Quellegestern

KI, die von Menschen in einem schwierigen Mathematik-Test besiegt wurde

Wie jede Seite berichtete

links

Mitte

rechts

Wie jede Seite berichtete

Zu den Primärquellen (1)

1 Berichte

Halte die Nachrichten ehrlich.

Ähnliche Themen

Drei Dinge, auf die man bei Anthropics jüngster Fehde mit der Regierung achten sollte

NSW government ‘absolutely thrilled’ to welcome OpenAI ... until someone mentioned the Terminator films

Journalist Karen Hao on Sam Altman, OpenAI & the "Quasi-Religious" Push for Artificial Intelligence

Warum Wall Street denkt, dass der US-amerikanische Speicherhersteller Micron die nächste Nvidia ist

OpenAI: Griechenland, Deutschland und Italien sind am stärksten von künstlicher Intelligenz bedroht

OpenAI hat angeblich vorgeschlagen, 5 Prozent des Unternehmens an die US-Regierung abzugeben, um den politischen Druck zu reduzieren.