Italy🔬 Scienceil y a 18 j

L'IA battue par les humains dans un test mathématique difficile

Dans un test mathématique rigoureux, quatre modèles d'IA, dont ChatGPT 5.5 Pro, ont été évalués par rapport aux performances humaines. Aucun des modèles n'a répondu correctement aux 10 questions. Le modèle le plus performant a été développé par ETH Zurich, résolvant six des dix problèmes. Le test, faisant partie du projet indépendant First Proof, visait à évaluer les capacités d'IA dans la recherche mathématique. Les questions étaient précédemment inédites pour empêcher les modèles de s'appuyer sur des données de formation antérieures. Un groupe de 30 mathématiciens a vérifié les réponses. Seuls les modèles disponibles publiquement ont participé, ce qui a limité l'implication de OpenA.

Aller aux sources primaires (1)

Les sources officielles sur lesquelles repose la couverture. Lisez-les directement pour contourner le cadrage.

Document sourceNature

1 articles

ANSAIndépendantCentreil y a 18 j

L'IA battue par les humains dans un test mathématique difficile

Lecture du biais (Centre): L'article présente les résultats factuels d'un test de benchmarking d'IA sans favoriser ouvertement aucun côté.

Gardons l’information honnête.

ObjectiveNews est financé par ses lecteurs et sans publicité : nous vous montrons le biais au lieu de le cacher. Soutenez un journalisme indépendant pour 5 €/mois.

Devenir soutien

Sujets liés

Trois choses à surveiller au milieu de la dernière querelle d'Anthropic avec le gouvernement

27 sourcesil y a 20 h

NSW government ‘absolutely thrilled’ to welcome OpenAI ... until someone mentioned the Terminator films

1 sourceil y a 21 h

Journalist Karen Hao on Sam Altman, OpenAI & the "Quasi-Religious" Push for Artificial Intelligence

1 sourceil y a 23 h

Pourquoi Wall Street pense que le fabricant de mémoires américain Micron est la prochaine Nvidia

18 sourceshier

OpenAI: la Grèce, l'Allemagne et l'Italie sont plus menacées par l'IA

2 sourceshier

OpenAI aurait proposé de céder une participation de 5% de la société au gouvernement américain pour réduire les pressions politiques

1 sourcehier