ON
← Retour au fil
L'IA battue par les humains dans un test mathématique difficile
Italy🔬 Scienceil y a 18 j

L'IA battue par les humains dans un test mathématique difficile

Dans un test mathématique rigoureux, quatre modèles d'IA, dont ChatGPT 5.5 Pro, ont été évalués par rapport aux performances humaines. Aucun des modèles n'a répondu correctement aux 10 questions. Le modèle le plus performant a été développé par ETH Zurich, résolvant six des dix problèmes. Le test, faisant partie du projet indépendant First Proof, visait à évaluer les capacités d'IA dans la recherche mathématique. Les questions étaient précédemment inédites pour empêcher les modèles de s'appuyer sur des données de formation antérieures. Un groupe de 30 mathématiciens a vérifié les réponses. Seuls les modèles disponibles publiquement ont participé, ce qui a limité l'implication de OpenA.

Aller aux sources primaires (1)

Les sources officielles sur lesquelles repose la couverture. Lisez-les directement pour contourner le cadrage.

1 articles

ANSA logoANSAIndépendantCentreil y a 18 j
L'IA battue par les humains dans un test mathématique difficile

Dans un test mathématique rigoureux, quatre modèles d'IA, dont ChatGPT 5.5 Pro, ont été évalués par rapport aux performances humaines. Aucun des modèles n'a répondu correctement aux 10 questions. Le modèle le plus performant a été développé par ETH Zurich, résolvant six des dix problèmes. Le test, faisant partie du projet indépendant First Proof, visait à évaluer les capacités d'IA dans la recherche mathématique. Les questions étaient précédemment inédites pour empêcher les modèles de s'appuyer sur des données de formation antérieures. Un groupe de 30 mathématiciens a vérifié les réponses. Seuls les modèles disponibles publiquement ont participé, ce qui a limité l'implication de OpenA.

Lecture du biais (Centre): L'article présente les résultats factuels d'un test de benchmarking d'IA sans favoriser ouvertement aucun côté.

Gardons l’information honnête.

ObjectiveNews est financé par ses lecteurs et sans publicité : nous vous montrons le biais au lieu de le cacher. Soutenez un journalisme indépendant pour 5 €/mois.

Devenir soutien

Sujets liés