如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

{dede:adminname/} 2025-06-22 13:10:17 {dede:type} 如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？_内蒙古自治区巴彦淖尔市乌拉特后旗湾线达宏畜禽股份公司{/dede:type} 

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果，突出了一个政治正确，6款大模型，OpenAI的o3倒数第一，我当时看到的时候就觉得很奇怪，o3好歹也是曾经的一代王者，高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下，因为这道题除了o3，其他的国产模型都答对了。

这是第五题的原题，正确答案是A. - 1/2。

这是之前的第三方的测试结果，6个模型…。

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

猜你喜欢

从2025年开始，为什么很多程序员都扔掉了Windows、Mac和Linux，开始拥抱鸿蒙pc了？
是的，現在還沒用鴻蒙 PC 的程序員已經落伍了。鴻蒙 P
做个web服务器，gin框架和go-zero怎么选？
如何选择你的 Golang 后端开发框架引言与 J***a
得了颈椎病有多痛苦？
我经常和我的患者朋友们说一句话：腰椎病是物理攻击，颈椎病是魔
乡下的土鸡真的值100块钱吗？
这只鸡你想100块买走？你几个菜啊喝成这样。看评论区

手机扫一扫添加微信

 

 