如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 作者:admin
- 发表时间:2025-06-19 03:35:09
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
最新文章
-
别再被苏宁破产的***象骗了_重整_张近东_公司
-
被两线夹击的中国光伏:印度8年狂翻扩产17倍,日本另起炉灶抢下一代定义权_产能_组件_设备
-
全球首台阔比例大折叠手机来了!华为Pura X2定档4月发布:提前苹果半年_尺寸_影像_核心
-
人类如何奔向月球?《张朝阳的物理课》手推阿尔忒弥斯2号自由返回轨道_航天器_地球_引力场
-
说句实话,我挺关心Kimi接下来要走的路_模型_行业_产品
-
电厂 | 快手就靠可灵了?_业务_商业化_调整
-
追觅科技CEO俞浩连发多文称:苹果成了不创新的公司,追觅员工已有千个创意在验证,要打败苹果超越苹果_手机_天下
-
APEC 商旅更便利 到印尼可扫银联和支付宝
-
深扒GPT Image 2:疑似“吞”下了GPT-4o,OpenAI没把它当“生图”模型训练_token_文字_图像
-
特朗普家族,开始卖Token了_加密_模型_货币