萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 416|回复: 0

马斯克牛皮吹破了,刚刚发布的被他称为最聪明的Grok3被ChatGPT4o一秒破功

[复制链接]
发表于 2025-2-18 14:40 | 显示全部楼层 |阅读模式
几天前马斯克说他家18日发布的Grok3是当今世界上最聪明的AI,这个消息令人期待,于是今天这个Grok3刚刚一发布,我就在X会员版上测试了它的Beta版的逻辑推理能力。

我测试用的提示词是:
老王是小丽的女儿,但是小丽却不是老王的母亲,小明正坐在小丽的身旁,请问你如何看老王和小丽的关系?

没想到的是,Grok3Beta 啰里八嗦回答了两页,答案却让人失望,错了!见下图:



再看看ChatGPT 4o的答案,简单明了,正确!见下图:


Gemini 2.0 Flash的回答也是中规中矩,正确!见下图:


下面是国产AI的测试结果。

时下火热的DeepSeek R1,比Grok3还要啰嗦,一本正经的胡说八道,答错了!见下图:





豆包近似于是拒绝回答,见下图:


阿里的通义千问也是啰嗦的错误回答了两页。见下图:



Kimi月之暗面直接改了我的提问,竟然说老王很可能是小丽的儿子。见下图:


百度文小言,回答简洁而正确,点赞!见下图:


腾讯元宝网页版,回答了两页,正确!见下图:



同时发现两个奇怪的现象:
1  腾讯元宝微信小程序版,回答错误。
2  腾讯元宝网页版在问过混元模型后,再问DeepSeeKR1模型,这次它回答对了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-3-11 18:52 , Processed in 0.055089 second(s), 16 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表