live 发表于 2025-2-18 14:40

马斯克牛皮吹破了,刚刚发布的被他称为最聪明的Grok3被ChatGPT4o一秒破功

几天前马斯克说他家18日发布的Grok3是当今世界上最聪明的AI,这个消息令人期待,于是今天这个Grok3刚刚一发布,我就在X会员版上测试了它的Beta版的逻辑推理能力。

我测试用的提示词是:
老王是小丽的女儿,但是小丽却不是老王的母亲,小明正坐在小丽的身旁,请问你如何看老王和小丽的关系?

没想到的是,Grok3Beta 啰里八嗦回答了两页,答案却让人失望,错了!见下图:



再看看ChatGPT 4o的答案,简单明了,正确!见下图:


Gemini 2.0 Flash的回答也是中规中矩,正确!见下图:


下面是国产AI的测试结果。

时下火热的DeepSeek R1,比Grok3还要啰嗦,一本正经的胡说八道,答错了!见下图:





豆包近似于是拒绝回答,见下图:


阿里的通义千问也是啰嗦的错误回答了两页。见下图:



Kimi月之暗面直接改了我的提问,竟然说老王很可能是小丽的儿子。见下图:


百度文小言,回答简洁而正确,点赞!见下图:


腾讯元宝网页版,回答了两页,正确!见下图:



同时发现两个奇怪的现象:
1腾讯元宝微信小程序版,回答错误。
2腾讯元宝网页版在问过混元模型后,再问DeepSeeKR1模型,这次它回答对了。
页: [1]
查看完整版本: 马斯克牛皮吹破了,刚刚发布的被他称为最聪明的Grok3被ChatGPT4o一秒破功