马斯克牛皮吹破了，刚刚发布的被他称为最聪明的Grok3被ChatGPT4o一秒破功

live · 发表于 2025-2-18 14:40

几天前马斯克说他家18日发布的Grok3是当今世界上最聪明的AI，这个消息令人期待，于是今天这个Grok3刚刚一发布，我就在X会员版上测试了它的Beta版的逻辑推理能力。

我测试用的提示词是：
老王是小丽的女儿，但是小丽却不是老王的母亲，小明正坐在小丽的身旁，请问你如何看老王和小丽的关系？

没想到的是，Grok3Beta 啰里八嗦回答了两页，答案却让人失望，错了！见下图：

再看看ChatGPT 4o的答案，简单明了，正确！见下图：

Gemini 2.0 Flash的回答也是中规中矩，正确！见下图：

下面是国产AI的测试结果。

时下火热的DeepSeek R1，比Grok3还要啰嗦，一本正经的胡说八道，答错了！见下图：

豆包近似于是拒绝回答，见下图：

阿里的通义千问也是啰嗦的错误回答了两页。见下图：

Kimi月之暗面直接改了我的提问，竟然说老王很可能是小丽的儿子。见下图：

百度文小言，回答简洁而正确，点赞！见下图：

腾讯元宝网页版，回答了两页，正确！见下图：

同时发现两个奇怪的现象：
1 腾讯元宝微信小程序版，回答错误。
2 腾讯元宝网页版在问过混元模型后，再问DeepSeeKR1模型，这次它回答对了。

账号		自动登录	找回密码
密码			注册

萍聚头条

马斯克牛皮吹破了，刚刚发布的被他称为最聪明的Grok3被ChatGPT4o一秒破功

本帖子中包含更多资源