马斯克牛皮吹破了,刚刚发布的被他称为最聪明的Grok3被ChatGPT4o一秒破功
几天前马斯克说他家18日发布的Grok3是当今世界上最聪明的AI,这个消息令人期待,于是今天这个Grok3刚刚一发布,我就在X会员版上测试了它的Beta版的逻辑推理能力。我测试用的提示词是:
老王是小丽的女儿,但是小丽却不是老王的母亲,小明正坐在小丽的身旁,请问你如何看老王和小丽的关系?
没想到的是,Grok3Beta 啰里八嗦回答了两页,答案却让人失望,错了!见下图:
再看看ChatGPT 4o的答案,简单明了,正确!见下图:
Gemini 2.0 Flash的回答也是中规中矩,正确!见下图:
下面是国产AI的测试结果。
时下火热的DeepSeek R1,比Grok3还要啰嗦,一本正经的胡说八道,答错了!见下图:
豆包近似于是拒绝回答,见下图:
阿里的通义千问也是啰嗦的错误回答了两页。见下图:
Kimi月之暗面直接改了我的提问,竟然说老王很可能是小丽的儿子。见下图:
百度文小言,回答简洁而正确,点赞!见下图:
腾讯元宝网页版,回答了两页,正确!见下图:
同时发现两个奇怪的现象:
1腾讯元宝微信小程序版,回答错误。
2腾讯元宝网页版在问过混元模型后,再问DeepSeeKR1模型,这次它回答对了。
页:
[1]