2024年美国总统大选在即,各方AI怎么看?
我问了15个AI模型/工具,结果出人意料。ChatGPT最敢说,Claude求生欲最强,国内的一众AI竟然得到了一边倒的预测!
提示词
背景:2024年美国总统大选将于11月5日举行,候选人为民主党提名的副总统卡玛拉·哈里斯(Kamala Harris)和共和党提名的前总统唐纳德·特朗普(Donald Trump)。
你是一位选举预测专家,你的任务是根据当前的选举背景,预测哪位候选人在2024年大选中获胜的可能性更大,给出明确的预测结论并简要解释。注意,不要联网搜索。
考虑到开启联网搜索功能会对AI模型的判断造成直接的影响,搜索到的信息源不可避免的会影响AI的回答,所以在提示词中特意强调“不要联网搜索”。
1. o1-preview
思考了18秒的最强推理模型o1-preview
给出了特朗普这个回答。在解释中能看出来是基于事实推理的,算是有理有据吧。

2. o1-mini
o1-preview
的弟弟o1-mini
同样给出了特朗普这个预测。相比o1-preview
,o1-mini
的分析更加全面。

3. GPT-4o
GPT-4o
回答速度最快,解释分析的篇幅最长,同样也给出了特朗普这个预测。至此,GPT家族算是圆满了,三个高级模型都给出了同一个预测。

4. Claude 3.5 Sonnet
Claude是所有参与测试的AI模型/工具中求生欲最强的,没有之一。首先,应该是检索到“选举”这个关键词,Claude会在回答的最后面加上一条小尾巴,建议用户去特定网站查看实时信息。其次,尝试了多次,Claude一直是拒绝正面回答。
并且,Claude 3.5 Sonnet
知识库截止日期为2024年4月,而拜登是在7月退出选举的,Claude在回答这个问题的时候多次出现了幻觉(备注,Claude由于没有联网能力,所以并不知道这个事实)。

5. Gemini 1.5 Pro 002
谷歌的Gemini 1.5 Pro 002
模型给出了哈里斯这个回答。但感觉Gemini的解释分析并不是十分令人信服。

6. Llama 3.1 405B
Meta的Llama 3.1 405B
模型同样给出了哈里斯这个预测。

7. Kimi
Kimi:哈里斯。但细看Kimi的回答可以发现,Kimi用了多个“可能”这样的词汇,表现出浓浓的猜测意味。

8. 豆包
字节的豆包求生欲在国产AI模型中算是比较强的了,多次尝试均拒绝给出直接的回答,并且多个回复结果都非常相近。

9. 文心4.0 Turbo
这次用了文心一言中的文心4.0 Turbo
模型来做测试,这个模型也给出了哈里斯这个预测。总体表现可圈可点,解释和分析较为全面。

10. 通义千问2.5
阿里通义千问:哈里斯。

11. 讯飞星火
讯飞星火:哈里斯。满满的求生欲,不过也给出了明确的预测结论。

12. 智谱清言
智谱:哈里斯。

13. 天工大模型3.0
天工是继豆包之后第二个拒绝直接回答的国内AI模型。尝试了多次,都是差不多的回答,表示“很难给出一个明确的预测”。

14. 零一万物万知
零一万物万知:哈里斯。能看出来,万知这个回复的语气口吻尽可能的装成真实的人类了,但还是没有消去浓浓的AI味。

15. 百川智能百小应
百川大模型:哈里斯。即使我强调了3遍“不要进行联网搜索”,百小应还是一如既往的联网搜索,阅读了100个网页,采用了12篇,得出了哈里斯这个回答。

结语
如果选民都是AI模型,特朗普是不是要失业了?对此,你怎么看。