kimi又放大招,国内第一个具备推理思考大模型

今天打开kimi,发现有点变化。发现多了个探索版。输入 / 就可以打开。

Kimi 又在玩啥新玩意?

kimi又放大招,国内第一个具备推理思考大模型

我以为是之前kimi智能助手改版了,输入@后发现并不是改版,确实  探索版是个新功能了

kimi又放大招,国内第一个具备推理思考大模型

输入 / 提示enter进入kimi探索版

kimi又放大招,国内第一个具备推理思考大模型

进来后,发现还真是新功能,而且还在内测中。估计是我被灰度到了。但是每天只有5次的使用次数。

kimi又放大招,国内第一个具备推理思考大模型

根据上面的描述,kimi会拆解复杂问题,能更深入的探索。嗯,这让我想到了什么,Kimi难道在对标openAI的o1么?

openAI o1

OpenAI 的 o1 模型是针对复杂推理问题而设计的大模型,也被称为“草莓模型”。它能够进行更长时间的“思考”,并且随着思考时间的增加,推理质量也得到提高。o1 模型采用了基于强化学习的内化思维链学习,通过思维链式的问题拆解,模型可以不断验证和纠错

上面的介绍可以看出o1模型具备推理能力。那kimi探索版究竟如何,正好有5次使用,我就来测试下

01

 第一次测试

先让kimi给出 唐朝安史之乱的主要战役地点,以及对应的现代城市和地区

根据历史时间轴给出了事件,地点,以及现在的城市。并且搜索了53个网页,要是我自己去搜,眼睛都要看麻。

kimi又放大招,国内第一个具备推理思考大模型

在最后,还有一次反思。对之前的回答内容进行了一次回溯。

kimi又放大招,国内第一个具备推理思考大模型

那如果不用kimi探索版,结果如何呢。同样的问题我们再来一遍。

kimi又放大招,国内第一个具备推理思考大模型

上面的结果和探索版相比,一是搜索的页面少了,只有37个。第二是只列出了地点,没有给出时间轴上的关键事件。不过地点也是根据时间发展来排列的

02

 来点更复杂的

如果上面的对比 体现不出差距,那我们就来个复杂的,来计算下甄嬛的生日和薛宝钗的生日相差几天?

kimi又放大招,国内第一个具备推理思考大模型

同样先给出了3个计算步骤,先确定甄嬛生日,再确定薛宝钗的生日。最后再计算相差的天数,得出最后生日相差的天数

不过这里Kimi有点翻车了,二月有30天,三月有30天。明显是错了。

而用普通的kimi搜索,能确定出生日期,但是无法计算

kimi又放大招,国内第一个具备推理思考大模型

只有进一步指示计算两个日期的差距的时候,才会计算出来。这个计算结果是对的。

kimi又放大招,国内第一个具备推理思考大模型

甄嬛和薛宝钗的生日计算功能是kimi自带的,可能会有网友质疑是不是早就计算好了。我重新用了2个人,爱因斯坦和法拉第。一样的可以计算出来

kimi又放大招,国内第一个具备推理思考大模型

03

还能更难么

再来用更难的逻辑题来考察下kimi。我用一道逻辑推论题来考察,并且特地强调不要使用联网功能

这样完全凭借kimi自己的大模型来计算

kimi又放大招,国内第一个具备推理思考大模型

真正做到了根据思维链思考的模式来进行解答。问题的答案也非常准确。

04

 国内其他大模型如何?

就上面的表现和国内其他大模型来比较下

元宝:

kimi又放大招,国内第一个具备推理思考大模型

智谱

kimi又放大招,国内第一个具备推理思考大模型

元宝和智谱我觉得在国内做得还不错的都无法得出结果,其他家的我也没兴趣来试了。

 

 写在最后

kimi作为国产之光,在演进方面还是与时俱进的。虽然和openAI比起来还有差距,不过只要在追赶的路上,那么就值得肯定

另外我觉得等kimi正式推出这个功能的时候,要么每天只有一定次数使用,要么就是付费使用了。

  文章内容来自于网络,由百合树AI整理,如有侵权,联系删除。如需开始AI写作请返回主页。

上一篇:

下一篇:

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注