DeepSeek R1-Lite-Preview:撼动OpenAI的中国AI?

DeepSeek R1-Lite-Preview:撼动OpenAI的中国AI?

由一家中国公司开发的DeepSeek R1-Lite-Preview人工智能模型已经引起了专家的关注。这种以推理为中心的模型有望提供令人印象深刻的性能,其规模足以与OpenAI的模型相媲美。

DeepSeek是一家专门从事人工智能(AI)业务的中国子公司。它的所有者是High-Flyer Capital Management ,这是一家专注于开源技术的对冲基金。其目标是使工具高效并可供尽可能多的人使用。

他们的最新创新R1-Lite-Preview语言模型刚刚发布。该模型旨在改进人工智能推理,目前只能通过DeepSeek Chat (一种在线聊天机器人)使用。这个新版本承诺提供令人印象深刻的性能,同时强调透明度和易用性。

DeepSeek R1-Lite-Preview:与 OpenAI 的 o1-preview 相比如何?

R1-Lite-Preview 的关键创新之一是其思维链推理。这个过程涉及分解和解释为得出答案而采取的每个步骤,提供人工智能中罕见的透明度。

因此,用户可以实时观察模型的逻辑步骤和合理性。即使它们乍一看似乎不寻常或错误。

尽管存在一些异常情况,但这种方法被证明非常有效,特别是对于破坏 GPT-4o和Claude模型的棘手问题。

例如,R1-Lite-Preview 通过正确回答数学谜语而脱颖而出,例如: “草莓这个词中有多少个字母 R?” 或者: “9.11 和 9.9 哪个更大?”

DeepSeek 设计该模型是为了在需要逻辑推理、数学求解和实时处理能力的领域表现出色。R1-Lite-Preview 在 AIME(美国数学邀请赛)和 MATH 等著名基准测试中优于 OpenAI o1 模型。

此外,R1-Lite-Preview 在主要基准测试中也表现出色,在 GPQA 和 Codeforces 等测试中与行业领先者相媲美。

其性能通过“反射Token”的动态管理得到加强。这使得通过为复杂问题分配更多计算资源来逐渐提高准确性成为可能。

DeepSeek公布的数据显示,模型对问题投入的越多,其结果就越准确。这种根据可用时间或资源进行发展的能力使其成为特别适合需要深入思考的任务的选择。

一个可供公众使用的模型……

目前,R1-Lite-Preview 只能通过 DeepSeek Chat 访问。它对公众免费,但对其先进的“深度思考”模式设置了每天 50 条消息的限制,鼓励用户在特定情况下探索其功能。

DeepSeek还宣布计划发布R1系列的开源版本,并附带专用API。这一战略是该公司传统的一部分,该公司以支持开源人工智能社区而闻名。

过去,像DeepSeek-V2.5这样的模型因其先进的语言处理和编码能力而受到称赞。这表明 R1 系列具有类似的潜力。

通过将性能和可访问性相结合,DeepSeek 追求实现人工智能领域创新民主化的雄心。

目前,DeepSeek尚未发布完整源代码或授权独立测试来验证其所谓的令人印象深刻的结果。截至目前,还没有透露有关他的训练的详细信息。

  文章内容来自于网络,由百合树AI整理,如有侵权,联系删除。如需开始AI写作请返回主页。

上一篇:

下一篇:

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注