Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

今天是个好日子,AI Claude 触及物理世界。

之前介绍过许多 AI OS 代理,而这次是实力强大的官方实现。虽然基准测试通过率也不是太高,但相比以前的,它排名第一,虽然远低于人类,但未来可期。

Haiku 还不能测试,但 Anthropic 还升级了 Claude 3.5 Sonnet。

所以

我们聊这个。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

Claude 3.5 Sonnet 没更新前就被称为最好的编码模型。现在它更强,在Aider榜中超越原来的第一:o1-preview。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

更新后,价格和速度保持一致。

>/ 以下素材取自 AiCodeKing、WorldofAI

我们让它,生成一个简单蝴蝶形状的 SVG 代码。

以前测试的许多模型绘制的并不好。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

而。我可以说,这是。。最漂亮的一次。

他怎么能画得这么好啊啊啊??。

他还以12-1的战绩答对了我们以前对于大模型的测试问题,即便o1也不能完全答对,比如第4条。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

不过这也不是重点,没升级的模型也能答对这么多,所以我们还是看看实际编码效果。

一张图,生成APP

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

惊讶。。

这个任务是这样的 —— 

创建一个可以添加我需要记住的事项的应用。每个事项应该都有一个切换按钮,我可以在认为我完成了时切换。

基于一这个个前置 React 创建的 Exрo Арр : npx create-expo-app ,

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

给此图,改的。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

前置 React 创建的 Exрo Арр 相当于做了v0、Blot那些模板工作,这样才好运行

 

继续。。

编写一个视觉吸引且用户友好的天气仪表板。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

灰常NB。

接下来 —— 实现 Dijkstra 算法,在加权图中找到最短路径,包括使用如 Matplotlib 和 NetworkX 等库可视化图形和路径。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

嗯。他对了

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

算法实现、绘图功能、函数结构都很清楚。厉害。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

嗯。优秀的编码模型

优于许多其他模型,如 o1-preview 和新款 Haiku 模型

 

然后,我们使用强大的Aider再加上强大的它,试试 ——

先给它一个基于React创建的 Exрo Арр

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

Prompt 这是一个Exрo应用程序。我希望你废弃所有以前的页面,只是做一个一页的应用程序。这个页面显示我所有的费用,底部的右下角 有一个添加按钮,这将打开一个弹窗,我可以添加费用,这将显示在页面上。我还希望编辑和删除选项每一次费用此外,我希望这是名字是 KingDay,我也想要一个选项,一次清除所有的费用。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

很酷,真的,基于原型,直接改。。

嗯,再聊聊基准测试——

编码方面,它在 Sued Bench 认证测试中的得分从 33.4 提升到了 49%,超越了所有公共模型,包括 OpenAI o1-preview,,同时在CodeHunanEivat 也创下了新纪录

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

与 o1 进行直接比较

某些基准下 o1-preview的表现确实优于 Sonic 3.5,然而在编码和与之相关的几个基准测试中,Sonic 3.5 显然超过了 o1-preview

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

它比o1更便宜,而且。没有 30条消息限制,它是自动编码和多步骤 AI 任务的首选。。

Aider中使用 Sonnet

安装aider

aider --sonnet 启动aider --sonnet --cache-prompts 以提示缓存启动(减少90%token消耗)

不多言,过往文章一堆 Aider,

这样搜

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。




Aider(已升级):Aider利用双模型架构做到85% SOTA得分!(架构师/编辑师助你实现编程新高度)

2024-10-01

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

 

Cline 中使用 Sonnet

在设置选项中,你会看到这个新模型,它默认被选中。如果你使用Open Router 或 Vertex AI等,新的模型也已可用。

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

  文章内容来自于网络,由百合树AI整理,如有侵权,联系删除。如需开始AI写作请返回主页。

上一篇:

下一篇:

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注