Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。-百合树AI写作-专业学术论文写作助手

今天是个好日子，AI Claude 触及物理世界。

之前介绍过许多 AI OS 代理，而这次是实力强大的官方实现。虽然基准测试通过率也不是太高，但相比以前的，它排名第一，虽然远低于人类，但未来可期。

Haiku 还不能测试，但 Anthropic 还升级了 Claude 3.5 Sonnet。

所以

我们聊这个。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

Claude 3.5 Sonnet 没更新前就被称为最好的编码模型。现在它更强，在Aider榜中超越原来的第一：o1-preview。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

更新后，价格和速度保持一致。

>/ 以下素材取自 AiCodeKing、WorldofAI

我们让它，生成一个简单蝴蝶形状的 SVG 代码。

以前测试的许多模型绘制的并不好。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

而。我可以说，这是。。最漂亮的一次。

他怎么能画得这么好啊啊啊??。

他还以12-1的战绩答对了我们以前对于大模型的测试问题，即便o1也不能完全答对，比如第4条。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

不过这也不是重点，没升级的模型也能答对这么多，所以我们还是看看实际编码效果。

一张图，生成APP

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

惊讶。。

这个任务是这样的 ——

创建一个可以添加我需要记住的事项的应用。每个事项应该都有一个切换按钮，我可以在认为我完成了时切换。

基于一这个个前置 React 创建的 Exрo Арр : npx create-expo-app ，

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

给此图，改的。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

前置 React 创建的 Exрo Арр 相当于做了v0、Blot那些模板工作，这样才好运行。

继续。。

编写一个视觉吸引且用户友好的天气仪表板。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

灰常NB。

接下来 —— 实现 Dijkstra 算法，在加权图中找到最短路径，包括使用如 Matplotlib 和 NetworkX 等库可视化图形和路径。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

嗯。他对了

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

算法实现、绘图功能、函数结构都很清楚。厉害。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

嗯。优秀的编码模型

优于许多其他模型，如 o1-preview 和新款 Haiku 模型

然后，我们使用强大的Aider再加上强大的它，试试 ——

先给它一个基于React创建的 Exрo Арр

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

Prompt ：这是一个Exрo应用程序。我希望你废弃所有以前的页面，只是做一个一页的应用程序。这个页面显示我所有的费用，底部的右下角有一个添加按钮，这将打开一个弹窗，我可以添加费用，这将显示在页面上。我还希望编辑和删除选项每一次费用，此外，我希望这是名字是 KingDay，我也想要一个选项，一次清除所有的费用。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

很酷，真的，基于原型，直接改。。

嗯，再聊聊基准测试——

编码方面，它在 Sued Bench 认证测试中的得分从 33.4 提升到了 49%，超越了所有公共模型，包括 OpenAI o1-preview,，同时在CodeHunanEivat 也创下了新纪录。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

与 o1 进行直接比较

某些基准下 o1-preview的表现确实优于 Sonic 3.5，然而在编码和与之相关的几个基准测试中，Sonic 3.5 显然超过了 o1-preview

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

它比o1更便宜，而且。没有 30条消息限制，它是自动编码和多步骤 AI 任务的首选。。

Aider中使用 Sonnet

安装aider

aider --sonnet 启动aider --sonnet --cache-prompts 以提示缓存启动（减少90%token消耗）

不多言，过往文章一堆 Aider，

这样搜

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

Aider（已升级）：Aider利用双模型架构做到85% SOTA得分！（架构师/编辑师助你实现编程新高度）

2024-10-01

Cline 中使用 Sonnet

在设置选项中，你会看到这个新模型，它默认被选中。如果你使用Open Router 或 Vertex AI等，新的模型也已可用。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

Aider中使用 Sonnet

Cline 中使用 Sonnet

相关推荐

发表回复 取消回复

发表回复取消回复