开源大模型王者又易主了,继续卷!英伟达深夜发布了Llama-3.1-Nemotron-70B,其性能优于Anthropic Claude Sonnet 3.5 和 OpenAI GPT-4o,仅次于OpenAI o1。

Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的大型语言模型,旨在提高 LLM 生成的响应对用户查询的帮助性。该模型使用 RLHF(REINFORCE)、在 Llama-3.1-70B-Instruct基础上,通过Llama-3.1-Nemotron-70B-Reward和HelpSteer2-Preference Prompts训练得到。
草莓单词有几个R效果
https://huggingface.co/chat/models/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF
https://huggingface.co/collections/nvidia/llama-31-nemotron-70b-670e93cd366feea16abc13d8
在英伟达发力大参数模型的同时,Mistral AI团队也在端侧小模型方面发力,开源了Ministral 3B 和 Ministral 8B。效果上击败了对应尺寸的先进模型:Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B。
Ministral 3B 和 8B 型号与 Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B 和 Mistral 7B 在多个类别上的比较
Ministral 3B 和 8B 基础型号与 Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B 和 Mistral 7B 的比较
博客:https://mistral.ai/news/ministraux/
模型:https://huggingface.co/mistralai/Ministral-8B-Instruct-2410
文章内容来自于网络,由百合树AI整理,如有侵权,联系删除。如需开始AI写作请返回主页。