英伟达(Nvidia)推出Llama -3.1-Nemotron-70B-Instruct:一种在大多数基准测试中优于GPT -4o 和Claude 3.5 的 AI。人工智能行业刚刚找到新的领导者吗?
显卡巨头要重新布局AI产业?几天前, Nvidia 推出了NVLM 1.0 系列多模态模型,特别是 NVLM-D-72B 及其 720 亿个参数。
2024 年 10 月 15 日星期二,它完全谨慎地推出了一种新的人工智能模型,超越了OpenAI和Anthropic等行业领导者的模型。
这不仅是这家美国公司战略的重大转变,还可能扰乱人工智能领域的整个既定秩序!
这款名为Llama-3.1-Nemotron-70B-Instruct 的新型号毫无争议地出现在 Hugging Face 平台上。然而,很快它就因其在众多基准测试中令人惊叹的表现而吸引了所有人的关注。
处于技术前沿的Meta Llama 3.1 的改进版本
为了创建这种人工智能,Nvidia 使用高度先进的训练技术改进了 Meta 的开源 Llama 3.1 模型。
她特别使用了RLHF 方法:根据人类反馈进行强化学习。这包括让人工智能从人类偏好中学习,从而产生更自然、更符合情境的反应。
然而,真正让 Llama-3.1-Nemotron-70B-Instruct 与众不同的是它能够处理复杂的查询,而无需额外的提示或专门的标记。
作为演示的一部分,她正确回答了以下问题:“草莓(strawberry)这个词有多少个 r?” 并提供准确而详细的答案。
这显示了对语言的细致入微的理解和提供清晰解释的能力。目前大多数人工智能模型在这个问题上都失败了。
此外,这些结果特别重要,因为它们强调“一致性” :这个术语指的是模型的输出与用户的需求和偏好的匹配程度。
对企业有吸引力的新解决方案
有了这样的模型,希望利用人工智能的企业和组织将能够从更有用的答案中受益,同时错误也会少得多。
此外,Nvidia 通过其 build.nvidia.com 平台提供免费的托管推理。它带有与OpenAI兼容的API接口。
这种可访问性使最先进的人工智能技术更加可用,允许广泛的公司使用它并实施最新的语言模型。
该模型还具有可定制的优点,以满足企业的特定需求:处理客户服务请求、生成复杂的报告等。
Nvidia 的 AI 提供了这种灵活性,并结合了行业领先的性能。因此,对于所有行业的公司来说,这都是一个非常有趣的解决方案。
尽管如此,该公司警告说,Llama-3.1-Nemotron-70B-Instruct尚未针对数学或法律推理等精度至关重要的专业领域进行完善。
因此,公司必须确保正确使用它并实施防护措施以避免错误。
Nvidia, LLM行业的新领导者?
据英伟达称,该人工智能在多个旗舰基准测试中得分最高。特别是,它在 Arena Hard Benchmark 上达到 85.0 ,在 AlpacaEval 2 LC 上达到 57.6,在 GPT-4-Turbo MT-Bench 上达到 8.98。
因此,它的分数超过了GPT-4o和 Anthropic Claude 3.5 Sonnet等最受认可的模型的分数。由此,英伟达不再只是一家供应商,而是正在将自己推向生成式AI行业的顶峰!
到目前为止,该公司主要以主导显卡行业而闻名,用于视频游戏和加密货币挖掘,还用于培训人工智能系统。
现在,它刚刚证明了自己开发人工智能并超越其主要客户的能力。凭借在硬件方面的专业知识,它将自己定位为一流的人工智能解决方案提供商。
这一战略扩张可能会在LLM领域引发真正的地震冲击,迄今为止,该领域一直由专注于软件开发的公司掌握。
后者将不得不重新考虑自己的战略并加大研发力度。英伟达有充分的理由不仅寻求竞争,而且超越最流行的人工智能。
然而,自2022年推出ChatGPT以来, OpenAI一直在等待竞争对手发布更强大的模型,然后再部署GPT更新,以保持其主导地位。因此,我们可能会在未来几天内推出新版本……
就其本身而言,为了真正确立自己作为新基准的地位,Llama 3.1-Nemotron-70B-Instruct 必须超越基准并在实际应用中证明自己。