Sam Altman又来秀了,o2能100分考105!

OpenAI CEO山姆·奥特曼发文自爆新模型o2,并且在GPQA评测中达到105%。

Sam Altman又来秀了,o2能100分考105!
GPQA是一个研究生级别的Google验证问答基准测试,GPQA测试包含448个多项选择题,持有博士学位的专家,其正确率也仅为65%,而非专家的准确率更是低至34%。GPQA测试的满分就是这448个问题全部答对,100%,而新模型o2竟然能超出5%。
山姆·奥特曼自己都觉得不可思议,直呼“账号错误”,“逗自己玩尼”。

Sam Altman又来秀了,o2能100分考105!

另外,根据lifearchitect.ai此前发出的评估,GPT-5的GPQA大约知识75%山姆·奥特曼的这个新模型o2达到105%属实又是一波不错的营销。Sam Altman又来秀了,o2能100分考105!

最近OpenAI确实动作频频,期待继续推出更多新版本!近期 ChatGPT 版本和功能摘要:

Sam Altman又来秀了,o2能100分考105!

https://x.com/sama/status/1852781569775485117https://arxiv.org/abs/2311.12022GPQA: A Graduate-Level Google-Proof Q&A Benchmark

  文章内容来自于网络,由百合树AI整理,如有侵权,联系删除。如需开始AI写作请返回主页。

上一篇:

下一篇:

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注