OpenAI CEO山姆·奥特曼发文自爆新模型o2,并且在GPQA评测中达到105%。

另外,根据lifearchitect.ai此前发出的评估,GPT-5的GPQA大约知识75%,山姆·奥特曼的这个新模型o2达到105%属实又是一波不错的营销。
https://x.com/sama/status/1852781569775485117
https://arxiv.org/abs/2311.12022
GPQA: A Graduate-Level Google-Proof Q&A Benchmark