Gemini3中文测评结果出炉:首次超越GPT-5位居全球第二

2026-01-15 03:22:05来源: 网络作者:admin

11月19日消息,2025年末的全球AI领域竞争再度升温,测评机构SuperCLUE发布的最新报告指出:谷歌Gemini-3-Pro-Preview在SuperCLUE今年9月开展的中文大模型基准测评中,取得了70.80的综合得分。

它比GPT-5(high)高出1.43分,比GPT-5.1(high)低1.71分,在全球排名第二。Gemini-2.5-Pro当前位列全球第七。

Gemini-3-Pro-Preview的推理效率比Gemini-2.5-Pro略有提升,平均每题耗时从32.2秒减少至31.9秒。不过推理成本有所上升,从24.5元/百万Tokens涨至32.0元/百万Tokens。

据了解,此次测评涵盖数学推理、科学推理、代码生成(包含web开发)、智能体Agent(多轮工具调用)、幻觉控制、精确指令遵循这六大核心维度。

和GPT-5.1(high)比起来,Gemini-3-Pro-Preview的长处主要在幻觉控制这块,科学推理方面两者不相上下,但在另外四个维度上则完全处于下风。

免责声明:文章图片应用自网络,如有侵权请联系删除

热门推荐

更多
最新 热门