据本网11月19日消息,全球AI舞台将在2025年底再次掀起波澜。评测机构SuperCLUE的最新报告显示,谷歌Gemini-3-Pro-Preview在SuperCLUE 9月份中国大型模型基准评测中获得了70.80的总分。
它超越 GPT-5(high) 1.43 分,较GPT-5.1(high)落后1.71分,位居全球第二。Gemini-2.5-Pro目前排名世界第七。
Gemini-3-Pro-Preview的推理效率相比Gemini-2.5-Pro略有提升,每题平均时间从32.2秒缩短至31.9秒。推理成本从24.5元/百万Token增加到32.0元/百万Token。
据了解,本次评测涵盖数学推理、科学推理、代码生成(含Web开发)、智能代理(多轮工具调用)、错觉控制、精确指令跟随等六个核心维度。
与GPT-5.1(high)相比,Gemini-3-Pro-Preview的优势集中体现在幻觉控制,科学推理旗鼓相当,而在其他四个方面全面落败。