谷歌正式发布了其最新的核心推理模型Gemini 3.1 Pro。谷歌表示,该模型在逻辑推理基准测试ARC-AGI-2上,其已验证性能达到了前代3 Pro模型的两倍。作为驱动Gemini及Google AI工具(如Gemini 3 Deep Think)的新核心模型,3.1 Pro旨在为复杂挑战提供更具创造性的解决方案。
在基准性能方面,谷歌发布的数据显示,Gemini 3.1 Pro在多项测试中超越了前代Gemini模型、Claude Sonnet 4.6、Claude Opus 4.6以及GPT-5.2。例如,在Humanity's Last Exam测试中,其得分高于主要竞争对手。不过,根据谷歌自身披露,OpenAI的新编码模型GPT-5.3-Codex在SWE-Bench Pro基准测试中表现更佳。
关于试用方式,谷歌已开始通过Gemini应用、Gemini API以及Notebook LM逐步推出Gemini 3.1 Pro。免费用户可在Gemini应用中试用该模型,而订阅Google AI Pro和AI Ultra计划的付费用户将享有更高的使用额度。目前,在Notebook LM中,仅付费用户可以访问3.1 Pro。开发者和企业用户则可通过AI Studio、Vertex AI、Gemini Enterprise等多种开发平台接入新模型。
此次更新显示了AI公司模型迭代的速度。此前Gemini 3 Pro的发布就曾对行业格局产生影响,而性能更强的3.1 Pro可能进一步巩固谷歌在竞争中的地位。该模型专注于需要高级推理的任务,旨在将改进的智能应用于实际问题解决、复杂主题的可视化解释、数据综合及创意项目实现等场景。



