Gemini 3.5 Flash 正式发布，你怎么评价这款模型?

根据Google的说法：Gemini 3.5 Flash 在多个维度上展现出媲美大型旗舰模型的智能，同时保持了 Flash 系列一贯的速度。它是我们迄今为止最强大的智能体和编码模型，在 Terminal-Bench 2.1 (76.2%)、GDPval-AA (1656 Elo) 和 MCP Atlas (83.6%) 等极具挑战性的编码和智能体基准测试中均超越了 Gemini 3.1 Pro，并在多模态理解方面遥遥领先（CharXiv Reasoning 测试得分 84.2%）。就每秒输出标记数而言，它的速度是其他前沿模型的 4 倍。

查看详情...