Gemini 3.5 Flash 正式发布,你怎么评价这款模型?
根据Google的说法:Gemini 3.5 Flash 在多个维度上展现出媲美大型旗舰模型的智能,同时保持了 Flash 系列一贯的速度。它是我们迄今为止最强大的智能体和编码模型,在 Terminal-Bench 2.1 (76.2%)、GDPval-AA (1656 Elo) 和 MCP Atlas (83.6%) 等极具挑战性的编码和智能体基准测试中均超越了 Gemini 3.1 Pro,并在多模态理解方面遥遥领先(CharXiv Reasoning 测试得分 84.2%)。就每秒输出标记数而言,它的速度是其他前沿模型的 4 倍。