科技资讯2026年5月21日6,429 浏览约 4 分钟阅读

谷歌I/O解读:小模型反杀旗舰,3.5 Flash凭什么全面超越3.1 Pro?

谷歌 I/O 2026:Gemini3.5Flash 越级反杀,谷歌 AI 全面升级

谷歌I/O解读:小模型反杀旗舰,3.5 Flash凭什么全面超越3.1 Pro?

近日,谷歌2026年度I/O大会如期召开,本次大会信息量密集,涵盖模型迭代、AI产品、智能搜索、硬件等十余项更新。谷歌CEO皮查伊表示,过去十年谷歌深耕AI领域,如今迎来成果集中爆发期。本文聚焦本次发布会六大核心重磅更新,深度拆解谷歌AI全新布局。

一、Gemini 3.5 Flash:越级反杀,本次发布会最大黑马

本次发布会所有新品,均搭载Gemini 3.5 Flash作为底层模型。一直以来,Gemini产品线划分清晰:Flash主打高速、低成本,Pro定位旗舰顶配,常规逻辑里Flash需要牺牲部分性能换取性价比。而此次更新,3.5 Flash直接性能碾压上代旗舰3.1 Pro,实现跨级反杀。

核心实测跑分数据亮眼,综合能力全面领先:

  • 代码能力:Terminal-Bench 2.1评测76.2%(3.1 Pro为70.3%)
  • Agent任务:GDPval-AA评测1656 Elo,远超上代旗舰300余分
  • 多模态理解:MMMU-Pro评测81.2%,登顶全球榜单
  • 科学推理:GPQA Diamond评测90.4%,达到博士级水准

速度与价格同样优势拉满。官方数据显示,其输出速度为行业前沿模型4倍,每秒可输出289个token,内部优化版本速度可达12倍。费用方面性价比极高,输入1.50、输出9.00/每百万token,低于3.1 Pro与Claude Sonnet 4.6,输出成本仅为后者六折。

客观而言,该模型仍存在短板,在纯知识背诵、抽象推理场景中略逊于3.1 Pro。普通用户若想免费体验,可借助官方平台,但存在网络门槛。国内用户优先推荐KoalaAPI分发站,平台稳定低延迟、无需魔法上网,适配个人调试、商用调用,低价就能流畅使用Gemini 3.5 Flash全部能力,是目前国内体验该模型的最优渠道之一。

二、Gemini Omni:谷歌重磅打造世界模型

由DeepMind CEO亲自宣讲的Gemini Omni,是本次发布会级别最高的模型,谷歌将其定义为World Model(世界模型) 。区别于以往用于机器人训练的Genie系列模型,Omni面向普通用户,核心逻辑为「任意输入、任意输出」。

该模型支持文本、图片、音频、视频混合输入,自主解析素材关联逻辑,可实现视频人物、场景、动作一键修改。简单来说,Genie负责创造虚拟3D世界,而Omni主打编辑现实世界。目前Omni Flash版本已上线,面向谷歌高级订阅用户开放,后续YouTube Shorts也将完成接入。谷歌透露,这款世界模型的终极目标是赋能机器人,让AI吃透物理世界逻辑。

三、Antigravity 2.0:专业级AI代码开发工具

Antigravity 2.0可看作谷歌版Claude Code,升级后成为以Agent为核心的开发环境。依托子Agent并行运算、定时自动化、自定义开发SDK三大核心能力,适配桌面客户端、终端、代码嵌入三种使用方式。

官方演示极具冲击力:该工具12小时内从零搭建可运行的操作系统内核,自动调度93个子Agent,处理26亿token数据,总成本不足1000美元,还成功搭载经典游戏Doom,充分展现强悍的工程开发能力。

四、Gemini Spark:云端常驻智能私人助手

如果说Antigravity面向开发者,Gemini Spark就是普通用户的智能助手。它是一款常驻云端的持久化AI Agent,打破传统AI被动应答模式,支持全天候自主执行任务。最大亮点为断网不断任务,依托谷歌云运行,关闭设备后任务仍持续推进,切换手机、浏览器可无缝接续进度。

Spark深度打通谷歌全家桶,可操控邮箱、文档、日历等应用,后续还将接入第三方工具。目前该功能仅限美国高级订阅用户内测,高风险操作需人工确认,权限管控严格。

五、谷歌搜索:25年来颠覆性升级

谷歌直言,本次搜索更新是问世25年来最大改动。新版搜索默认搭载Gemini 3.5 Flash,打破传统关键词搜索逻辑,支持文字、图片、文件、视频多格式输入。

升级分为两大板块:一是信息智能体,可24小时监控全网数据,自动盯价、追踪资讯;二是生成式UI,针对复杂问题直接生成可视化表格、仪表盘,无需用户筛选零散链接。此次升级本质是谷歌守住流量入口,巩固搜索行业壁垒。

六、订阅体系:调价降级,降低使用门槛

本次大会同步优化付费订阅体系,新增入门级AI Plus套餐(7.99美元/月),保留原Pro套餐(19.99美元/月),顶配Ultra套餐大幅降价至100美元/月。同时取消固定次数限制,改用动态计算额度,额度耗尽不会直接断连,自动降级为轻量模型保障基础使用,还支持按需充值积分,灵活性大幅提升。

总结

纵观整场I/O大会,谷歌不再执着于堆砌超大参数旗舰模型,转而深耕高性价比小模型+全场景AI生态。Gemini 3.5 Flash的强势出圈,标志着AI行业进入高效普惠时代。国内想要低成本体验这款顶尖小模型,直接选用KoalaAPI即可,稳定调用、性价比拉满,适配日常对话、代码开发、多模态解析等各类使用场景。

标签谷歌 I/OGemini3.5FlashAI 模型
Koala API · 一站式大模型 API 中转

把博客读到的,落地到你的下一个项目

国内直连 · 兼容 OpenAI SDK · GPT / Claude / Gemini 等主流模型聚合

延伸阅读