星空体育(StarSports)官方网站 Google I/O 2026 不打模子仗了

文：王智远 | ID:Z201440

Google I/O 2026 就这样开罢了。

两个小时，几十个居品更新，一股脑全砸出来。今天大开纵情一家科技媒体皆能看到居品清单，我就别随着念了。

我想说的是另一件事：

Pichai 在 keynote 上放了张图，Google 里面各居品每月处理的 token 量，2024 年 5 月 9.7 万亿，旧年 I/O 的时候 480 万亿，本年到了 3.2 千万亿。一年，翻了 7 倍。

你别以为是用户变多，Google 核心居品的用户量级一年下来根本没变，归并批东谈主，启动用 AI 作念以前根底不会作念的事，这是看懂整场 I/O 最要害的一把钥匙。

Google 此次发的系数东西，模子、Agent、搜索升级、订价调节、基础设施，皆在追一个规划：

把 Agent 跑起来的成本压到一条线以下，然后，用我方最大的资本，把它塞进十几亿东谈主每天皆在用的居品里。

这场游戏规定，跟当年两年的模子竞赛，不一个门路。

Pichai 此次把一个模子推到了 keynote 最中间。最低廉的阿谁。

Gemini 3.5 Flash，名字里就带 Flash；按 Google 我方的居品线逻辑，这是轻量款，不是旗舰。旗舰是 3.5 Pro，还没发，Pichai 说夏天见，原话是「里面还是在用，还在打磨」。

先上的却是 Flash，并且给了最中间的位置，排序自身即是立场。

我翻了翻它的基准测试：

3.5 Flash 在 Terminal-Bench 2.1 上跑出 76.2%，3.1 Pro 是 70.3%。

在 GDPval-AA 这个稀奇斟酌「真实经济价值任务」的基准上，3.5 Flash 拿了 1656 Elo，3.1 Pro 是 1314。MCP Atlas 器用调用基准，83.6%。

翻译成东谈主话即是：

一个轻量款模子，在编码和 Agent 任务上，把自家上一代旗舰全干翻了。

这种事以前险些不会发生，Flash 和 Pro 之间一直有明确的智商代差，你选 Flash 即是要拿智商换速率和价钱。3.5 Flash 把这个默许假定砸碎了。

速率这边更夸张，Pichai 在台上报了个数：

每秒输出 289 个 token，是其他前沿模子的 4 倍；在 Antigravity 2.0 里跑优化版块，能到 12 倍，订价每百万 token 输入 1.5 好意思元，输出 9 好意思元。

我算了一下，比 3.1 Pro 的输入价钱低 40%，输出也低 40%。如若再用上缓存，长高下文场景下的本体成本还能再降一个台阶。

这些数字单看皆是参数，放一齐看，就讲了一件事：Agent 的角落运行成本，到了一个新的量级。

Pichai 我方把账算给了在场的东谈主听，草率是，一家头部企业每天处理一万亿 token，把 80% 的负载从其他前沿模子迁到 3.5 Flash，一年能省逾越 10 亿好意思元。

这是给 CIO 看的财务测算。

Google 我方还是是最大的受益者，本年 3 月，Google 里面每天处理 5000 亿 token。当今这个数逾越 3 万亿，每隔几周翻一倍。

增长的来源就一条：

工程团队全面切到 Antigravity 加 3.5 Flash 的开荒过程之后，本来跑不起的任务，眨眼间跑得起了。

这就回到了开首说的数据，token 耗尽一年翻 7 倍，是成本降到某条线以下之后，用法我方长出来的。

3.5 Flash 的真义，不在于「又一个更强的模子」，它真实作念的事，是把 Agent 从「本领上可行」推到了「经济上可行」。

当年两年民众聊 Agent，聊能不行作念获得；这个模子一出来，问题变了，酿成谁能把它铺出去。

谁能把 Agent 铺出去，Google 的第一个回答叫 Gemini Spark，一个 24 小时挂在云表的个东谈主智能体。

你札记本合上，手机锁屏，它还在后台干活，底层跑的是 3.5 Flash，框架是 Google 里面的 Antigravity Harness，部署在 Google Cloud 的专用虚拟机上。

进口就在 Gemini 哄骗里，9 亿月活用户，大开就能摸到，Google Labs 的副总裁 Josh Woodward 在台献艺示了几个场景：

给雇主发周报，Spark 我方去你的邮箱、文档、表格、演示文稿里把事实拉出来，用你的口吻写好草稿。

办邻居约聚，Spark 追踪谁回复了谁没回，自动在在线表格里建一个及时更新的 RSVP 表，给没回的东谈主草拟催促邮件。

听起来皆是小事，这些小事值得讲，因为全程不需要你盯着。

第一批接入的第三方器用是 Canva、OpenTable、Instacart，走的是 MCP 公约。

真义是 Spark 不单帮你在 Google 自家居品里跑腿，它还能帮你订餐厅、下单买菜；接下来几周会绽放更多第三方接入，夏天还会加 Chrome 浏览器集成和 macOS 土产货文献造访。

绽放节拍值得扎眼，Spark 当今只给受信任测试者用，下周以测试版推给好意思国的 AI Ultra 订阅用户，AG真人中国官方网站是一层一层放。

这个节拍背后藏着一个问题：用户凭什么把邮箱、日期、购物车交给一个 AI。

Google 此次稀奇花了时期讲这件事，Spark 在作念什么，每一步皆展示念念考轨迹，用户随时不错打断；扩充明锐操作之前会停驻来征求许可，比如要发一封邮件、订一个日期会议，它会先问你一声。

Woodward 的原话里还有一句：

你不需要一直开着电脑证明它在跑，这句话既是居品特色，也在恢复用户心里阿谁不安。

Spark 是抵消费者的回答。对企业的回答是 Antigravity 2.0；Antigravity 1.0 旧年 11 月发的，定位是智能编程环境，对标的是 Cursor，用了半年，Google 说还是少见百万开荒者。

2.0 此次换地方了，它从编程器用酿成了多智能体编排平台；具体分三层：

第一层，一款安靖桌面哄骗，Google 管它叫「与智能体交互的核心」。

你不错同期起多个智能体，一个写代码，一个生制品牌素材，一个作念居品架构，并行跑，互不侵扰；还能设定接洽任务，让智能体定期间表自动在后台扩充。

第二层，Antigravity 敕令行器用，给风气待在终局里的开荒者用；这个器用成功取代了之前的 Gemini 敕令行，6 月 18 日旧版停服，所灵验户必须迁徙。

第三层，Antigravity SDK。

这一层是要害。Google 给的评释是，SDK 让外部开荒者不错用编程样子调用驱动 Google 自家居品的归并套智能体框架，跟 Gemini 模子协同优化，部署在我方的基础设施上。

翻译一下：

Google 试着把我方里面正在用的智能体基础设施，以 SDK 的时势交到开荒者手里，这是对 Claude Code 和 Codex 的正濒临位。

Antigravity 这条线底下还有一个单独发布，叫 CodeMender；一个安全智能体，用 Gemini 的推明智商自动发现并建造要害代码罅隙，成功动笔改代码，不仅仅解释问题。

Google 的逻辑很直白：智能体写的代码越来越多，安全就得跟上，安全自身也得由智能体来作念。

把 Spark 和 Antigravity 2.0 放在一齐看，Google 作念的事情就很了了了。

消费者这边，一个 24 小时在线的个东谈主智能体，接着 9 亿月活的 Gemini 哄骗落地；企业这边，一个从编程器用进化成编排平台的开荒者器用，附带 SDK 和敕令行，成功竞争 Claude Code。

两条路同期铺，星空体育(StarSports)官方网站中间跑的皆是归并个引擎，3.5 Flash。

是以，谷歌的解法是：准备两条腿一齐跑，消费者和开荒者一个皆不放。

铺出去之后，智能体往哪跑？说出来细目惊到下巴，谜底藏在 Google 最老的阿谁居品里：搜索。

Google 我方给此次搜索框雠校下的界说是「标记性搜索框 25 年来最大的一次升级」；智远以为，这话有营销因素，但看完具体更动之后，如实不是小修小补。

先说一个数据：

AI Mode 旧年 I/O 才发布，一年时期月活过了 10 亿。上线以来每个季度查询量翻一倍，上季度 Google 搜索的总查询量创了历史新高。

这个数字反直观，当年几年行业里一直有个叙事：

AI 聊天机器东谈主会蚕食搜索，本体发生的正好反过来；东谈主们发现搜索能作念更多事之后，搜索量不降反升，并且涨得很猛。

新搜索框的变化从交互层就启动了，它会随着你输入的内容自动膨胀，容纳更长更白话化的问题。

本来的自动补全换成了一套 AI 驱动的查询提出系统，是帮你想了了你到底想问什么，同期相沿多模态输入，翰墨、图片、视频、Chrome 标签页皆能往里丢。

AI Overviews 和 AI Mode 此次合到一齐了，你问一个问题，看到 AI 概览，成功在原页面追问就滑入 AI Mode，高下文遏抑，越聊越深，推选的纠合和来源也越来越精确。5 月 19 日全球同步上线。

这些皆是居品层面的更新，真碰巧得扎眼的是搜索框里长出来的智能体。

Google 管它叫信息智能体，你不错在搜索里创建一个大致多个后台智能体，24 小时帮你盯着某件事。

比如：

你让它追踪某个规模的市集变动，智能体会我方制定监控接洽，决定该用哪些数据源，包括 Google 的及时金融数据、新闻、博客、外交帖子，条目触发的时候合成一份带纠合的更新推给你，今夏上线，先给 AI Pro 和 Ultra 订阅用户。

再往前一步，搜索里还接入了 Antigravity 的编程智商。

Google 管它叫生成式界面，你搜一个问题，搜索不单给你谜底，还能现场给你生成一个可交互的迷你哄骗。

台献艺示的例子是一个个性化健身哄骗，能接入及时天气、读你的日期、知谈你的饮食偏好，自动生成饮食接洽并附带食谱纠合。

这是搜索在帮你造东西。搜索除外，智能体也在进 Google 的其他居品。

Daily Brief 是 Gemini 哄骗里的第一个开箱即用的智能体。每天早上帮你整理收件箱、日期和待办，排好优先级，给出下一步提出。

它的前身是旧年 12 月在 Google Labs 上线的一个践诺神气 Cici，很快成了最受宽待的践诺之一，此次直汲取编进了端庄居品线。

长入购物车是购物场景的智能体，一个跨 Google 搜索、Gemini 哄骗、YouTube、邮箱职责的长入购物车，能追踪降价、监控库存、稽查价钱历史，以致能发现你买的电脑配件之间的兼容性问题。

Ask YouTube 再行界说了视频搜索，你问一个问题，它不给你一滑视频列表让你我方翻，而是成功跳到最有关的阿谁视频里最有关的阿谁片断。

把这些更新摊开看，一个论断就浮出来了。

模子竞赛时，比谁的基准分数高，纯 AI 公司和平台公司站在归并齐跑线上。

智能体竞赛的逻辑十足不同，智能体要纠合真实的邮箱、日期、文档、购物车、搜索历史、视频库，谁手里有这些东西，谁就有先天上风。

Google 有 13 个居品逾越 10 亿用户，5 个逾越 30 亿。这不是本领能补的差距。

Anthropic 和 OpenAI 不错作念出很好的模子，不错作念出很好的智能体框架；它们作念不出邮箱，作念不出搜索，作念不出 YouTube。

这是 Google 在智能体时间最大的资本，亦然这场 I/O 的确确讲的故事，模子再强也拼不外管谈有多粗。

管谈粗，得有东西在底下撑着。

Pichai 在 keynote 后半段把话题转到了基础设施，开首就甩了一个数字：2022 年 Google 的资本开支是 310 亿好意思元，本年瞻望 1800 到 1900 亿。6 倍。四年时期。

这笔钱的一大块砸在了自研芯片上，Google 发布了第八代 TPU，第一次作念了双芯片单干。

TPU 8t 专作念测验，原始算力接近上一代的 3 倍；TPU 8i 专作念推理，速率拉满，两颗芯片的性能功耗比皆提高了约 2 倍。

测验这边还有一个值得单独讲的变化。

Google 我方搞了一套测验革新框架，测验任务能跨好几个数据中心跑，全球革新逾越 100 万颗 TPU。Pichai 管这叫「宇宙上最大的测验集群」。

这意味着测验不再被一个机房的物理上限卡住，模子越来越大，测验周期从几个月压到几周。

推理这边，TPU 8i 的联想地方就一个字，快。Pichai 原话提到，Google 作念了 27 年搜索，学到的最深的一课即是蔓延很热切。

3.5 Flash 每秒 289 个 token 的输出速率，底下撑着的即是这套推理芯片。

把上头几段的逻辑串起来：3.5 Flash 的速率和价钱不是假造来的，是 1800 亿好意思元的资本开支、自研芯片、全球分散式测验集群共同托出来的。

纯 AI 公司不错在模子层追上来，基础设施层想追上，难度高了一大截。这是另一层「管谈」。

终末一块拼图是 Gemini Omni，这趴是 DeepMind 的 CEO Demis Hassabis 躬行上台讲的，重量够重。

Omni 颖异啥？你给它什么，它给你什么，先从视频启动，以后图片和翰墨也会跟上来。

2026世界杯中国压球官网

第一款上线的叫 Gemini Omni Flash，5 月 19 日启动在 Gemini 哄骗、Google Flow 和 YouTube Shorts 里能用，系数生成的内容自带水印。

3.5 Flash 处理的是「让智能体跑起来」，Omni 指向的是更远的事：让 AI 不光会写字，还会造东西。

Omni 不是一个安靖的新东西，以前 Google 的 Veo 管视频生成，Nano Banana 管图片裁剪，各管各的，互不搭嘎；Omni 把这些全塞进 Gemini 一个框里了。

你上传一段我方拍的视频，说一句话让它改，它就能改里面正在发生的事，加个东谈主进去，换个作风，时期线还给你接得上。

大致你纯用翰墨态状一个倡导，Omni 成功给你生成一段带画面带声息的视频。

这个智商单看是个很强的演示，放回整场 I/O 的逻辑里看，它在讲一件更大的事。

我翻了一下时期线：

本年 4 月 29 日，OpenAI 把面向消费者的 Sora 2 哄骗关了，只留了付费 API；情理是基础设施成本和分发战略要调节。11 天之后，Google 的 Gemini 哄骗里启动出现 Omni 的影子。

归并个地方，一家因为扛不住成本退了一步，另一家采取往前走。

两家濒临的本领艰巨差未几。离别在哪？Google 有自研的 TPU 推理芯片压成本，有 Gemini 哄骗 9 亿月活分担算力，有 YouTube Shorts 这种现成的台子来消化视频生成的产能。

OpenAI 莫得；这不单谁的模子更好的问题，是谁的结构撑得住。

把整场 I/O 从新到尾串一遍，Google 讲的就一件事：

模子层，3.5 Flash 用速率和价钱把智能体的成本压到谁皆接得住的位置。

居品层，Spark 给等闲东谈主，Antigravity 2.0 给活动员，搜索里长出来的智能体和生成式界面把搜索酿成了进口，长入购物车把智能体塞进了真实交游。

基础设施层，1800 亿好意思元的资本开支、第八代 TPU、百万颗芯片的测验集群在底下兜着;每一层皆不是孤苦存在，属于一个系统里的不同齿轮。

Pichai 在 I/O 前的小领域疏导里说过一句话：

咱们为什么这样执着于作念出既强又快又低廉的前沿模子，因为咱们要把它带给尽可能多的东谈主。这是咱们真实会发光的地方。

这句话的潜台词不难读，Google 以为智能体时间的终局，是谁能把好的模子、大的管谈、深的地基绑在一齐，让智能体的确跑进等闲东谈主的生涯。

当年两年，纯 AI 公司掌捏着行业叙事的主场，这场 I/O 之后，一个老问题值得再行想想：

当竞争从「作念出最佳的模子」酿成「让智能体跑进真实生涯」星空体育(StarSports)官方网站，窗口在给谁大开，又在给谁关上。