|
文:王智远 | ID:Z201440 Google I/O 2026 就这样开罢了。 两个小时,几十个居品更新,一股脑全砸出来。今天大开纵情一家科技媒体皆能看到居品清单,我就别随着念了。 我想说的是另一件事: Pichai 在 keynote 上放了张图,Google 里面各居品每月处理的 token 量,2024 年 5 月 9.7 万亿,旧年 I/O 的时候 480 万亿,本年到了 3.2 千万亿。一年,翻了 7 倍。 你别以为是用户变多,Google 核心居品的用户量级一年下来根本没变,归并批东谈主,启动用 AI 作念以前根底不会作念的事,这是看懂整场 I/O 最要害的一把钥匙。 Google 此次发的系数东西,模子、Agent、搜索升级、订价调节、基础设施,皆在追一个规划: 把 Agent 跑起来的成本压到一条线以下,然后,用我方最大的资本,把它塞进十几亿东谈主每天皆在用的居品里。 这场游戏规定,跟当年两年的模子竞赛,不一个门路。 01 Pichai 此次把一个模子推到了 keynote 最中间。最低廉的阿谁。 Gemini 3.5 Flash,名字里就带 Flash;按 Google 我方的居品线逻辑,这是轻量款,不是旗舰。旗舰是 3.5 Pro,还没发,Pichai 说夏天见,原话是「里面还是在用,还在打磨」。 先上的却是 Flash,并且给了最中间的位置,排序自身即是立场。 我翻了翻它的基准测试: 3.5 Flash 在 Terminal-Bench 2.1 上跑出 76.2%,3.1 Pro 是 70.3%。 在 GDPval-AA 这个稀奇斟酌「真实经济价值任务」的基准上,3.5 Flash 拿了 1656 Elo,3.1 Pro 是 1314。MCP Atlas 器用调用基准,83.6%。
翻译成东谈主话即是: 一个轻量款模子,在编码和 Agent 任务上,把自家上一代旗舰全干翻了。 这种事以前险些不会发生,Flash 和 Pro 之间一直有明确的智商代差,你选 Flash 即是要拿智商换速率和价钱。3.5 Flash 把这个默许假定砸碎了。 速率这边更夸张,Pichai 在台上报了个数: 每秒输出 289 个 token,是其他前沿模子的 4 倍;在 Antigravity 2.0 里跑优化版块,能到 12 倍,订价每百万 token 输入 1.5 好意思元,输出 9 好意思元。 我算了一下,比 3.1 Pro 的输入价钱低 40%,输出也低 40%。如若再用上缓存,长高下文场景下的本体成本还能再降一个台阶。 这些数字单看皆是参数,放一齐看,就讲了一件事:Agent 的角落运行成本,到了一个新的量级。 Pichai 我方把账算给了在场的东谈主听,草率是,一家头部企业每天处理一万亿 token,把 80% 的负载从其他前沿模子迁到 3.5 Flash,一年能省逾越 10 亿好意思元。 这是给 CIO 看的财务测算。 Google 我方还是是最大的受益者,本年 3 月,Google 里面每天处理 5000 亿 token。当今这个数逾越 3 万亿,每隔几周翻一倍。 增长的来源就一条: 工程团队全面切到 Antigravity 加 3.5 Flash 的开荒过程之后,本来跑不起的任务,眨眼间跑得起了。 这就回到了开首说的数据,token 耗尽一年翻 7 倍,是成本降到某条线以下之后,用法我方长出来的。 3.5 Flash 的真义,不在于「又一个更强的模子」,它真实作念的事,是把 Agent 从「本领上可行」推到了「经济上可行」。 当年两年民众聊 Agent,聊能不行作念获得;这个模子一出来,问题变了,酿成谁能把它铺出去。 02 谁能把 Agent 铺出去,Google 的第一个回答叫 Gemini Spark,一个 24 小时挂在云表的个东谈主智能体。 你札记本合上,手机锁屏,它还在后台干活,底层跑的是 3.5 Flash,框架是 Google 里面的 Antigravity Harness,部署在 Google Cloud 的专用虚拟机上。 进口就在 Gemini 哄骗里,9 亿月活用户,大开就能摸到,Google Labs 的副总裁 Josh Woodward 在台献艺示了几个场景: 给雇主发周报,Spark 我方去你的邮箱、文档、表格、演示文稿里把事实拉出来,用你的口吻写好草稿。 办邻居约聚,Spark 追踪谁回复了谁没回,自动在在线表格里建一个及时更新的 RSVP 表,给没回的东谈主草拟催促邮件。 听起来皆是小事,这些小事值得讲,因为全程不需要你盯着。 第一批接入的第三方器用是 Canva、OpenTable、Instacart,走的是 MCP 公约。 真义是 Spark 不单帮你在 Google 自家居品里跑腿,它还能帮你订餐厅、下单买菜;接下来几周会绽放更多第三方接入,夏天还会加 Chrome 浏览器集成和 macOS 土产货文献造访。 绽放节拍值得扎眼,Spark 当今只给受信任测试者用,下周以测试版推给好意思国的 AI Ultra 订阅用户,AG真人中国官方网站是一层一层放。
这个节拍背后藏着一个问题:用户凭什么把邮箱、日期、购物车交给一个 AI。 Google 此次稀奇花了时期讲这件事,Spark 在作念什么,每一步皆展示念念考轨迹,用户随时不错打断;扩充明锐操作之前会停驻来征求许可,比如要发一封邮件、订一个日期会议,它会先问你一声。 Woodward 的原话里还有一句: 你不需要一直开着电脑证明它在跑,这句话既是居品特色,也在恢复用户心里阿谁不安。 Spark 是抵消费者的回答。对企业的回答是 Antigravity 2.0;Antigravity 1.0 旧年 11 月发的,定位是智能编程环境,对标的是 Cursor,用了半年,Google 说还是少见百万开荒者。 2.0 此次换地方了,它从编程器用酿成了多智能体编排平台;具体分三层: 第一层,一款安靖桌面哄骗,Google 管它叫「与智能体交互的核心」。 你不错同期起多个智能体,一个写代码,一个生制品牌素材,一个作念居品架构,并行跑,互不侵扰;还能设定接洽任务,让智能体定期间表自动在后台扩充。 第二层,Antigravity 敕令行器用,给风气待在终局里的开荒者用;这个器用成功取代了之前的 Gemini 敕令行,6 月 18 日旧版停服,所灵验户必须迁徙。 第三层,Antigravity SDK。 这一层是要害。Google 给的评释是,SDK 让外部开荒者不错用编程样子调用驱动 Google 自家居品的归并套智能体框架,跟 Gemini 模子协同优化,部署在我方的基础设施上。 翻译一下: Google 试着把我方里面正在用的智能体基础设施,以 SDK 的时势交到开荒者手里,这是对 Claude Code 和 Codex 的正濒临位。 Antigravity 这条线底下还有一个单独发布,叫 CodeMender;一个安全智能体,用 Gemini 的推明智商自动发现并建造要害代码罅隙,成功动笔改代码,不仅仅解释问题。 Google 的逻辑很直白:智能体写的代码越来越多,安全就得跟上,安全自身也得由智能体来作念。 把 Spark 和 Antigravity 2.0 放在一齐看,Google 作念的事情就很了了了。 消费者这边,一个 24 小时在线的个东谈主智能体,接着 9 亿月活的 Gemini 哄骗落地;企业这边,一个从编程器用进化成编排平台的开荒者器用,附带 SDK 和敕令行,成功竞争 Claude Code。 两条路同期铺,星空体育(StarSports)官方网站中间跑的皆是归并个引擎,3.5 Flash。 是以,谷歌的解法是:准备两条腿一齐跑,消费者和开荒者一个皆不放。 03 铺出去之后,智能体往哪跑?说出来细目惊到下巴,谜底藏在 Google 最老的阿谁居品里:搜索。 Google 我方给此次搜索框雠校下的界说是「标记性搜索框 25 年来最大的一次升级」;智远以为,这话有营销因素,但看完具体更动之后,如实不是小修小补。 先说一个数据: AI Mode 旧年 I/O 才发布,一年时期月活过了 10 亿。上线以来每个季度查询量翻一倍,上季度 Google 搜索的总查询量创了历史新高。 这个数字反直观,当年几年行业里一直有个叙事: AI 聊天机器东谈主会蚕食搜索,本体发生的正好反过来;东谈主们发现搜索能作念更多事之后,搜索量不降反升,并且涨得很猛。 新搜索框的变化从交互层就启动了,它会随着你输入的内容自动膨胀,容纳更长更白话化的问题。 本来的自动补全换成了一套 AI 驱动的查询提出系统,是帮你想了了你到底想问什么,同期相沿多模态输入,翰墨、图片、视频、Chrome 标签页皆能往里丢。 AI Overviews 和 AI Mode 此次合到一齐了,你问一个问题,看到 AI 概览,成功在原页面追问就滑入 AI Mode,高下文遏抑,越聊越深,推选的纠合和来源也越来越精确。5 月 19 日全球同步上线。 这些皆是居品层面的更新,真碰巧得扎眼的是搜索框里长出来的智能体。 Google 管它叫信息智能体,你不错在搜索里创建一个大致多个后台智能体,24 小时帮你盯着某件事。 比如: 你让它追踪某个规模的市集变动,智能体会我方制定监控接洽,决定该用哪些数据源,包括 Google 的及时金融数据、新闻、博客、外交帖子,条目触发的时候合成一份带纠合的更新推给你,今夏上线,先给 AI Pro 和 Ultra 订阅用户。
再往前一步,搜索里还接入了 Antigravity 的编程智商。 Google 管它叫生成式界面,你搜一个问题,搜索不单给你谜底,还能现场给你生成一个可交互的迷你哄骗。 台献艺示的例子是一个个性化健身哄骗,能接入及时天气、读你的日期、知谈你的饮食偏好,自动生成饮食接洽并附带食谱纠合。 这是搜索在帮你造东西。搜索除外,智能体也在进 Google 的其他居品。 Daily Brief 是 Gemini 哄骗里的第一个开箱即用的智能体。每天早上帮你整理收件箱、日期和待办,排好优先级,给出下一步提出。 它的前身是旧年 12 月在 Google Labs 上线的一个践诺神气 Cici,很快成了最受宽待的践诺之一,此次直汲取编进了端庄居品线。 长入购物车是购物场景的智能体,一个跨 Google 搜索、Gemini 哄骗、YouTube、邮箱职责的长入购物车,能追踪降价、监控库存、稽查价钱历史,以致能发现你买的电脑配件之间的兼容性问题。 Ask YouTube 再行界说了视频搜索,你问一个问题,它不给你一滑视频列表让你我方翻,而是成功跳到最有关的阿谁视频里最有关的阿谁片断。 把这些更新摊开看,一个论断就浮出来了。 模子竞赛时,比谁的基准分数高,纯 AI 公司和平台公司站在归并齐跑线上。 智能体竞赛的逻辑十足不同,智能体要纠合真实的邮箱、日期、文档、购物车、搜索历史、视频库,谁手里有这些东西,谁就有先天上风。 Google 有 13 个居品逾越 10 亿用户,5 个逾越 30 亿。这不是本领能补的差距。 Anthropic 和 OpenAI 不错作念出很好的模子,不错作念出很好的智能体框架;它们作念不出邮箱,作念不出搜索,作念不出 YouTube。 这是 Google 在智能体时间最大的资本,亦然这场 I/O 的确确讲的故事,模子再强也拼不外管谈有多粗。 04 管谈粗,得有东西在底下撑着。 Pichai 在 keynote 后半段把话题转到了基础设施,开首就甩了一个数字:2022 年 Google 的资本开支是 310 亿好意思元,本年瞻望 1800 到 1900 亿。6 倍。四年时期。 这笔钱的一大块砸在了自研芯片上,Google 发布了第八代 TPU,第一次作念了双芯片单干。 TPU 8t 专作念测验,原始算力接近上一代的 3 倍;TPU 8i 专作念推理,速率拉满,两颗芯片的性能功耗比皆提高了约 2 倍。 测验这边还有一个值得单独讲的变化。 Google 我方搞了一套测验革新框架,测验任务能跨好几个数据中心跑,全球革新逾越 100 万颗 TPU。Pichai 管这叫「宇宙上最大的测验集群」。 这意味着测验不再被一个机房的物理上限卡住,模子越来越大,测验周期从几个月压到几周。 推理这边,TPU 8i 的联想地方就一个字,快。Pichai 原话提到,Google 作念了 27 年搜索,学到的最深的一课即是蔓延很热切。 3.5 Flash 每秒 289 个 token 的输出速率,底下撑着的即是这套推理芯片。 把上头几段的逻辑串起来:3.5 Flash 的速率和价钱不是假造来的,是 1800 亿好意思元的资本开支、自研芯片、全球分散式测验集群共同托出来的。 纯 AI 公司不错在模子层追上来,基础设施层想追上,难度高了一大截。这是另一层「管谈」。 05 终末一块拼图是 Gemini Omni,这趴是 DeepMind 的 CEO Demis Hassabis 躬行上台讲的,重量够重。 Omni 颖异啥?你给它什么,它给你什么,先从视频启动,以后图片和翰墨也会跟上来。 2026世界杯中国压球官网第一款上线的叫 Gemini Omni Flash,5 月 19 日启动在 Gemini 哄骗、Google Flow 和 YouTube Shorts 里能用,系数生成的内容自带水印。 3.5 Flash 处理的是「让智能体跑起来」,Omni 指向的是更远的事:让 AI 不光会写字,还会造东西。 Omni 不是一个安靖的新东西,以前 Google 的 Veo 管视频生成,Nano Banana 管图片裁剪,各管各的,互不搭嘎;Omni 把这些全塞进 Gemini 一个框里了。 你上传一段我方拍的视频,说一句话让它改,它就能改里面正在发生的事,加个东谈主进去,换个作风,时期线还给你接得上。 大致你纯用翰墨态状一个倡导,Omni 成功给你生成一段带画面带声息的视频。 这个智商单看是个很强的演示,放回整场 I/O 的逻辑里看,它在讲一件更大的事。 我翻了一下时期线: 本年 4 月 29 日,OpenAI 把面向消费者的 Sora 2 哄骗关了,只留了付费 API;情理是基础设施成本和分发战略要调节。11 天之后,Google 的 Gemini 哄骗里启动出现 Omni 的影子。 归并个地方,一家因为扛不住成本退了一步,另一家采取往前走。 两家濒临的本领艰巨差未几。离别在哪?Google 有自研的 TPU 推理芯片压成本,有 Gemini 哄骗 9 亿月活分担算力,有 YouTube Shorts 这种现成的台子来消化视频生成的产能。 OpenAI 莫得;这不单谁的模子更好的问题,是谁的结构撑得住。 把整场 I/O 从新到尾串一遍,Google 讲的就一件事: 模子层,3.5 Flash 用速率和价钱把智能体的成本压到谁皆接得住的位置。 居品层,Spark 给等闲东谈主,Antigravity 2.0 给活动员,搜索里长出来的智能体和生成式界面把搜索酿成了进口,长入购物车把智能体塞进了真实交游。 基础设施层,1800 亿好意思元的资本开支、第八代 TPU、百万颗芯片的测验集群在底下兜着;每一层皆不是孤苦存在,属于一个系统里的不同齿轮。 Pichai 在 I/O 前的小领域疏导里说过一句话: 咱们为什么这样执着于作念出既强又快又低廉的前沿模子,因为咱们要把它带给尽可能多的东谈主。这是咱们真实会发光的地方。 这句话的潜台词不难读,Google 以为智能体时间的终局,是谁能把好的模子、大的管谈、深的地基绑在一齐,让智能体的确跑进等闲东谈主的生涯。 当年两年,纯 AI 公司掌捏着行业叙事的主场,这场 I/O 之后,一个老问题值得再行想想: 当竞争从「作念出最佳的模子」酿成「让智能体跑进真实生涯」星空体育(StarSports)官方网站,窗口在给谁大开,又在给谁关上。 |






备案号: