Gemini 3.5 Pro 全网首曝:编程追平 GPT-5.5,谷歌全时 Agent “Spark“ 能替你下单花钱
Gemini 3.5 Pro 全网首曝编程追平 GPT-5.5谷歌全时 Agent “Spark” 能替你下单花钱一、事件速览2026年5月15日谷歌 Gemini 3.5 Pro 提前曝光。代号「Cappuccino」的新模型检查点已经开始产出并首次以 3.5 版本号亮相——从 3.2 直接跳级命名显然谷歌想在 I/O 大会上讲一个更大的故事。同期泄露的还有全时 AI Agent「Gemini Spark」——一个 24/7 全天候运转的 AI 管家能帮你管邮件、跑任务甚至可能在未经你许可的情况下替你下单购物。二、Gemini 3.5 Pro 性能解析2.1 编码能力根据知名爆料人 Alex Heath 的独家消息新款 Gemini 在编程能力上最多追平 OpenAI 的 GPT-5.5。这对于 DeepMind 团队而言是一个重要的里程碑——过去一年Claude 在开发者群体中已经坐稳了默认选项谷歌的 AI 编程平台 Antigravity 虽然内部使用广泛但在外部市场一直没能突围。4 个月仅 6% 的开发者采用率与 Claude Code 和 Codex 的势头形成鲜明对比。2.2 SVG 和多模态生成网友 Lentils 放出的测试显示Gemini 3.5 在 SVG 生成上有了质的飞跃。以前 Gemini 的 SVG 输出被社区诟病为「懒」——给一个 prompt 只出一个敷衍结果。但新版本只需一个简单提示就能直接输出 4 个风格各异、细节拉满的 SVG 图像。更令人惊喜的是它还能生成完整的交互式 Web 应用。从 DualShock 4 手柄的交互式蓝图拆解到鹈鹕骑自行车的矢量插画带 7 维定制面板——车架颜色、光照、头饰、篮筐内容、蹬车速度全部实时可调这已经不仅仅是 SVG 生成而是一个 prompt 就能生成的完整交互式应用。2.3 Flash 版本表现Abacus.AI CEO Bindu Reddy 放出的评测数据很亮眼3.2 Flash 在编码和推理上达到 GPT-5.5 的 92%成本却便宜 15 到 20 倍。LM Arena 的匿名跑分也显示3.5 Flash 在 SVG 生成、交互式 3D 编码和动画处理上已经超过了 3.1 Pro。这意味着谷歌的蒸馏加稀疏化技术正在收获回报——把前沿模型压成轻量版质量却没有出现断崖式下降。三、Gemini Spark24/7 全时 AI Agent3.1 功能定位Spark 的定位是「你的日常 AI 智能体全天候待命」。它能处理收件箱自动分类、回复、归档邮件执行在线任务预订、购买、填写表单管理多步骤工作流跨应用协调复杂任务持续学习基于你的使用习惯不断优化3.2 数据来源Spark 的数据来源清单令人瞩目已连接的 Google 应用技能模块聊天记录定时任务你登录的网站Personal Intelligence位置信息Gemini 会把你的姓名、联系方式、文件、偏好等信息分享给第三方来完成任务。为了保持会话连续性系统还会保存远程浏览器数据包括登录凭证和远程代码执行数据。3.3 隐私争议最让人关注的是Spark 虽然设计上会在敏感操作前征求许可但它「可能在未经询问的情况下分享你的信息或完成购买」。也就是说它可能不问你就下单也可能不问你就把信息分享出去。这正面对标了 Anthropic 即将发布的托管 Agent Conway以及 OpenAI 已经上线的 24/7 Agent 平台。四、三巨头军备竞赛全景当前 AI 领域的竞争态势已经进入白热化阶段公司策略关键优势OpenAI迭代速度碾压三周一个新版本Codex 追加 ultrafast 模式速度提升 2-3 倍。祭出补贴战——30 天内切换的企业 2 个月免费3 小时内 2000 名开发者响应Anthropic模型质量封神Mythos 重新定义了前沿AISI 评测显示它是第一个同时通过两套网络安全测试范围的模型Google分发 Agent 包抄10 亿级分发入口 Spark 全时 Agent把 AI 塞进 10 亿人的手机里五、技术趋势分析5.1 MCP 第三方工具接入根据网友 Fandu 扒到的模型选择器最新界面新款 Gemini 很可能原生支持MCPModel Context Protocol第三方工具接入。界面中新增了「MCP Tool Testing」分类即「可用于 MCP 工具测试的模型」。同时思维模式也从原来的独立 Thinking 模式变成了全局开关Standard适合大多数问题Extended求解复杂问题5.2 编程竞争的白热化AI 编程已经彻底出圈。不管是 Claude Cowork 还是 OpenAI 的 Codex都能让不会写代码的人用得飞起——产品经理用自然语言描述需求直接得到可运行的原型设计师把 Figma 稿丢进去拿到前端代码。然而谷歌到目前为止都没有任何产品能够进入这个对话。Antigravity 的定价策略也让开发者头疼——从免费预览到信用点制度社区论坛上关于额度用完没提醒的抱怨一直没断过。5.3 通往 ASI 的飞轮GPT-5.6 的开发几乎可以确定是在 GPT-5.5 的深度参与下进行的。AI 写的代码反哺 AI 的训练——谁掌握了编程工具的用户谁就掌握了这个循环的加速器。三家在三条赛道上同时踩油门没有人在减速。通往 ASI 的飞轮已经开始自转了。六、对开发者的启示编程工具的切换成本在降低随着补贴战升级三巨头都在砸钱抢开发者现在是切换和试用的最佳时机Agent 场景即将爆发从 Spark、Conway 到 Codex 的 24/7 Agent 平台AI 从「回答问题」进化到「替你完成工作」隐私安全的权衡全时 Agent 需要海量数据权限开发者需要重新思考数据主权和隐私保护策略多模态能力进入实用期从 SVG 到完整 Web 应用AI 生成的内容质量已经接近可用水平本文发布于 2026 年 5 月 16 日。参考来源新智元、36氪、Alex Heath 爆料、Abacus.AI CEO Bindu Reddy 评测数据。

相关新闻

最新新闻

日新闻

周新闻

月新闻