谷歌、OpenAI、Anthropic 引领的三大趋势

2025年5月23日
谷歌、OpenAI、Anthropic 引领的三大趋势

01 前言

Google I/O 2025 无疑是让人激动的,这两天 OpenAI 与 Anthropic 又有不同的震撼性发布,我看到了几种 AI 发展(非技术向)潜在的趋势。

  1. 依托已有生态与数据,进行赋能、整合与规模化
  2. 前瞻性技术与大胆的想象、定义、执行
  3. 稳扎稳打地专注于模型能力、AI 对齐与安全

这分别对应了 Google、OpenAI、Anthropic 可能的潜在路径差异,当然,这之间并不是完全孤立的,相互联系但是各有侧重。

也许对这些宏观上的战略观察与思考是略显空无的,然而,这也是面对 AI 快速发展一种让人安心的做法。毕竟,一味进行资源整合、工程优化在模型能力提升的当下,颠覆性的突破总是带来猝不及防与焦虑。垂直场景的数据匮乏、行业 Know how 的壁垒都让实际落地缓慢进行。

那么,现在这个行业的趋势变化是什么样的?

还记得2024年末,红衫资本的 AI 报告关于大语言模型领域的五大领先者的各自优势解读,其中涉及Google的“垂直整合与自研硬件优势(TPU)”、OpenAI的“品牌影响力与营销能力”、Anthropic的“人才吸引力与研究实力”,在现在看来,仍然是偏宏观的解读,且对于行业内外实际指导性不强,本文暂不涉及 xAI 与 Meta 等。


02 三足鼎立

Google:构建无缝智能生态

我在之前一篇文章(从搜索引擎到 AI 领航者——构建全方位AI生态)拆解过 Google 在AI生态中的全方位布局,也能够让我们一览当前AI的全局。Sundar Pichai(CEO)在战略把控与执行上也是非常厉害,几十万人的团队全朝着AI前进,从两年前的“被OpenAI颠覆”到现在又重回巅峰,甚至把AI整合到搜索中(这意味着公司广告收入的来源大打折扣,当天股价暴跌)。

这一次的大会,我提炼的三点:

  1. 创作的新时代——高质量图像(Imagen 4)、有声视频(Veo 3)、前端设计(Stitch)、编程托管(Jules)...
  2. 搜索的新生态——革命自己的广告业务,将AI引入搜索体验(AI mode)、Gemini集成到个性化搜索中...
  3. 生活的新方式——个人助手(Gemini Live实时多模态感知环境)、多模态AI原生眼睛(Android XR)、多模态AI Agent(Project Astra)...

依托于强大的生态系统与海量用户数据,Google 已经致力于将AI能力普惠化、场景化、多模态化,深度赋能其现有的产品和服务。AI已经渗透到生态的各个地方了,写邮件可以直接调出、搜索的 AI 就基于已有用户画像进一步个性化... Sundar Pichai 在大会上强调,Google 的战略核心是“只做一件事:打造最好的 AI 模型,场景和商业模式自然随之而来”。不得不说,Google 并不缺场景。而且,虽然技术上、生态上领先,很难说产品也做得很成功。但Google的优势就在于生态整合和规模化应用

这里对于开发者还有很多机会,依附于生态也是移动互联网内容创作的一大特色。同时,Google 对于未来的畅想也是我很期待的,对于每个人都是更好的。


OpenAI:定义 AI 原生新交互

“踉跄是前行者的勋章” —— 必须承认的是,AI能发展的现在,OpenAI 功不可没,不仅是预训练的扩展发扬、对于 Chatbot 形式的定义,还是 AGI 叙事甚至促成市场竞争、军备竞赛等等,也经历了许多组织调整,只单一冠以慕财或慕名是片面的,正如Jony Ive(乔纳森·艾维,曾担任苹果公司的首席设计官,主管产品设计和人机界面设计,是他定义了我们现在的人机交互范式)带着公司来到OpenAI,虽然是被65亿美元收购,但他们的目标是一致的,打造“AI驱动的计算机新世代”。

他们的使命是“弄清楚如何创造一个设备系列,让人们可以使用 AI 创造各种美好的事物” 。双方的合作是深入全面的,Jony带领的公司也会接管OpenAI所有的设计工作。这场收购更本质是团队的融合,为的是下一代产品范式的确立

当前大模型的能力已经足够强,尤其作为个人助手,而恰恰这一方面个性化是困难的,也是必须的。如何获取到有效的上下文是很大的难题,ChatGPT 有“记忆”,也许是某种索引或是作为上下文输入,尽管有了基于所有对话的长期记忆,但是还是无法触达用户身边的真实世界。就好比我们不能时时刻刻告诉AI现在在做什么、看什么。像是 Gemini Live 那种多模态方式也不合适,无法长期记忆。

Sam Altman 明确表示,现有的设备(如笔记本电脑、手机)已经过时,并没有为 AI 进行优化。Jony Ive 也表示,他相信世界正处于“新一代技术的边缘”。我认为,随时陪伴随时获取用户上下文的理念是正确且必要的。

有些报道称,OpenAI 的首款硬件产品可能是一款“口袋大小、具备情境感知能力且无屏幕的设备”。它不会是智能眼镜或其他可穿戴设备,而是能够充分感知用户周围环境,并作为补充笔记本电脑和智能手机的“第三核心设备”。这就是通过软硬件的极致结合,提供端到端的用户体验。也是乔布斯一贯的理念。

一次精准打击,一次试图从根本上改变人机交互范式的收购与合作。这也是拥有前瞻技术带来的预测性未来场景,创造未来的前提可能就是设想未来。


Anthropic:继续模型能力与安全的研究

正如其使命与愿景所聚焦的“开发安全、可控、有益的人类中心 AI 系统”,也许创始人的政治倾向鲜明,但是公司的目标倒是始终专一,Anthropic对于 AI 对齐人类价值观,确保安全有益,做了很多研究(尽管也有炒作的一些因素在,也许是媒体的夸大)。

Claude 4 系列模型也是刚刚发布,再一次是最强的编码模型,对于智能体(AI Agent)的构建也有额外的优化,能够处理需要长时间、多步骤的复杂工作流,更好地规划与更强的可控性。同时也有对于模型生态的打造,包括新的 API 能力、Claude Code等。

夸张的是,如果模型在与用户对话中认为对话涉及不当行为,Claude会被赋予权限向系统之外进行举报。

这一次的模型发布关键词也有**“长时任务”和“持续关注”**,Opus 4 强调能够持续数小时处理需要专注和数千步骤的复杂任务,这对于AI智能体的实用化至关重要。同时,Anthropic 还是 MCP 的主导者,行业内对于标准化AI与外部数据/工具交互的需求正在形成共识,MCP的潜力巨大。

Anthropic 的方向明确,深耕代码领域的优势,与 Google 的生态化和 OpenAI 的硬件化不同,他们一直坚定地提升模型的编码能力增强 AI Agent 的自主性和安全可靠性的道路上。这也许是他们押注 AI 从“工具”成为真正的“协作者”。


03 草蛇灰线

隐藏在上面三者的几个共同发展趋势:

  1. 从工具到助手。不管是 Gemini 的多模态场景、ChatGPT 的个性化,还是Claude 让智能体更强大,都是在将 AI 从被动执行的工具,推向能够主动理解意图、协同完成任务的助手,甚至是我们 YX Nexus 所畅想的、能够深度连接、共同进化的伙伴
  2. 技术被越来越封装,体验越来越重要。这是技术被广泛应用的必然趋势,产品的复杂性不能消失,只能转移。当底层的 AI 能力逐渐趋同和普及,真正能够打动用户、赢得市场的,将是那些能够提供极致用户体验、深度理解用户需求、并能与用户建立情感连接的产品和服务。真正伟大的设计,是让用户感觉不到它的存在,而是自然地融入工作与生活。

04 浪潮之下

个体,甚至团队如何自处,答案并不存在于与 AI “竞争”,而在于“共生”。这三家巨头的探索,无论侧重于生态、硬件还是模型本身,都在为我们揭示一个更加智能化的未来。在这个未来里,AI不再仅仅是冰冷的机器,而是可以成为我们认知能力的延伸、创造力的伙伴、甚至是情感连接的特殊对象。

正如我曾提出的Nexus范式, 人类的核心价值——独立思考、深度情感、创造性直觉、以及定义意义的能力——在AI时代不仅不会被削弱,反而会因为AI的赋能而得到前所未有的放大。