国内开源大模型对齐国际顶尖闭源模型:重新定义2025大模型竞争格局

01
不久前,国际顶尖投资机构——红杉资本发布的2024年度报告对2025年AI行业的预测可谓是众所周知。
在其中,关于AI发展的分析可以说是客观而全面的。然而,我却认为,这类以西方资本为中心的观点,未必能完全反映全球AI市场的多样性与发展趋势。
随着昨日DeepSeek-V3(以下简称V3)的发布更是似乎打破了这一报告中的一个预测。
2024 年,大模型竞赛的核心目标是达到 GPT-4 的水平。五家公司实现或接近实现这一目标,成为"最终竞争者":Microsoft/OpenAI、Amazon/Anthropic、Google、Meta 和 xAI。其他公司,特别是 Inflection、Adept 和 Character,已退出竞争。
02
我们先来看以下V3模型官方发布的测试报告(后续我会进行深度体验并给出评测与使用分享)。
先上论文链接:(以下图片为官方图片)
https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek\_V3.pdf

从这张图的对比,不难看出V3的多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并且在性能上与世界顶尖的闭源模型 GPT-4 及 Claude-3.5-Sonnet 相当。
在某些代码的测试中,V3甚至超过了上一代在代码方面表现最强的Claude-3.5-Sonnet(我们这里并不考虑o1,因其成本等方面的原因)。
03
由此,2025年的大模型格局有真的如红杉资本预测的那样吗?
事实上,当我们跳出资本视角来看这个问题时会发现,AI行业的发展正呈现一个更为复杂且充满变数的态势。红杉资本的预测虽然基于其丰富的投资经验,但显然低估了几个关键因素:
- 技术创新的不确定性。正如V3的突破所展现的,AI技术的演进并非线性过程。开源社区和新兴企业完全可能通过创新性的技术路线、训练方法或架构设计(或许未来基于新架构的模型将会更强,这是一个很大的不可预测性的可能)在某些领域超越现有巨头。
- 全球化竞争格局的复杂性。将竞争者限定在少数美国公司的视角,忽视了全球其他地区,尤其是中国在AI领域的深厚积累和创新潜力。事实上,从底层框架到应用落地,中国企业已经构建起相对完整的技术体系。后来者居上的可能更加明显了。
- 不能仅局限在模型的性能表现。临近2025,当我们在讨论新一年的AI格局时已经不能仅仅聚焦在模型能力上了(红杉资本的报告中也并没有这样做)。下一年,真正的竞争优势将来自于对垂直化场景的深度理解和优化能力、本地化的数据积累和文化适配(这一点我尤其看好)等等。
04
我认为,AI竞争的维度正在发生根本性转变:
- 从技术追赶,转向创新引领
- 从资本导向,转向价值创造
特别值得一提的是,在本地化这个维度,中国企业展现出了独特的优势。不仅体现在对本土市场的深刻理解,更体现在将AI与传统产业深度融合的能力上。这种优势,恰恰是纯资本视角往往会忽视的。(还是要以人民为中心)
期待未来更多的顶尖模型被开源。从某种程度上看,开源才是最安全、最有生命力的。
来自AI总结:
本文通过分析DeepSeek-V3的突破性进展,重新审视了红杉资本对2025年AI行业的预测。
文章指出,AI竞争格局正从单纯的技术实力比拼,转向多维度的综合能力竞争。特别强调了开源模式的重要性、本地化优势的价值,以及"以人民为中心"的发展理念。
这提示我们,真正的AI发展之路,不应被资本视角所限,而是要着眼于创新引领和价值创造,最终服务于人民的需求。