DeepSeek劝不了谷歌们
创始人
2025-02-06 09:46:10

过去一个月,DeepSeek以大约十分之一的训练成本,推出与OpenAI o1性能接近的开源模型R1,“小力出奇迹”的新范式震撼全球AI大模型行业。同时,外界对于大型科技公司动辄数百亿美元的AI研发开支,也产生了越来越多的质疑。

但被“DeepSeek冲击”吓了一跳的科技巨头,并没有因此改弦更张。相反,他们正挥舞着支票簿,试图靠疯狂砸钱,重新夺取AI大模型的制高点。

2月5日,谷歌母公司Alphabet发布2024年第四季度财报,营收和净利润均实现两位数百分比的同比增长。引人注目的是,Alphabet宣布,2025财年的资本支出将达到750亿美元(约合人民币5454亿元),以继续扩展其人工智能战略。

一年投入750个“小目标”研发AI,远远超出了华尔街599.4亿美元的预期。不过,谷歌有实力如此烧钱:截至去年底,它持有现金、现金等价物及有价证券约957亿美元。

稍早时候,谷歌还向AI明星创业公司Anthropic追加投资10亿美元。2023年至今,谷歌向这家公司累计投资35.5亿美元。

财大气粗的谷歌投身AI烧钱竞赛,其他科技巨头也不遑多让。

今年1月初,微软宣布将于2025财年投资800亿美元,建设AI数据中心。这笔投资创下了微软成立以来的单笔投资最高纪录。而在上一财年,微软的资本支出超500亿美元,大部分用于AI相关的基础设施。

社交网络巨头Meta在1月底宣布,公司将在今年投资600亿~650亿美元,并大幅扩张AI团队,以期实现Meta AI服务10亿人、Llama 4成为行业领先大模型的目标。Meta创始人扎克伯格称,今年将是“AI决定性的一年”。

OpenAI则拉上软银、甲骨文、微软、ARM、英伟达以及中东人工智能基金(MGX)等产业和投资巨头,预计投资5000亿美元,联手成立“星际之门”,这些资金将被用于数据中心等AI基础设施的建设与运营。

相比之下,国内科技巨头面向AI大模型的砸钱规模小了一个数量级,但也动辄数百亿元,且增长很快。

根据财报等公开信息,2024年前三季度,百度、阿里、腾讯的总资本开支约为人民币867亿元。金融数据服务商Visible Alpha预计,到2027年,BAT的资本支出将达到1767亿元,年复合增长率超26%。考虑到BAT的重视程度,这些资本开支将有很大一部分流向AI大模型。

不难看出,科技巨头发展AI大模型,砸钱仍然是基本武器之一。尽管DeepSeek证明了“小力出奇迹”的可行性,但巨头们出于多种原因,仍然沿着“大力出奇迹”的路线前行。

这并非仅仅是大公司的惯性使然。OpenAI刚刚发布的o3-mini,已经在物理推理等多项指标上反超R1,而更强大的o3标准版也已经箭在弦上。这也再次证明,“尺度定律”仍然是AI大模型的基本规则之一,而“小力出奇迹”并非置之四海而皆准。

尚未找到“金主爸爸”的DeepSeek,在算力、数据、资金和资源方面比不上巨头,正面临被后来者强行超车的危险。不过,R1的成功,也证明了“小力出奇迹”的可行性。在DeepSeek震动全球AI圈后,巨头青睐的“砸钱”与“小力出奇迹”的路线之争仍在继续,远未分出胜负。

面对快速崛起的DeepSeek,美国科技巨头表面上对其技术、产品和方法论赞叹不已,但在战略层面上,并没有对其“小力出奇迹”的策略亦步亦趋。

恰恰相反,在DeepSeek席卷全球AI大模型领域后,巨头们的砸钱迈向了新高度。

以OpenAI为例,奥特曼起初对于DeepSeek有所怀疑,称“并不新颖,我们早已具备这一水平的模型”,且“被严重夸大了”。OpenAI甚至在1月底表示,DeepSeek涉嫌使用OpenAI专有模型训练自己的模型,违反了OpenAI的服务条款。

但在短短几天后,奥特曼宣布没有计划起诉DeepSeek,同时称赞“DeepSeek是一个令人印象深刻的模型”。在推出最新的o3-mini模型后,奥特曼甚至表示,在开源方面,OpenAI一直站在“错误的一边”。

DeepSeek大红大紫,逼得奥特曼前倨后恭、低头认错,此情此景让不少人感到惊讶和振奋。但事实上,OpenAI无论是产品还是战略,都没有被DeepSeek这只“黑天鹅”所打乱。

1月底,OpenAI推出o3-mini,并首次向免费用户开放推理模型。测试表明,o3-mini相比上一代o1模型进步极大,多项基准测试表现优异;特别是面对高难度的物理模拟项目——如球体碰撞等,展现出对于R1及其他模型的碾压实力。

几天后,OpenAI又以o3模型为基础发布了Deep Research功能,号称可以在几十分钟内完成人类专家数小时的工作。在涵盖超3000道问题的综合测试“人类最后一场考试”中,Deep Research实现了26.6%的正确率,远超DeepSeek R1的9.4%。

o3-mini采用了许多与R1相同的技术,比如强化学习(RL)、稀疏化MoE、大量监督微调(SFT)等,最终成果也堪称惊艳。然而,Open并没有在研发范式上向DeepSeek靠拢,而是继续沿着“氪金”的路线狂飙。

就在拿出o3-mini对阵DeepSeek R1的同时,OpenAI高调宣布了5000亿美元的“星际之门”计划。该计划将在全美国打造20座超算中心;首期将投资1000亿美元,在得州建设10座数据中心。

尽管奥特曼的“一生之敌”马斯克火速赶来嘲讽,信誓旦旦地说“他们没有钱”,但星际之门的进展速度颇为惊人。计划公开几天后,奥特曼就晒出了“1号站点”的照片,称之为“宏伟而美丽的建筑”。

尽管星际之门得到了软银和甲骨文的鼎力支持,且去年营收已经高达37亿美元,OpenAI仍在继续储备资金。

据报道,OpenAI正寻求以3400亿美元估值融资400亿美元,软银有望领投。而在短短三个月前,OpenAI刚刚以1570亿美元的估值,融到了66亿美元。

奥特曼仿佛患上“资金短缺恐惧症”,一边疯狂融资,一边大手笔花钱。与之正面PK的其他科技巨头,砸钱同样毫不手软。

今年,谷歌、微软、Meta等均计划投入数百亿美元发展AI,力度之大远超华尔街预期。以Meta为例,扎克伯格计划斥资至少600亿美元,建设一座拥有130万块GPU的AI数据中心。

作为对比,据科技咨询公司Omdia测算,字节去年买了23万块GPU,且为性能较弱的英伟达特供版。即便如此,这一数字也远远超出了DeepSeek目前持有的芯片规模。

除了海外科技巨头,国内互联网公司也在AI大模型领域投入巨资。DeepSeek的“小力出奇迹”,并没有改写这一局面。

一度在AI大模型领域落后的字节,近两年洒下重金。浙商证券在一份报告中称,2024年字节资本开支约800亿元,接近BAT的总和。

另有报道称,字节2025年资本开支将超1500亿,大部分用于AI。字节方面随后否认了这一说法。

此外,字节持续“扫货”国内AI领域的顶级人才。据“财经天下”报道,字节某些AI方向的业务团队在招募知名院校的博士应届生时,年薪可达两三百万元,远超其他大厂的100万元左右。此外,张一鸣还亲自从阿里等对手那里挖人。

除了研发费用和人才成本,过去一两年,字节在B端和C端同时为AI烧钱,力图争夺更多企业和个人用户。

在B端,豆包大模型自去年5月发布之后不断降价,堪称国内AI大模型圈子的“价格屠夫”。据统计,豆包文字大模型比行业便宜99.3%,去年12月发布的视觉理解模型比行业便宜85%。

同时,在C端,豆包也在广泛投流拉新。据AppGrowing统计,去年4~5月,豆包投放金额预计为1500万~1750万元。6月上旬,豆包启动新一轮投放活动,投放金额高达1.24亿元。

在猛砸资金后,豆包的用户量猛增,成为国内用户最多的大模型应用。

阿里同样在AI大模型领域持续投入大笔资金。今年总台春晚,阿里云成为云计算AI独家合作伙伴。仅2024年上半年,阿里在AI基础设施上的资本支出就达到230亿元。此外,阿里花费超百亿元,投资AI创业公司“六小虎”。

腾讯方面,过去六年其研发总投入超2850亿元,其中很大一部分投向了AI。而在AI“六小虎”中,腾讯投资了其中五家。

仅就花钱力度而言,新BAT比不过谷歌、Meta、OpenAI,但依然是国内AI大模型圈独一档的存在。相比之下,一直没有融资的DeepSeek,仍然靠母公司幻方量化输血;但国内量化投资近年来处于行业谷底,DeepSeek能够得到的资金支持恐怕不会很多。

不过,面对DeepSeek的强势崛起,新BAT在继续大手笔投钱的同时,也试图伸出橄榄枝、构建“双保险”。

1月底、2月初,国内主要云服务厂商均宣布接入DeepSeek大模型。阿里云宣布支持云上一键部署V3和R1,百度智能云、腾讯云、字节旗下火山引擎等也先后宣布了类似功能。

众所周知,DeepSeek采用了最“慷慨”的开源协议,并不限制第三方对于自家开源模型的商用。阿里云等厂商第一时间接入DeepSeek大模型,能够借着后者的泼天流量,为自己争取一波关注度和新用户。

另一方面,向DeepSeek伸出橄榄枝,也侧面表明了大厂的心态:即便DeepSeek与自家AI业务存在竞争,也不妨先为我所用,并从中获得技术、产品等方面的启发。这些主动示好的举动,也为双方未来更大规模的合作留下了想象空间。

DeepSeek以“小力出奇迹”扬名天下,但目前为止,这一颇为性感的新范式并未得到国内外大厂的全面认可与接纳。砸钱、砸资源的“大力出奇迹”,依然是大厂参与AI大模型竞争的主要打法。

与此同时,随着竞争对手以新一代模型反击,叠加自身规模扩大导致的种种问题,DeepSeek正面临被全面反超的危险。

从产品上看,越来越多的用户发觉,DeepSeek的大模型幻觉频繁出现。无论是谈论从A到B的最佳路线,还是解析某一首歌曲,或分析某一专业话题,DeepSeek都存在较为严重的“一本正经地胡说八道”问题。

大模型的幻觉问题一直广泛存在,也是整个AI圈子始终未能克服的难题。DeepSeek在这方面并没有展现比其他模型更出色的性能,这折射出仅靠大模型工程层面的创新,并不足以攻克更基础的AI难题。

另一方面,短时间内疯狂涌入的全球用户,也让DeepSeek有些力不从心。

据统计,DeepSeek自上线各大应用商店以来,短期内获得1600万次下载,登顶140个应用市场,最高日活跃用户突破2200万。由于用户太多,DeepSeek的深度思考和联网搜索功能一度暂时停止服务。

这也表明,“小力出奇迹”或许可以大幅节约模型训练的成本,但在模型投入使用后,必要的基础设施成本仍然无法压减。

从商业角度来看,AI大模型注定是一门规模越大、能力越强、成本越高的生意。巨头们坚守“尺度定律”,其根基——算力、算法和数据三角模型依然稳固。

在DeepSeek崛起的过程中,一个被不少人忽视的问题是,R1的推理性能与o1不相上下,但在许多基准测试中不如o1。而箭在弦上的o3“满血版”,综合性能远超o1。和同期其他对手相比,比如谷歌的Gemini 2.0 Flash,R1也并非全面领先,而是与对手各擅胜场。

在专业人士眼中,R1的真正价值是,通过多种技术创新——比如强化学习、GRPO算法框架、DeepSeek MOE等,再加上优秀的工程思想,以较低成本在部分指标接近或超越了行业最强大模型。DeepSeek的“小力出奇迹”固然惊艳,但从来不是性能最强的大模型。

OpenAI刚发布的o3-mini,在许多测试中已经反超R1,也让国外巨头继续狂砸钱有了更坚实的证明。这表明,除了优秀的人才、出色的算法外,强大的算力、丰富的数据,也是构建更强大模型,乃至通往AGI的必经之路。

DeepSeek“小力出奇迹”证明了AI大模型的另一条发展路径,却并非唯一的路径。手握重金的科技巨头,依然是AI大模型的主要参与者,同时也是DeepSeek继续上攻的强大对手。

AI大模型远未分出胜负,DeepSeek及其拥趸不能“半场开香槟”。而高性价比路线与“大力出奇迹”路线之争,也仍将持续下去,并在互相借鉴和融合中,推动AI大模型迈向下一个发展阶段。

参考资料:

APPSO,《万字揭秘DeepSeek:顶尖AI人才年薪千万,训练成本被低估》

乱弹山,《我确实低估了DeepSeek所引发的大面积“AI幻觉”》

亿欧网,《特朗普孙正义组局,预砸5000亿美金建“星际之门”》

IT之家,《Meta宣布将打造拥有 130 万颗 GPU 的 AI 数据中心》

新智元,《o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测》

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

相关内容

热门资讯

财政部进一步加强国有商业保险公... 央广网北京7月11日消息(记者 马文静)日前,财政部发布《关于引导保险资金长期稳健投资 进一步加强国...
演讲实录|朱云来解析全球经贸格... 来源:市场资讯 当前,全球经贸格局正在经历深度的结构性调整,企业的全球化发展受到来自地缘政治、贸易壁...
银行股再创新高!42家A股银行... 来源:图虫 7月11日,银行板块再度走强,工商银行、农业银行、中国银行、建设银行四大行A股股价再创历...
郑氏点银:黄金留意3345,一... 郑氏点银:黄金留意3345,一旦站稳会继续拉升上攻 回顾昨日行情走势及出现的技术点: 第一,黄金方面...
上市券商迎中报预喜潮,国联民生... (图片来源:视觉中国) 蓝鲸新闻7月11日(记者 王婉莹)日前,上市券商陆续披露今年上半年的业绩预告...
瑞茂通涨1.31%,成交额1.... 来源:新浪证券-红岸工作室 7月11日,瑞茂通涨1.31%,成交额1.41亿元,换手率2.80%,总...
Shein希音已经以“保密形式... 据知情人士透露,Shein(希音)集团已以保密形式提交香港上市申请,标志着这家快时尚零售商向上市又迈...
国有商业保险公司长周期考核机制... 7月11日,财政部网站发布《关于引导保险资金长期稳健投资 进一步加强国有商业保险公司长周期考核的通知...
沪指本周震荡走高,上证50ET... 本周,上证50指数、上证180指数均上涨0.6%,上证中盘指数上涨0.2%。 每日经济新闻
PTA:7月10日基差走弱,供... 【7月10日PTA市场多因素影响行情】7月10日,PTA期货随成本端震荡收涨,现货市场商谈氛围一般。...
江南化工:7月10日召开董事会... 每经AI快讯,江南化工(SZ 002226,收盘价:5.62元)7月10日晚间发布公告称,公司第七届...
在中国,为什么两个CEO往往管... 文 | 镜相工作室,作者 | 阮怡玲,编辑 | 卢枕 随着喜马拉雅“卖身”给腾讯音乐,又一家采用联...
亚朵运营物资大降价!为了留住加... 红星资本局7月11日消息,在价格战与同质化竞争加剧的多重压力下,连锁酒店行业还面临服务体验与成本效率...
卫龙新CFO余风年薪1373万... DoNews7月11日消息,7月9日,卫龙公告,执行董事兼首席财务官彭宏志因个人职业发展安排,将于8...
澜起科技:拟发行境外上市股份H... 证券之星消息,澜起科技(688008)07月11日在投资者关系平台上答复投资者关心的问题。 投资者提...
螺纹钢期货:主力涨1.06%,... 【7月11日螺纹钢期货主力合约震荡上行,机构给出后市操作建议】7月11日盘中,螺纹钢期货主力合约震荡...
拿地14天极速亮相,建发宁波海... 潮新闻客户端 记者 郑青青 近日,宁波海曙区HS07-02-18地块的项目设计方案公示,公示时间为2...
推进全球化战略,电池巨头欣旺达... 排队赴港上市A股公司名单将再添一员,7月2日,电池巨头欣旺达发布《关于筹划发行H股股票并在香港联合交...
山东神光:非农数据影响,黄金白... 山东神光:非农数据影响,黄金白银投资新机遇 非农数据,即美国非农就业人数报告,是全球金融市场最为关注...
深挖巴蜀文化时代价值,成都设计... 7月11日,中共成都市委十四届七次全会召开。 “非常振奋人心!”成都设计咨询集团有限公司党委书记、...
邮储银行App热推ESG产品吸... 21世纪资管研究院研究员 唐曜华 实习生 姜博文近期债市震荡、股市站上3500点,部分“固收+权益”...
好消息!新一轮消费补贴要来了 7月9日 吉林省商务厅网站发布 《关于征集“政银企”联动开展 购车贴息政策实施金融机构的公告》 拟定...
蓝思科技港股首日大涨9%后跳水... 截至2025年7月11日中午收盘,蓝思科技港股、A股股价分别报收于19.20港元/股和22.74元/...
掌舵三年半,浙商银行董事长陆建... “人事有代谢,往来成古今”,商业银行董事长因到龄,辞去董事长等相关职务,是再正常不过了。 昨日晚间,...
下半年经济风口:科技引领,多元... 2025 年已悄然过半,在这半年里,全球市场风云变幻,地缘政治环境的复杂波动、科技领域的突飞猛进以及...
北京建筑企业启动主板IPO,多... 瑞财经 严明会 近日,多维联合集团股份有限公司(以下简称:多维联合集团)在北京证监局完成IPO辅导备...
朱慧获批担任中广核财务公司董事... 中国网财经7月11日讯 今日,深圳金融监管局公布相关批复,核准朱慧中广核财务有限责任公司(简称“中广...
成华区文化创意产业协会秘书长姜... 7月11日,中共成都市委十四届七次全会召开,成都市成华区文化创意产业协会秘书长姜凯雯接受红星新闻记者...
英伟达市值一度破4万亿美元 人... 新华社北京7月10日电 美国芯片制造商英伟达公司的股票价格9日在盘中交易中一度冲高至每股164.42...
航天电子跌0.20%,成交额4... 7月10日,航天电子跌0.20%,成交额4.42亿元,换手率1.34%,总市值331.58亿元。 异...