一家数据标注公司,估值追上百度和理想汽车
创始人
2025-06-26 00:21:04

一提到“数据标注公司”,外界的印象通常是:

技术含量低、工作内容重复枯燥、依赖大量低成本人力完成简单机械的标注任务,例如给图片打标签、文本分类或音频转录。这类公司被视作AI产业链底层“苦力”,利润微薄、附加值低,很难形成核心竞争力或行业话语权。在公众眼中,它们更多是幕后无名的外包工厂,而非高科技创新企业。

不过,随着一笔硅谷投资交易浮出水面,你可能要重新构建对数据标注公司的价值评估了。

据多家媒体报道,6月中旬,Facebook母公司Meta出资143亿美元(约合人民币1028亿元)获得数据标注公司Scale AI的49%无投票权股份,将后者的估值一举推高到了290亿美元(约合人民币2082亿元)

你可能对290亿美元的估值没有概念。截至6月20日收盘,百度和理想汽车的市值分别是287.5亿美元和263.6亿美元。

这是Meta历史上第二大投资,仅次于2014年以190亿美元收购WhatsApp。作为交易的一部分,Scale AI创始人兼CEO Alexandr Wang在保留原公司董事会成员身份的同时,也将携部分公司成员加入Meta。

一石激起千层浪。

得知这一消息后,包括谷歌、微软、OpenAI、马斯克的xAI等在内多家AI巨头先后表示计划撤出与Scale AI的合作。而Scale AI空出的订单,正被一众同行疯抢。

一家数据标注公司何以卖出千亿,Meta这次的大动作背后,藏着多少AI巨头们残酷争斗的暗线?

一、何以估值2000亿?

算力是AI军备竞赛中的关键战略资源。要下场做大模型就得囤显卡,已然成为了一个共识。但易为人忽视的是,训练数据的质量决定了模型能力的上限,它与囤卡同样至关重要。

打个比方,如果说大模型是一个勤奋的学生,训练数据就相当于它的教材。只有给大模型投喂高质量的数据,大模型才能够给出真实、准确、全面和符合伦理的回答。反之,则会越学越糊涂,无法提供符合预期的输出。

流传于业内的一句俗语说,“垃圾进,垃圾出”,说的就是这个道理。在Scaling Laws逐渐失效,靠算力和模型规模硬解的打法陷入瓶颈的当下,提高数据质量有时甚至能起到点石成金的奇效。

以往,数据标注工作主要集中在文本、图像和音视频等方面。但现在的数据标注开始变得更为复杂。随着行业转向带有“思维链”的推理模型,专家数据成为了AI巨头们眼中的金矿。

这也是为什么如今的AI标注团队里,你不仅能看到完成单调原始工作的合同工和外包人员,有时也会看到不同学科和领域的专业人士。他们会写下解决复杂问题所需要的思考步骤,辅导大模型模仿人类的思考方式。

Scale AI的商业模式,正是为客户提供数据标注解决方案。通过Remotasks和Outlier AI这样的平台,他们招募并管理着全球数以十万计的劳动力。同时,他们也开出不菲的时薪来吸引计算机科学、数学、自然科学、社会科学等专业的博士来撰写语料。

但若只是如此,Scale AI和市面上其他的数据标注公司并没有形成差异。

这家公司的真正优势在于,通过AI辅助的自动化标注能力和成熟的平台体系,他们能够高效且灵活地满足不同客户的定制化需求,从一家单纯的数据标注公司,一跃成为能够深度参与数据管理与模型训练流程的数据基础设施企业。

此前,Scale AI已经赢得了Meta、OpenAI、Google、微软和美国政府等大金主的订单。这些顶级客户不仅为Scale AI带来了不菲的收入,也为之提高了声誉,给估值的水涨船高提供了背书。

2024年,Scale AI的营收达到8.7亿美元,其估值在与Meta的交易之前就来到了140亿美元。

二、Meta下场,谷歌们“割席”

Meta拿下Scale AI的49%股份,最显而易见的收获当然是后者在数据标注业务上的能力。

有了Scale AI的加持,Meta可以依托前者现有的平台,建立起一个大型的高质量数据标注网络,助力自家大模型Llama的开发。

今年4月初,Meta发布了最新开源大模型Llama 4,可它却完全没有了前代产品的惊艳,不但在实测中表现平平,甚至还被爆出了疑似在基准测试中作弊的丑闻。而其旗舰模型Behemoth一再推迟发布,至今难产。

Llama 4的发布计划中包含Behemoth、

Maverick和Scout三款模型

图源:Meta

如果能够通过训练数据质量的提升来改善模型的真实水平,或许可以拯救Meta在开发大模型这一战线上的颓势,缩小与OpenAI和Anthropic等对手的身位差距。

不过,光看这一点,可能还无法解释Meta为何愿意按照Scale AI一年前估值(140亿美元)的两倍来出价,尤其是考虑到从2023年到2024年,Scale AI的营收不过从7.6亿美元提高到8.7亿美元。

有业内人士猜测,除了抢占大模型训练数据这一座山头之外,Meta对Scale AI的这笔大额投资,其实还有通过Scale AI了解对手研发动态的目的。

正如Handshake(Scale AI的竞争对手)的CEO Garrett Lord所说:“如果你是通用汽车或丰田,你不会希望你的竞争对手走进你的制造工厂,看你的流程是如何运转的。”

虽然Scale AI作为一家数据标注公司无法接触到大模型的核心算法,但他们有机会从接触到的数据和产品模型对客户的商业战略和研发重点进行了解。

可能正是出于这样的担忧,尽管Scale AI的发言人Joe Osborne在一份声明中表示“公司将继续保持独立”,多家主要客户(包括谷歌、微软、OpenAI、马斯克的xAI等)都决定退出与Scale AI的合作。

Scale AI在其官网列出的部分客户名单

图源:Scale AI

这其中,谷歌作为Scale AI的最大客户,原本计划在今年支付2亿美元购买人工标注数据。去年Scale AI 8.7亿美元的营收中,谷歌一家就贡献了1.5亿美元。

AI巨头们果断切割的想法其实很好理解,与Scale AI的合作涉及高度敏感的商业机密,他们不可能放心将这些交给Meta大额持股的公司。

当下,各家数据标注公司还在鲶鱼抢食,冀望吃下Scale AI “被分手”以后空出的订单量。Handshake一夜之间订单量激增到原来的三倍,Labelbox的CEO则表示,该公司可能会从Scale AI的老客户那里获得数亿美元的收入。

Scale AI将如何度过这一波用户流失潮,目前还不得而知。但这笔交易可能会成为数据标注行业的转折点。可以预见的是,AI巨头们要么会加大投入去养自家的数据标注团队,要么就会将需求分散到多家供应商。

无论哪种模式下,数据标注行业或许将很难再滋养出一家超大公司——AI巨头们不会允许自己的数据供应链被一家独大的供应商拿捏。

三、AI大战来到新高度

仅从账面上看,Meta花费如此大的代价投资Scale AI,算不上是一笔好买卖。

Scale AI原本被看好在2025年实现20亿美元的营收,但在流失了多家重量级客户之后,哪怕汽车自动驾驶和政府业务相关的客户全部留下,要达到这一业绩也难度颇高。

而其290亿美元的天价估值,也将在对客户的吸引力下降后冷却下来。有媒体报道称,Scale AI的一位早期投资者已经萌生了套现离场的想法。

很难想象Meta会对这样的业界反应毫无预料,但或许从一开始,Meta就没有带着要在财务投资中获利的心态去做交易。

Meta真正的意图是什么?他们想要的不仅是Scale AI,还有Scale AI背后的领路人Alexandr Wang。

类似的“招聘式投资”近些年在硅谷早有先例。

去年,微软花费6.5亿美元,换来AI初创公司Inflection的软件授权,并聘用了该公司包括老板Mustafa Suleyman在内的大部分员工。在一笔类似的操作中,谷歌以逾20亿美元的估值投资Character.ai,好让后者团队中的30人加入Gemini的开发。

对于规模庞大、组织僵化以至于缺乏创新土壤的大公司来说,直接以这种方式引入经过市场验证的人才,也不失为一种破局的手段。

Meta确实也十分看重Alexandr Wang的加盟,他们一度想授予这位年轻人“首席AI官”的头衔。接下来,Meta计划让他担任新部门“超级智能(Superintelligence)”的高级岗位,直接向扎克伯格汇报。

有趣的是,虽然Alexandr Wang即将成为”超级智能“实验室的领导者,但他却并非科班出身的研究人员。

2016年,年仅19岁的Alexandr Wang在用AI摄像头来监控冰箱库存的尝试中,发现了AI数据标注的巨大商机,当年他就从MIT辍学并创立了Scale AI。

在经历了初期的探索后,这家公司开始专注于与自动驾驶相关的数据标注工作,随后又开始将业务重心转向生成式AI。24岁时,Alexandr Wang成为全世界最年轻的白手起家亿万富翁。

Alexandr Wang也以其过人的社交能力在圈内著称,OpenAI的CEO Altman就和他关系密切。Scale AI能够接连从AI巨头和美国政府手里接下订单,与Alexandr Wang强大的人脉也不无关系。

此前,据Altman爆料,Meta曾拿出1亿美金的签约奖金到OpenAI撬墙角未果。随着Alexandr Wang的加盟,Meta不但完成了一次顶级人才的重磅引进,也给后续继续招兵买马增加了砝码。

在对元宇宙的巨额投资收益惨淡,大模型研发又开始落后于头部对手的当下,Meta试图通过“超级智能”弯道超车以夺回AI大战主动权,也不失为一次富有魄力的尝试。

买数据、挖情报、抢人......Meta通过对Scale AI的收购,已经将硅谷的AI大战带到了新的高度。不管接下来还有什么精彩戏码上演,这场大战还远远没有迎来拐点。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

相关内容

热门资讯

沪指本周震荡走高,上证50ET... 本周,上证50指数、上证180指数均上涨0.6%,上证中盘指数上涨0.2%。 每日经济新闻
PTA:7月10日基差走弱,供... 【7月10日PTA市场多因素影响行情】7月10日,PTA期货随成本端震荡收涨,现货市场商谈氛围一般。...
江南化工:7月10日召开董事会... 每经AI快讯,江南化工(SZ 002226,收盘价:5.62元)7月10日晚间发布公告称,公司第七届...
在中国,为什么两个CEO往往管... 文 | 镜相工作室,作者 | 阮怡玲,编辑 | 卢枕 随着喜马拉雅“卖身”给腾讯音乐,又一家采用联...
亚朵运营物资大降价!为了留住加... 红星资本局7月11日消息,在价格战与同质化竞争加剧的多重压力下,连锁酒店行业还面临服务体验与成本效率...
卫龙新CFO余风年薪1373万... DoNews7月11日消息,7月9日,卫龙公告,执行董事兼首席财务官彭宏志因个人职业发展安排,将于8...
澜起科技:拟发行境外上市股份H... 证券之星消息,澜起科技(688008)07月11日在投资者关系平台上答复投资者关心的问题。 投资者提...
螺纹钢期货:主力涨1.06%,... 【7月11日螺纹钢期货主力合约震荡上行,机构给出后市操作建议】7月11日盘中,螺纹钢期货主力合约震荡...
拿地14天极速亮相,建发宁波海... 潮新闻客户端 记者 郑青青 近日,宁波海曙区HS07-02-18地块的项目设计方案公示,公示时间为2...
推进全球化战略,电池巨头欣旺达... 排队赴港上市A股公司名单将再添一员,7月2日,电池巨头欣旺达发布《关于筹划发行H股股票并在香港联合交...
山东神光:非农数据影响,黄金白... 山东神光:非农数据影响,黄金白银投资新机遇 非农数据,即美国非农就业人数报告,是全球金融市场最为关注...
深挖巴蜀文化时代价值,成都设计... 7月11日,中共成都市委十四届七次全会召开。 “非常振奋人心!”成都设计咨询集团有限公司党委书记、...
邮储银行App热推ESG产品吸... 21世纪资管研究院研究员 唐曜华 实习生 姜博文近期债市震荡、股市站上3500点,部分“固收+权益”...
好消息!新一轮消费补贴要来了 7月9日 吉林省商务厅网站发布 《关于征集“政银企”联动开展 购车贴息政策实施金融机构的公告》 拟定...
蓝思科技港股首日大涨9%后跳水... 截至2025年7月11日中午收盘,蓝思科技港股、A股股价分别报收于19.20港元/股和22.74元/...
掌舵三年半,浙商银行董事长陆建... “人事有代谢,往来成古今”,商业银行董事长因到龄,辞去董事长等相关职务,是再正常不过了。 昨日晚间,...
下半年经济风口:科技引领,多元... 2025 年已悄然过半,在这半年里,全球市场风云变幻,地缘政治环境的复杂波动、科技领域的突飞猛进以及...
北京建筑企业启动主板IPO,多... 瑞财经 严明会 近日,多维联合集团股份有限公司(以下简称:多维联合集团)在北京证监局完成IPO辅导备...
朱慧获批担任中广核财务公司董事... 中国网财经7月11日讯 今日,深圳金融监管局公布相关批复,核准朱慧中广核财务有限责任公司(简称“中广...
成华区文化创意产业协会秘书长姜... 7月11日,中共成都市委十四届七次全会召开,成都市成华区文化创意产业协会秘书长姜凯雯接受红星新闻记者...
英伟达市值一度破4万亿美元 人... 新华社北京7月10日电 美国芯片制造商英伟达公司的股票价格9日在盘中交易中一度冲高至每股164.42...
航天电子跌0.20%,成交额4... 7月10日,航天电子跌0.20%,成交额4.42亿元,换手率1.34%,总市值331.58亿元。 异...
ETF今日收评 | 稀土相关E... 市场全天冲高回落,三大指数小幅上涨。从板块来看,稀土永磁概念股集体爆发,券商、互联网金融概念股一度冲...
ESG年报解读|携程集团披露碳... 资料来源:携程集团2024年度可持续发展报告 编者按:ESG年报解读为搜狐财经及价值公司100联合发...
地通工业更换券商重启IPO辅导... 瑞财经 王敏 7月11日,地通工业控股集团股份有限公司(以下简称“地通工业”)在湖南证监局启动IPO...
飞书CEO谢欣称拿不下京东:大... 据晚点,在回答"有什么大客户是你一直想拿但没拿下来的"问题时,飞书CEO谢欣表示:"还是有的,比如京...
北京豪华公寓“量增价跌”、二季... 7月10日,仲量联行发布《2025年上半年北京房地产市场回顾》。报告显示,2025年第二季度,北京办...
银行板块盘中走弱,浙商银行领跌... 7月11日,银行板块盘中下跌1.5%,浙商银行领跌2.64%,华夏银行、民生银行、青农商行、张家港行...
ETF盘中资讯|英伟达市值站稳... 或由于英伟达登顶4万亿市值,“AI 投资热”再升温!今日(7月11日),重点布局国产AI产业链的科创...
香港高息ETF受追捧,收益最高... 随着美国总统特朗普实施关税政策带来不确定性,部分投资者忧虑下半年股市波动,并希望寻求具备稳定现金流及...