一人一周烧掉20亿Token,得到了三个“反常识”
创始人
2026-06-06 05:55:24

每天使用超过1亿Token这个现象并非个例。2026年,随着模型能力提升、Token价格下降,越来越多企业一线知识工作者开始像使用水电、流量一样消费Token

文| 《财经》研究员 吴俊宇

辑 | 谢丽容

一个人在一周之内烧掉超过20亿Token(词元)。

在2025年,这或许是一个不可思议的数字。当时在很多人的印象里,Token仍然是一种属于模型公司、云厂商和开发者的资源。

但过去一个月,《财经》研究员使用OpenAI旗下的代码生成工具Codex进行了一系列尝试。其中包括,搭建了一套覆盖亚马逊、微软、谷歌、阿里、甲骨文等主流云计算厂商的研究工作流。这套工作流其实是一个本地网页应用,它能够自动下载财报PDF文件,解析财报电话会内容,提取数十个财务指标,并自动生成图表。

在处理搭建工作流、生成报道图表等工作后,《财经》研究员的ChatGPT/Codex在5月24日-5月30日这一周消耗超过23亿Token。

Codex统计的Token使用情况

每天使用超过1亿Token这个现象并非个例。2026年,随着模型能力提升、Token价格下降,越来越多企业一线知识工作者开始像使用水电、流量一样消费Token。

《财经》近期密集调研了华为、阿里、腾讯、小米以及部分创业公司的多位一线产研、销售、运营人员。结论是,这些企业一线员工日均Token消耗量已经达到了1000万-3亿的规模。其中销售运营人员日均Token消耗量通常在千万级别。产研人员中等强度开发的日均Token消耗量达到了2亿-3亿,高强度开发可达到5亿以上。

在亲身体验和多方调研中,《财经》得到了一些“反常识”。

其二,Coding(写代码)正在变成像使用Word、PPT、Excel一样简单。代码生成能力越来越不稀缺,真正稀缺的是软件架构的设计和审美能力。

其三,最终真正决定Token利用效率的并不是模型,而是人。AI降低了执行成本,却放大了判断的重要性。

对重度开发者来说,OpenAI很便宜

OpenAI的官网API定价中,GPT-5.5这款最新旗舰模型百万Token输入/输出定价是5美元/30美元。这个价格远超大部分国产旗舰模型。以DeepSeek-V4-Pro为例,百万Token输入/输出定价3元/6元。GPT-5.5官网定价是DeepSeek-V4-Pro的至少10倍以上。

但根据《财经》实际测试,OpenAI旗下Codex 200美元/月的周额度耗尽后,实际使用量超过23亿Token。若按照相同使用强度持续一个月,套餐内的Token使用规模将超过90亿——百万Token价格仅为0.16元。实际使用价格仅有官网API价格的2%左右。

《财经》调研了多位使用Codex的中国开发者发现,Codex 200美元/月的套餐内Token总额度约80亿/月-200亿/月不等。且OpenAI偶尔会刷新额度(也就是把已经使用的Token统计归零,相当于免费赠送),实际Token单价低于大部分国产旗舰模型。这几乎等于是用200美元撬动了官网API超过1万美元的Token用量。

为什么会出现这种Token单价看起来“异常低”的情况?

OpenAI官网信息显示,截至2026年2月ChatGPT每天消息量约30亿条。照此估算,用户平均每天发送的消息仅为3.33条。

OpenAI不是根据单个用户的Token消耗量定价,而是基于整体用户池定价。OpenAI可以在大部分普通用户身上获得相对更高的利润率,补贴极少数使用Codex的重度开发者。

对OpenAI来说,Codex虽然利润不是最大的,但长远来看它是在投资开发者。

他此前号召企业内的开发者每天消耗10亿Token。在他看来,在没有每天亲自消耗过数10亿Token之前,很难真正理解大规模Token使用会带来什么变化。“当你不再时时刻刻担心 Token消耗,而是允许自己持续试验时,会探索出很多过去无法想象的应用和工作模式”

代码能力不再稀缺,软件设计能力才稀缺

AI Coding(AI写代码)正在变得像使用Word、PPT、Excel办公三件套一样简单。

这在今天也被称为“Vibe Coding”(氛围编程)。Vibe形容的是——用户不再需要掌握编程语言,只需要凭着感觉通过聊天描述目标,AI便会自动生成代码并完成执行。

让人人都能成为Builder(建造者、开发者)。这是亚马逊AWS内部长期在思考的问题。因为软件的本质并不是编写代码。它是把不同组件、模块按照一定规则组织起来,最终解决现实世界的问题。过去,这项工作需要专业程序员完成。今天,随着AI Coding能力提升,越来越多普通人也开始具备这种能力。

今年4月,亚马逊AWS技术副总裁Mai-Lan Tomsen Bukovec(美兰·汤姆森·布科韦茨)在一场小规模沟通中对《财经》表示,AI推理正在成为一种常态化的应用。用户不必成为AI专家,任何Builder都能通过API搭建推理应用。

今年5月,阿里公共云事业部总裁刘伟光在一次规模沟通中对《财经》表示,随着2025年末,基础模型的Coding能力跨越临界点,它带来了巨大的分水岭。越来越多没有代码基础的普通人、企业内更多不懂IT的业务人员都在成为云的直接用户。

以《财经》今年5月搭建的这套研究工作流为例,研究员在缺乏代码基础情况下利用业余时间使用Codex搭建。Codex在三周内生成了254个文件、共61289行代码。这个工作流收集了五家中美云计算公司过去24个季度的财报PDF、财报电话会资料,并且解析成了图表。整个工作流的搭建、重构耗费了超过40亿Token。

一位软件工程师对《财经》表示,在2023年之前,如果完全依靠人工开发,254个文件、61289行代码的系统通常需要数月时间完成。如果是一个人从零开始设计、开发、调试和上线,至少需要半年时间。

看起来,基础模型能力跃升,它让代码能力不再稀缺。那么真正稀缺的能力是什么?答案是软件的架构设计、审美能力。

多位软件、算法工程师对《财经》表示,AI Coding用来写小应用问题不大,但随着应用复杂性不断提升,软件的架构设计、审美能力、复杂系统的管理能力变得更加重要。

这就像每个人都可以利用砖块搭建起一面墙,甚至是一个简陋的房子。但没办法像建筑师一样根据图纸进行设计,画清楚承重墙、线路图,最终指挥施工团队把建筑建成。

这是《财经》用Codex搭建研究工作流后,用Codex绘制的一张系统工作图,这还只是展现了其中的50%。图中每一个方框都是一个模块,每一条线代表一次调用、一次数据流转或一次状态依赖。红框中的部分,存在明显设计缺陷,它已经成了一个难以理清的线团。它包含了多个分支、文件、接口、任务队列、图表生成和发布链路。

研究工作流的系统工作图,红框为存在明显设计缺陷的部分

这说明,代码人人都可以用AI写,但系统复杂性并不会自动消失。

AI可以在数周内生成数万行代码、数百个文件时,软件开发的瓶颈会变成架构设计和系统管理能力。因为设计架构的目标不是把代码写得更多。它需要决定哪些模块应该存在,哪些链路应该合并,哪些路径应该删除。

否则,代码越多,系统越像一张看不懂的网。随着代码规模不断变大,它会直接导致中后期每一次生成新的代码,都会造成新的Bug(程序错误)。每修复一处,都会牵一发而动全身造成其他模块的Bug。工程师将这种现象称为“耦合”。系统越复杂,耦合越多,每一次修复Bug都可能在其他地方产生新的Bug。

一位算法工程师对《财经》表示,他在日常工作中发现,现在AI生成的代码量已经远远超过人工写代码的阶段。2023年之前,工程师写代码时,每一行代码几乎都经过思考、调试和Review(审查)。但在今天,一次任务就可能生成数百甚至上千行代码,工程师很难逐行检查。因此,“以前最大的成本是写代码,现在最大的成本是理解代码。”

人,才是决定Token效率的核心因素

从技术角度来看,最常见的理解是,芯片性能、模型能力、Agent成熟度共同决定了Token的使用效率。工程师几乎每天都在技术细节中不断提升每一枚芯片的单位Token吞吐量。单位算力成本是在这个过程中不断降低的。

不过,这些只是技术层面的问题。技术很重要,但在现实世界里,真正决定Token效率的,仍然是人。好的工程师可以直接省钱,但不够好的工程师只会浪费算力。

AI效率变高之后,人的判断力变得更重要了。指挥AI朝着正确方向走,可以提升效率。但指挥AI朝着错误的方向走,只会加速浪费Token。

《财经》在搭建研究工作流的过程中,出现了两次大方向的重构——这导致40亿Token至少有20亿被浪费在探索试错、推翻旧方案,以及系统代码重构的过程中。

“事先把问题想清楚变得更重要了。做任何一次大功能的增减之前,都需要和AI讨论清楚需求,事先写好PRD(Product Requirement Document,产品需求文档)。”一位中国头部软件公司前CEO(首席执行官)对《财经》表示,这样Token效率才能更高。

一位算法工程师对《财经》表示,技术水平高的工程师可以利用AI把问题拆清楚、设定边界、持续复盘,用更少的Token去解决更多问题。但技术水平有限的工程师则是只能用AI反复试错、生成冗余代码,不断浪费Token。

2026年初,包括阿里、腾讯、小米、美团等大型科技公司几乎都在鼓励员工使用Token。少数公司的业务部门甚至制定Token消耗排行榜,激励Token消耗量最大的员工。

部分公司的技术部门,工程师每月消耗Token的API价格甚至已在万元以上。极端情况下,单个员工的Token成本甚至接近人力成本。

一家员工数超过30万人的国际科技巨头人士对《财经》表示,他所在团队使用的Token是无限量的。他的工程师同事长期使用Claude系列模型写代码,一周Token成本高达2000美元-3000美元。

多位科技公司产研、销售和运营人员今年3月-5月对《财经》表示,企业内大规模推广AI工具后,微妙的心理变化正在出现。公司一方面鼓励员工更多使用Token,通过AI沉淀工作流程、业务经验。另一方面,不少员工担心,原本依赖个人经验形成的“隐性知识”,正在被逐步转化为Agent可调用的Skill(技能),公司正在降低对人的依赖程度。

不过,这些鼓励员工消耗Token的试验很快撞墙了。《财经》了解到的情况是,近半个月包括腾讯、小米在内的公司,都缩减了非技术岗位员工的Token额度。其中腾讯对部分非技术部门的Token缩减额度超过60%。

原因是,Token浪费严重。实际产出与消耗并不匹配。由于执行成本低,用AI不断尝试生成方案、修改方案、推翻方案现象开始变得普遍。大量Token最终浪费在无效试错。

一位中国云厂商高管此前曾对《财经》表示,从企业CIO(首席信息官)、CTO(首席技术官)的视角来看,Token消耗量并不能直接和业务价值挂钩,更多是和算力成本挂钩。

AI降低了执行成本,却没降低决策成本。Token越便宜,错误判断的放大成本越高。真正稀缺的,不是更多Token。关键是能把Token用在正确问题上的人。

无论是片面追求Token消耗量,还是追求Token收入增长,都只会扭曲真实业务价值。

相关内容

热门资讯

桥本甲状腺炎一定会变甲减吗?医... 桥本甲状腺炎不一定会发展成甲减——尤其是抓住早期“逆转期”,甲功完全有机会稳下来,甚至避免终身服药。...
小确柜完成天使轮融资 2026年6月9日,上海小确柜科技有限公司(简称“小确柜”)宣布完成天使轮融资。此次融资将主要用于A...
金价降了,买金的人为何更犹豫了... 转自:贝壳财经 进入6月以来,黄金价格持续走低。目前,现货黄金价格在每克940元至945元区间徘徊,...
部分民营银行下架中长期存款产品 每经记者:郭妍宏 每经编辑:许绍航 近期,《每日经济新闻》记者注意到,部分民营银行下架了中长期存款产...
原创 有... 最近跟几个朋友聊天,发现大家见面第一句话不再是“吃了吗”,而是“你看房了吗”。这话听起来有点夸张,但...
理性看待《置身钉内》:矛头直指... 作者:龚进辉 最近,钉钉前AI产品经理滕雅辛(花名“幽素”)离职前在阿里内网发布《置身钉内》一文。这...
保险科技公司眼里的物业风险账本 记者 姜鑫 2026年6月9日,中物智库联合飞鸟鱼科技发布的《中国物业管理行业风险管理与保险创新白皮...
原创 6... 伊朗这回,把桌子真掀了。 霍尔木兹海峡这把核按钮一摁,胡塞那边曼德海峡一锁,全世界才发现:原来油价这...
从70亿化工厂到3000亿酒王... 《星岛》见习记者 陈奇杰 深圳报道 6月8日晚间,五粮液发布公告表示,增补邓敏为公司第七届董事会非独...
美股盘中,纳指跌3.37% 三大股指集体下跌。其中,道指跌0.93%,标普500指数跌2.02%,纳指跌3.37%。 (本文来自...