原创 月薪3万文科友好,“AI训练师”真有那么赚?
创始人
2025-05-03 02:25:15

五一,打工人的节日;搞钱,打工人的标签。对普通人来说,到底哪些新职业还有“掘金”的空间?《财经天下》特别策划了“黄金打工人”专题,将目光聚焦在五大新职业群体身上。通过他们的故事,来呈现一些新的就业趋势观察。本篇讲述的是,用数据标注来“驯化”大模型的四位工程师,他们如何将用户需求与模型嫁接起来,让大模型变得更加聪明。

2023年初,看到国内不断涌现的大语言模型,研究生刚毕业的万玉磊感到AI潮流势不可当,做出了人生最重要的选择。

他毅然放弃了某互联网大厂OCR(图片文字识别)工程师的offer,以提示词工程师的身份,加盟了一家多模态大模型初创公司。他的任务是训练AI,让它更加聪明,不断提升和人类对话的能力。

作为大模型的智能基础,AI和用户的交互能力,以及数据做得如何,直接决定了大模型的上限。DeepSeek的超强性能和惊人表现背后,便离不开它更强大的语义理解能力和高质量数据的支持。业界甚至传出,梁文锋也亲自参与了数据标注工作。

智联招聘数据显示,今年2月,算法工程师、机器学习、深度学习等岗位招聘量同比大幅增加。其中,承担“AI训练”的数据标注岗位,招聘需求同比增长超50%,平均招聘月薪也突破了2万元。

《财经天下》注意到,近期不少大厂特别为“AI训练师”开出了高薪。如字节跳动给AI训练岗开出了月薪2万~4万元、15薪;小红书也对“AI标注产品”岗开出了2万~4万元、16薪的标准。

“有良好产品意识、了解模型训练”是这些岗位的基本要求,更令不少求职者心动的是,其中不少大厂职位还对文科生相当友好,不同专业背景都可入行。

“AI训练师”的行业壁垒有多高,在AI技术的高速迭代中,其行业前景和含金量能保持多久?《财经天下》找到了四位不同行业、年龄的“AI训练师”,他们对于数据标注有着或乐观、或焦虑的思考。

01、年薪百万,并不罕见

“就像训练猫抓老鼠,你需要不断试探模型的触发机制。”这个五一前两天,在位于北京海淀五道口的办公室里,万玉磊向《财经天下》描述了他们经历过的提示词与大模型的早期碰撞。

在他看来,2023年前后,提示词与大模型的碰撞还充满“神秘”色彩。万玉磊团队曾尝试通过“情绪激励”的方式,提升模型表现。“给予大模型小费奖励”,或者让工程师扮演“残障程序员”等人格化设定,竟能让模型输出质量大幅提升。

随着DeepSeek-R1等长序列推理模型问世,思维链(Chain-of-Thought)技术普及让强化学习技术飞速突破,给大模型投喂简单“咒语”的方法逐渐失效,提示词工程也朝向数据自动化的方向深化。

“我们现在已经在用母提示词(预先设计好的、可复用的提示词框架)生成上千条候选指令,通过自动评估系统筛选出最优解。”万玉磊介绍道。

在他看来,基于Transformer架构的大模型技术革命,会将传统AI领域的知识体系彻底颠覆。之所以选择以提示词工程师的身份拥抱变革:“因为提示词是新世界的敲门砖,它用最低成本,让普通人接触到大模型核心能力。”

万玉磊观察,不少头部企业确实正在以百万年薪争夺提示词优化专家,数据策略岗需求激增。据其透露,字节在疯狂招各个领域的博士生来帮他们调数据;小红书则尝试组建“艺术+代码”的跨学科人才团队,试图更好地解决图文生成的审美瓶颈。

在万玉磊领导的7人团队中,5名数据标注员都是本科应届生,工作要完成大量语义标注。另外2位提示词工程师则要兼具代码能力与跨学科视野。不过在他看来,当下能胜任AI训练的人,持续学习的能力是核心门槛。

技术人员每月都要不断消化顶级会刊论文,这种高压环境也催生了独特的学习文化。每周一的论文研讨会上,万玉磊都会专门让团队成员拆解一份最新的模型技术报告,互相探讨。“上周面试时,我们最关注候选人是否第一时间体验过Claude 3的新版本。”

比起设计母提示词,评估体系的数字化正在成为工作的新焦点。“评估标准的制定比写提示词更关键,这也决定了系统的进化方向。”

“比如,我们团队搭建的自动化评测系统包含30余个量化指标:从回答相关性、中立性到情感亲和力,每个维度的权重会随业务场景动态调整。”目前,他所在团队中已经有70%的工作集中到了评估模型优化,仅有30%的工作放到了提示词生成。

特别是当大模型走向商业化后,大量垂类模型让针对性的提示词训练变得更加不可或缺。“B端用户需求非常明确,用户数据有效,提示词也会更加明确。”

万玉磊目前已做过电力运营、城市治理等垂直模型,在某个电网AI项目中,对方提供了百万量级的故障样本和精准工况描述,这也让提示词的设计效率大幅提升。

与之形成鲜明对比的,是设计C端产品的迷茫。面对数亿用户千奇百怪的提问,万玉磊曾因用户需求“过度发散”而苦恼不已。“C端的用户场景不明确,你也不知道他到底要什么,这种提示词做起来就会很难。”他苦笑道。

虽然提示词工程师总要跟枯燥的数据打交道,但随着模型能力的进化,万玉磊也会时不时地被震撼到。尤其是DeepSeek的“顿悟时刻(AHA moment)”闪现,让他印象极深。

在DeepSeek的论文中提到,模型让作者“见证了强化学习的力量和美感”。在开发DeepSeek-R1-Zero的中间版本时,模型曾学会了以人类的语气进行反思,领悟到了训练数据里完全没有的东西。

“我们正在经历技术史上的‘乱纪元’。”万玉磊用《三体》中的故事比喻当前行业态势:当大模型每月突破一个技术里程碑,传统的职业规划已失去意义,唯有构建“终身学习”的能力,才能保持竞争力。

02、行业需要工程师变成产品经理

2022年11月,ChatGPT横空出世时,张远辰还在准备研究生备考。

2023年初,一位专栏作者与New Bing(微软基于GPT-4模型的AI搜索引擎)进行了数轮对话,意外发现New Bing不仅会表达感情,还会PUA甚至威胁人类,看起来似乎拥有了“自我意识”。这让张远辰大为震撼,“我第一次真切感受到AI的拟人化潜力,甚至产生过退学、投身AI行业的想法。”

不久后,张远辰通过实习进入了AI领域,首份工作便是用封装提示词实现产品化。比如,根据用户输入的书名和字数,生成读后感。这也让张远辰第一次意识到,提示词对于模型质量提升的关键作用。

“特别是模型能力较弱时,提示词工程与模型训练同等重要。一份完整的结构化提示词属于核心资产,可以拿到网上去做售卖。”

张远辰暗下决心,将毕业后的求职目标对准大厂。但当时间拨到2025年,在面试字节、阿里等公司的过程中,张远辰发现,大厂对提示词工程师的需求每年都在变化。

“2023年,大厂会选择直接招一些AI产品经理来做相关的探索,对于提示词没有太重视。到2024年初,专门的提示词工程师已经出现,大模型行业开始细致分工。”

而到了2025年,DeepSeek让普通用户通过自然语言就能玩转AI。“大厂也更倾向于将提示词能力视为产品经理、研发等岗位的基础技能,而非独立岗位。”这也让张远辰意识到,提示词工程师正在向通用技能迁移,甚至可能逐渐 “消失”,其职责会被其他岗位吸收。

张远辰结合自身和周围的情况粗略判断,2024年,大厂给1~3年经验从业者的薪资约在月薪2.2万~3.5万元之间。

但她也表示,对于提示词工程师高薪、高学历的标签要理性看待。单纯的提示词撰写,已经难以构成长期壁垒。提示词工程师水平的高低,本质取决于能否直击问题本质、识别模型输出的价值。

“提示词工程师的工作并非单纯的提示词撰写技巧,而是对用户需求的洞察、跨领域知识储备,以及利用模型特性创新解决方案的能力。”张远辰说。

在她看来,提示词工程师的岗位职能正在迁移,发展路径更可能朝向AI产品经理——理解用户需求、拆解任务流程,这都和产品经理的核心能力高度重合。

而面对全新领域的提示词需求,张远辰表示并无标准的调研流程,而是更多依赖于实践验证。

令她印象深刻的是,2024年上半年 ,她在参与一部AI小说写作时,需要将小说拆解为题目、提纲、大纲、正文等多个环节。每个环节的提示词都要抽象提炼为前文已生成过的内容(如题目、文风要求),才能确保上下文连贯。

虽然听着简单,但实际处理过程中难题不断,如模型输出格式错误、模型崩塌(重复输出单个字符)和截断(内容未完成即终止)等。

光是解决格式问题,张远辰就测试了20多个模型。她也因此发现,DeepSeek虽然能稳定输出格式,但对于中文网文的风格支持不足。最终,她是通过流程切分(如将2万字的小说拆分为10个2000字左右的段落生成),才降低了模型处理压力。

张远辰事后总结道,提示词的设计往往充斥着很多不确定性,“有效定义AI的工作流程,比提示词设计本身更有用”。这也让她将职业规划开始沿着AI产品经理的方向深化:“AI终将成为工具,而把握用户痛点、设计出真正解决问题的产品,才是核心竞争力。”

03、离职率高,分化明显

2020年,于洪未曾预料到,她会在几年后站在AI浪潮的十字路口,重新思考职业的意义。作为一名金融行业数据分析师,于洪曾在投行与咨询公司深耕量化分析领域,却在AI技术迭代中感受到了前所未有的危机。

“ChatGPT刚开始连基础爬虫都写不好,现在它已经能处理完整的机器学习项目。我的工作中80%的内容,都可能被AI替代。”

于洪坦言,这种焦虑驱使她开始探索转型路径,而招聘网站上铺天盖地的“AI训练师”岗位,引起了她的注意。

起初,蚂蚁金服等大厂对于“AI训练师”的要求是,不仅要有顶尖学历,还要有CFA特许金融分析师)持证。这让于洪误以为,这是一个与金融业务深度结合的复合型技术岗。但在多方打听后,于洪发现提示词训练本质是“数据标注”,与金融知识几乎无关。

“即便是名校毕业生,进去后也只是按机器规则打分,没有主观判断的空间。”更令她意外的是,不少从事该岗位的从业者竟来自牛津剑桥等顶级学府。

可以说,数据标注岗因大厂光环吸引着众多求职者们。特别是它基础月薪过万,也面对文科专业招聘,更让不少名校毕业生一度将其视为“人生奔头”。

于洪表示,不少企业正在自建标注团队,但工作的高重复性让这一行离职率惊人。“许多大厂的数据标注岗都是外包性质的,许多人心理落差太大,干一两个月就走了。”

在技术冲击、行业震荡的双重压力下,于洪开始重新评估自己的职业护城河。她曾亲历AI工具从“初级辅助”到“威胁替代”的转折:早期使用ChatGPT时,于洪曾经借助信息差,高效完成工作,享受过“拿着工资摸鱼”的一小段红利时光。

但随着DeepSeek的崛起,老板们对开源工具的接受度提升,人力成本压缩成为必然。“当AI能独立完成数据清洗、分析甚至生成报告时,我的角色将只剩下审核与纠错。”

在技术洪流中,于洪试图寻找新锚点。她坦言曾考虑转向AI算法领域,但与资深工程师的交流让她望而却步。思来想去,于洪最终决定回归学术路径,计划攻读计算社会科学方向的博士,研究大语言模型与社会科学、金融分析的交叉应用。

“未来的机会或许会出现在技术与业务的结合点,比如提升AI对网络话语、金融文本的解析能力。”

目前,她的工作依旧每天与爬虫和文本情绪识别模型打交道。而对于AI技术的未来,于洪表现出了矛盾心态,她计划在欧洲攻读博士并寻求工作签证,努力朝学术领域发展。

和于洪类似,身处数据标注岗的王晨,也遇到了作为“AI数据打工人”的职场焦虑。2022年,王晨加入了一家创业公司,投身于智能体研发的数据标注。

王晨表示,当下AI训练师的专业门槛已发生质的跃迁。人才需求向垂直领域拓展,薪资梯度也呈现出结构化差异。医疗、法律等专业领域的AI训练师年薪可达20万以上,相较去年薪资涨幅达30%以上。

“不过,医疗领域标注岗位要求执业医师资质,影像类项目需要医学硕士背景,美学设计相关岗位更看重从业者的专业审美积淀。”

伴随高薪而来的是更严峻的挑战。王晨透露,某大厂曾为特定项目半年烧掉了500万元标注预算,却在完成后立即解散团队,“这种不确定性也在倒逼从业者构建核心竞争力”。

每次面试新人时,王晨都会建议新人选择垂直赛道深耕,将数据标注视为理解AI底层逻辑的入口,逐步向产品设计、质量评估等上游环节拓展。但他自己还没有彻底想清楚,他只是感觉,无论如何都不能轻易下了AI这趟高速列车。

(文中王晨、于洪为化名)

(作者 | 豆蔻,编辑 | 李不清,图片来源 | 视觉中国,本内容来自财经天下WEEKLY)

相关内容

热门资讯

液相捕获技术掀起肿瘤精准医疗革... 近年来,精准医疗领域迎来了前所未有的发展浪潮。从基因检测技术的迭代升级,到靶向药物的精准应用,再到免...
国电南瑞跌0.58%,成交额3... 5月27日,国电南瑞跌0.58%,成交额3.53亿元,换手率0.20%,总市值1775.89亿元。 ...
阳光电源:5月27日融资买入6... 证券之星消息,5月27日,阳光电源(300274)融资买入6679.61万元,融资偿还1.06亿元,...
新易盛:5月27日融资买入5.... 证券之星消息,5月27日,新易盛(300502)融资买入5.26亿元,融资偿还6.93亿元,融资净卖...
创业板系列指数走势分化,同类规... 截至午间收盘,创业板成长指数上涨0.7%,创业板指数上涨0.02%,创业板中盘200指数下跌0.3%...
深化“医险协同”模式,泰康绿通... 在长寿时代背景下,健康管理需求日益凸显,人们对于高品质就医资源的需求愈发迫切。作为一家大民生工程骨干...
普华永道港股连丢单,上海传出裁... 五一假期后,上海普华永道传出消息将进行裁员,涉及咨询、审计等多个业务条线。据时代财经了解,中国大区并...
什么情况?据传嘉能可购买大量L... 财联社5月28日讯(编辑 潇湘)有迹象显示,嘉能可公司近来可能一直在伦敦金属交易所(LME)买进俄罗...
字节否认为大额储户子女提供实习 近日,有网友在社交平台爆料,某银行私人银行可为高净值客户子女量身打造实践机会,其中不乏摩根大通、中金...
为人形机器人穿上“新衣” 这家... 《科创板日报》5月27日讯(记者 张洋洋)从跨界合作到跨界投资,各行业对人形机器人企业的布局全面开花...
港股通互联网ETF:5月27日... 证券之星消息,5月27日,港股通互联网ETF(513040)融资买入49.58万元,融资偿还58.6...
【盘中播报】7只A股跌停 银行... 证券时报•数据宝统计,截至上午10:28,今日沪指跌0.08%,A股成交量415.15亿股,成交金额...
央企ETF:5月27日融资买入... 证券之星消息,5月27日,央企ETF(159959)融资买入0.06万元,融资偿还28.62万元,融...
美联储鹰派立场vs加拿大经济放... 周三(5月28日),美元兑加元在亚洲交易时段早盘小幅上涨,汇价在1.38上方交投。美国消费者信心数据...
华密新材:5月27日融资买入2... 证券之星消息,5月27日,华密新材(836247)融资买入230.18万元,融资偿还260.97万元...
RWA项目完整落地手册1.0版... (1) 一、RWA 介绍 1)1.RWA 的定义 · RWA的全称:Real World Asset...
王兴立下军令状 文 |电厂,作者 | 何畅,编辑 | 高宇雷 除了每隔几天都有进展发布的AI行业,外卖大概是互联网...
华银APP订购白银铂金现货欺骗...   华银APP如今受害者众多,投资人在该平台做交易,只要是大资金买入,基本都是反向走势,一买涨,就使...
股息率破7%的银行ETF优选(... 近期银行势头不减,板块吸引效应明显。数据显示,5月27日,银行ETF优选(517900)单日成交17...
港股汽车ETF:5月27日融资... 证券之星消息,5月27日,港股汽车ETF(520600)融资买入3498.9万元,融资偿还3316....
5.28黄金暴跌后如何布局?今... 前言:不为模糊不清的未来担忧,只为清清楚楚的现在努力。不被短线行情的上蹿下跳而迷惑,只为趋势行情的布...
裁员3000人!沃尔沃断臂求生... 财联社5月27日讯(编辑 刘蕊)当地时间周一,瑞典汽车制造巨头沃尔沃汽车表示,作为削减成本的主要举措...
输掉“国补”的拼多多,一夜没了... 又是熟悉的暴跌,拼多多发布财报后,股价盘前又跳水了,跌幅一度逾20%。 截至当日收盘,拼多多美股跌幅...
浙江恒威:5月27日融资买入3... 证券之星消息,5月27日,浙江恒威(301222)融资买入342.99万元,融资偿还167.91万元...
韩国综合指数涨逾2% 上证报中国证券网讯 5月28日,韩国综合指数高开高走,截至9时44分,该指数涨逾2%,报2690.4...
中电工程 矢志能源报国 书写发... 中电工程 矢志能源报国 书写发展新篇 《人民日报》(2025年05月28日第 08 版) 今年...
长华化学跌2.09%,成交额2... 5月27日,长华化学跌2.09%,成交额2.57亿元,换手率19.71%,总市值34.76亿元。 异...
黄金交易提醒:特朗普的&quo... 汇通财经APP讯——周三(5月28日)亚市早盘,现货黄金震荡微涨,目前交投于3307.34美元/盎司...
还是湖人!曝詹姆斯大概率执行5... 5月28日消息,美国记者Shams今天在一档节目中谈到了湖人球员詹姆斯下赛季很可能继续效力湖人。 ...
银行反诈守好百姓钱袋子 近年来,电信网络诈骗套路不断翻新,让人防不胜防。银行作为反诈的重要力量,持续行动帮百姓守好钱袋子。 ...