本文自南都·湾财社。
采写 | 南都N视频记者 林文琪
编辑 | 柴华
11月12日,有消息称,罗福莉在朋友圈发文:“智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目中的AGI。”
南都N视频记者从知情人士处了解获悉,目前罗福莉已入职小米。
今年10月,小米AI团队携手北京大学联合发布了一篇聚焦MoE与强化学习的论文。在该论文中,此前因DeepSeek而爆火的AI人才罗福莉的姓名就在其中。
公开资料显示,罗福莉本科毕业于北京师范大学计算机专业,硕士阶段进入北京大学计算语言学深造。硕士毕业后,罗福莉加入阿里巴巴达摩院,担任机器智能实验室研究员,负责开发多语言预训练模型VECO,并推动AliceMind项目的开源工作。
罗福莉。图片来自罗福莉公开社交平台视频
2022年,罗福莉加入DeepSeek母公司幻方量化从事深度学习相关工作,后又担任DeepSeek的深度学习研究员,参与研发DeepSeek-V2等模型。
此前有消息称,小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。
当时有消息称,小米公司正在积极搭建自己的GPU万卡集群,以加大对AI大模型的投入力度。小米大模型团队在成立之初就已拥有6500张GPU资源,而此次搭建GPU万卡集群,将进一步提升小米在AI大模型领域的研发实力。
据知情人士透露,该计划已经实施数月之久,雷军在其中扮演了重要的领导角色。不过,当时小米并未给出回应,罗福莉本人也未直接回应此事。
今年4月30日,小米开源了首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力;随后在5月30日,小米开源了多模态大模型Xiaomi MiMo-VL,称该模型为Agent时代而来;8月8日多模态模型Xiaomi MiMo-VL实现更新,推理、文档、GUI、视频理解能力大幅提升,支持思考模式切换;9月19日小米开源首个原生端到端语音大模型Xiaomi-MiMo-Audio。总体看来,小米今年在大模型上的进展速度越来越快,在各大模态上都进行了布局。
下一篇:广东企业服务平台汇总分析报告