零一万物缩减算法团队?李开复:AI六小虎都够钱做预训练
创始人
2024-10-16 19:42:46

继发布千亿参数模型Yi-Large之后,时隔五个月,零一万物于10月16日正式对外发布最新旗舰模型Yi-Lightning。国际权威盲测榜单LMSYS显示,目前Yi-Lightning已超越GPT-4o。这意味着仅花费五个月零一万物已追上OpenAI的顶级模型。

就在近期,有媒体报道称,被称为“AI六小虎”的6家中国大模型初创企业月之暗面、百川智能、智谱AI、Minimax、零一万物、阶跃星辰,其中有2家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用,而零一万物就是其中一家。

发布会后,零一万物创始人李开复针对这一问题直接回应称,预训练既是技术活也是费钱的事儿,但据他了解,目前“AI六小虎”做预训练仍不成问题。“这6家公司融资额度都是够的,我们做预训练production run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的6家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。”

最新模型击败GPT-4o,行业往OpenAI o1方向狂奔

10月16日,继上半年千亿参数模型Yi-Large之后,零一万物正式对外发布最新旗舰模型Yi-Lightning。国际权威盲测榜单LMSYS显示,目前Yi-Lightning已超越GPT-4o-2024-05-13、Claude 3.5Sonnet,排名世界第六,中国第一。这也是在LMSYS这一全球大模型必争的公开擂台上,中国大模型首度实现“超越OpenAI GPT-4o ”。

翻译是模型落地的典型场景,考验的是模型的语言理解和生成、跨语言能力与上下文感知能力。在这一典型场景的测评中,Yi-Lightning更快速地将莎士比亚的《李尔王》中的经典语句准确翻译出来,将“unaccommodateed man”翻译成没有外物装饰的人,相较之下阿里云旗下的Qwen2.5-72b-Instruct翻译成了“未受文明熏陶的人”、字节Doubao-pro 翻译成了“毫不遮掩的人”,DeepSeek-V2.5翻译成了“没有装饰的人”。

同时,较上一代旗舰模型 Yi-Large ,Yi-Lightning 的最高生成速度提速近四成,在与 GPT-4o的对比中,Yi-Lightning 的生成速度堪称“极速”。

谈及如何快速赶上国际顶级模型GPT-4o的进度时,李开复表示,其实缩短时间差非常困难。“我不预测我们(未来)可以(继续)缩短这个时间差,毕竟人家是用十万张GPU训练出来,我们用的是两千张GPU训练出来,我们时间差能达到只是因为我们模型、AI infra等团队都努力去使用和理解对方做出来的东西,再加上我们自己每家的研发有特色,比如数据处理、训推优化等,现在这一套方法论在零一万物已经成熟了。”

另外,南都记者关注到,零一万物花费近5个月赶上了GPT-4o的进度,同时OpenAI也在9月发布了其被业界称为是AGI(通用人工智能)一大进程的OpenAI o1系列模型。李开复透露,OpenAI内部其实攒了很多好东西,除了OpenAI o1以外,OpenAI领先行业足够多,但会等待合适的节点再释放。而OpenAI o1把只在预训练中scaling的趋势扩展到了推理的时候,让行业认知到训练SFT和强化训练都非常重要,目前中美有不少公司都在往o1的方向狂奔。

加入“价格战”,百万token降至九毛九仍有利润

除了C端以外,此次发布会上李开复还公布了零一万物在B端产品上的最新进展。李开复称,零一万物最新旗舰模型 Yi-Lightning 的 API 价格已降至极低水平,每百万 token 仅收费 0.99 元。

发布会上,针对此次大模型价格降价李开复不断强调称,有人或许会质疑零一万物是否在亏钱拉客户,但自己可以自信地回应,零一万物大模型的真实成本比比0.99元低。“不用担心我们被用垮了,欢迎大家使用,还是有利润空间的。”

今年5月,字节、百度、阿里云、腾讯、讯飞等大模型厂商纷纷大降价格,掀起了一场价格战。当时大模型初创企业零一万物CEO李开复做大模型系统发布时曾表示,其认为大模型之间搞类似于ofo的流血打法是双输的策略。“我觉得大模型公司不会这么不理智,因为技术还是最重要的,当大模型厂商的团队认定自己的技术值得的时候,就会坚持一个合适的价格,而绝不会只靠贴钱、赔钱去做生意。”

发布会上谈及前段时间的“价格战”,李开复也表示,当时有很多性能很差的模型价格都降得非常低,甚至是免费,但让接入的企业和个人体验起来都不达预期,这样的“价格战”李开复并不认同。

李开复强调,在个人或者企业接入API时,足够好的模型性能很重要,否则产品无法达到PMF(产品与市场的匹配度);同时如果一个模型性能很高,价格却很白菜,用户每天调用十几次,累积下来的成本也不可忽视。而零一万物在这两个因素之间已经找到了一个合适的价格。“我们也知道要控制成本,不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天0.99元/百万token的价格。欢迎大家试用,一定物超所值。”

辟谣放弃预训练,李开复称“AI六小虎”都做得起预训练

10月3日,OpenAI官宣称自己已成功获得66亿美元(约合人民币466.9亿元)融资,估值突破了1500亿美元。不过,随后有媒体报道称,通过对OpenAI的财务数据分析推测,OpenAI将于2029年实现盈利,但在此之前OpenAI依然会存在较为严重的亏损,预测2026年亏损幅度将达到140亿美元(约合人民币990.5亿元)。

尽管技术领先足够多,但就连OpenAI都仍未实现较好财务状况,国内的大模型创业公司情况会更好吗?就在近期,有媒体报道称,被称为“AI六小虎”的6家中国大模型初创企业中(月之暗面、百川智能、智谱AI、Minimax、零一万物、阶跃星辰),已经有2家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用,而零一万物就是其中一家。

对此,近期李开复曾在朋友圈辟谣称,“零一万物一直在做预训练,去年和今年发布的Yi-34B, Yi-Large, Yi-Coder, Yi-VL Yi-Vision都是发布时全球第一梯队国内领先的预训练模型。同时零一万物新的预训练模型也即将推出,也会是全球第一梯队,届时谣言将不攻自破,建议自媒体可以先删稿。”

发布会后李开复再次分享称,预训练既是技术活也是费钱的事儿。“做好预训练模型是一个技术活,需要非常多有才华的人一起工作,慢工出细活。需要懂芯片的人、懂推理的人,也需要懂基础架构的人、懂模型的人、很好的算法同学。如果一个公司能有幸拥有这么多优秀的人才跨领域合作,我相信中国是绝对可以做出世界排名前十的预训练的通用模型。不过,因为成本比较高,也不是每家公司都可以做这件事情,以后做预训练的大模型公司可能越来越少。”

不过,李开复强调,目前“AI六小虎”做预训练仍不成问题。“据我所知,这6家公司融资额度都是够的,我们做预训练production run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的六家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。”

发布B端数字人、全行业解决方案

此次发布会上,零一万物还推出了AI 2.0数字人解决方案、全行业解决方案、AI Infra等产品及服务,面向B/G端客户构建起了从定制模型到专有应用搭建的一整套解决方案。

南都记者了解获悉,零一万物的行业应用产品AI 2.0数字人聚焦零售和电商等场景,将新发布模型Yi Lightning实践于具体行业解决方案。基于以Yi Lightning模型为代表的Yi模型,零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座,形成了与AI 1.0时代完全不同的数字人解决方案。

其中,角色大模型为零一万物AI 2.0数字人提供了动作训练、表情生成等能力,直播声音大模型使得数字人迈过多国语言和情感表达的门槛,另外电商话术大模型也能成为了数字人主播的“AI 大脑”,负责链接知识库,完成智能对话。Yi-Lightning模型接入后,零一万物AI 2.0数字人对弹幕意图的识别更加精准、生成话术更自然、能够一步到位完成促单。

目前,零一万物的AI 2.0数字人解决方案涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景,合作案例包括全国某著名餐饮连锁、某头部酒旅类客户、全国某知名水果连锁店等,均取得了显著的GMV提升。其中某头部酒旅企业在接入Yi-Lightning全新加持的数字人直播后,GMV较此前上升170%。

另外,此次发布会上李开复还提到,在当前的市场需求下,仅仅为企业客户提供标准化模型还远远不够。李开复分享称,审视各垂直行业的核心业务流程就会发现,尽管基座模型具备一定的能力,但其在帮助核心业务提效方面仍显不足。这一现状制约了模型在客户核心业务场景中的深度融合,也限制了大模型的商业价值。因此基于企业不同的业务场景,零一万物也发布了全行业解决方案,除基座模型外还会搭配有RAG、Function Calling等一系列实用性经过检验的工具 。

采写:南都记者 林文琪

相关内容

热门资讯

金明精机:自主研发再结硕果 取... 中证智能财讯 金明精机(300281)5月27日晚间公告,公司近期取得四项国家专利,并取得了国家知识...
中上协:截至4月30日,境内股... 扬子晚报网5月28日讯(记者 马燕)5月28日,据中国上市公司协会微信公众号消息,中上协发布4月统计...
短债锁利 权益突围 理财公司应... “就目前来看,本轮降准降息落地后,理财产品资产端利率在短期内未出现明显下降,反而有所回升。实际上,今...
快手可灵AI一季度营收1.5亿... 近日,快手科技发布2025年第一季度业绩。在AI大模型与平台生态深度融合的背景下,本季度,快手业绩表...
GTCFX:创新技术引领外汇交... 摘要: 发现GTCFX如何通过创新技术彻底改变外汇交易,带您领略未来金融新趋势!了解更多,开启您的交...
原创 美... 据大河报报道,当地时间5月19日,美国白宫官员表示,美国总统特朗普与俄罗斯总统普京进行电话会谈。稍早...
促进海外业务发展 牧原股份拟港... 5月27日,牧原股份向港交所提交H股发行上市的申请,联席保荐人为摩根士丹利、中信证券、高盛。 牧原...
江苏银行宁波分行获批开业,分行... 5月26日,宁波金融监管局发布批复,同意解散宁波江北富民村镇银行,全部资产、负债、业务、网点、员工及...
金荣中国:黄金震荡调整待走强 黄金开盘延续隔夜尾盘止跌回升之力,先行表现走强,但需进一步走强,仍需突破回落趋势线压力,否则将仍有再...
【投融资动态】大化国瑞B轮融资... 证券之星消息,根据天眼查APP于5月26日公布的信息整理,辽宁国瑞新材料有限公司B轮融资,融资额数亿...
比亚迪回应网传“一经销商集团暴... 针对近期“比亚迪山东经销商济南乾城汽车贸易有限公司‘资金链断裂’”传闻,比亚迪集团品牌及公关处相关人...
以色列防长:已摧毁胡塞武装最后... 以色列国防部长卡茨5月28日说,以军空袭也门萨那机场。 卡茨表示,此次袭击摧毁了胡塞武装仍在使用的最...
午报三大指数窄幅震荡涨跌不一,... 一、【早盘盘面回顾】 财联社5月28日讯,市场早盘窄幅震荡,三大指数涨跌不一。沪深两市半日成交额65...
16个区全覆盖!蔚来能源实现天... 2025年5月28日,蔚来换电站|天津和平安泊城市港湾正式启用,蔚来能源实现天津换电县县通,全市16...
机构席位买入968.59万 北... 每经讯,2025年5月28日,北交所上市公司胜业电气(920128,收盘价:39.52元)登上龙虎榜...
小红书虚拟赛道,保姆级流程拆解... 今天给大家带来小红书虚拟赛道,轻松10W+的详细流程拆解。 先上案例,这是在小红书卖简历模板套装,一...
北方华创大跌2.76%!华泰柏... 5月28日,北方华创股票收盘大跌2.76%,天眼查工商信息显示,北方华创科技集团股份有限公司成立于2...
股民诉讼潮下的“护身符”,今年... 本报(chinatimes.net.cn)记者吴敏 北京报道 当监管重锤与诉讼浪潮共振,董事会的座椅...
【财经早晚报】字节将禁用第三方... 今天值得关注的国内外新闻有: 1. 外交部:中国对沙特、阿曼、科威特、巴林4国试行免签 2. 工信部...
GTCFX:多元化产品组合满足... 摘要: 探索GTCFX多元化产品组合,满足您的交易需求,实现投资目标的最佳选择。立即点击了解更多,开...
上汽大众成立动力系统新公司 含... 每经AI快讯,天眼查App显示,近日,上海峰梅动力系统有限公司成立,法定代表人为李文辉,注册资本10...
惠民消费券叠加世界美酒!宁夏·... 6月9日-11日,第五届中国(宁夏)国际葡萄酒文化旅游博览会-国际葡萄酒名庄名酒展将在银川国际会展中...
基金分红:华夏合肥高新产园RE... 证券之星消息,5月28日发布《华夏基金管理有限公司关于华夏合肥高新创新产业园封闭式基础设施证券投资基...
凯辉创新基金三期完成10亿美元... 5月28日,凯辉基金正式宣布旗下凯辉创新基金三期圆满完成最终关账,基金管理规模达10亿美元,成为欧盟...
直击蓝晓科技股东大会:董事长高... 界面新闻记者 | 陈慧东 2024年,蓝晓科技(300487.SZ)营业收入25.54亿元,同比增...
总起价近20亿!深圳光明挂牌一... 粤进深 赵盼盼 5月28日,深圳光明区挂牌一宗宅地,宗地号为A509-0074,挂牌起始价19.94...
清华大学互联网产业研究院院长朱... 5月28日,由北京商报社、《中外企业文化》杂志社主办的“2025深蓝媒体智库年度论坛”在北京国际饭店...
原创 A... 昨夜的美股高歌猛进,虽然这与A股的关系不大,但是美股大型科技股的上涨跟我们多少还有些关联吧,比如说看...
原创 深... 文丨詹詹 郭小兴 编辑丨杜海 来源丨新商悟 (本文约为800字) 近期,深蓝汽车可谓连遭舆论风波。...
原创 武... 武清,已经找到了楼市“甜区”。 今年以来,大打改善牌,核心地段的改善洋房掀起一股热潮。 城投春上...