阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
搜狐科技
2023-11-14 18:42:41

原标题:阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

出品 | 搜狐科技

作者 | 梁昌均

国内大模型再陷“套壳”争议。阿里巴巴前副总裁、知名AI框架大牛贾扬清发朋友圈,感慨做小公司不容易,希望国内企业如果就是开源的模型结构,不要做换名伪装,免得做多余的适配工作。

根据贾扬清的朋友圈,他表示有某海外客户要其公司帮他们适配某国内大厂的新模型,但后来有朋友告知,这个大厂新模型完全就是LLaMA的架构,但为了表示不一样,把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。此外,海外也有工程师直接指出了这一点。

“我们是小公司也不想得罪大佬们,名字我就不说了,不过各位大佬,开源社区不容易,如果你们就是开源的模型结构,求高抬贵手就叫原来的名字吧,免得我们还做一堆工作就为了适配你们改名字。”贾扬清说。

前述消息在业内传开后,国内不少基于开源的LLaMA的国产大模型纷纷躺枪。但贾扬清所说的“大厂”到底是谁并不定论,他还特别声明到不是老东家阿里。LLaMA是Meta在今年开源的系列大模型,参数包括13B、65B等。

不过,业内的怀疑对象指向刚发布首款预训练大模型Yi-34B的零一万物,其是李开复在今年7月入局AI大模型新成立的公司,由李开复牵头创办并担任CEO。

搜狐科技注意到,零一万物开源发布的Yi-34B模型目前在Hugging Face的Open LLM Leaderboard开源大语言模型排行榜排名第一。但此前有开发者在Hugging Face社区的Yi-34B项目讨论区留言称,除了两个张量被重新命名外(input_layernorm 和 post_attention_layernorm),Yi完全使用了LLaMA的架构。

“因为围绕LLaMA架构有大量的投资和工具,所以对张量使用相同的名称是有价值的。开源社区肯定会重新发布Yi,并重新命名张量,以便有一个符合LLaMA架构的版本。我们希望您能考虑在该模型获得大量采用之前,在您的官方模型中采用这一更改,以便它最终能够享受它应得的采用。”该留言称。

对于市场质疑,零一万物方面对搜狐科技回应称,GPT是一个业内公认的成熟架构,LLaMA在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时基于零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。

零一万物还表示,模型结构仅是模型训练其中一部分。Yi 开源模型在其他方面的精力,比如数据工程、训练方法、baby sitting(训练过程监测)的技巧、hyperparameter设置、评估方法以及对评估指标的本质理解深度、对模型泛化能力的原理的研究深度、行业顶尖的 AI infra 能力等,投入了大量研发和打底工作,这些工作往往比起基本结构能起到更大的作用跟价值,这些也是零一万物在大模型预训练阶段的核心技术护城河。

“在大量训练实验过程中,由于实验执行的需要对代码做了更名,我们尊重开源社区的反馈,将代码进行更新,也更好的融入Transformer生态。”零一万物称,非常感谢社区的反馈,希望和大家携手共创社区繁荣,Yi Open-source 会尽最大努力持续进步。

对于Hugging Face上提到的留言,零一万物有关负责人也对其作出了回复,称会按照留言的建议,把张量的命名从Yi改为LLaMA,保证准确度和透明度。

“这个命名问题是我们的疏忽。在大量的实验中,我们对代码进行了多次重命名,以满足试验要求,但在推出发行版前没有把名字换回来。”该回应称,零一万物将加强流程,保证这样的失误不会再次发生,并将检查所有代码,确保其它没有问题。

零一万物在11月初正式发布首款预训练大模型 Yi系列模型,包含34B和6B两个版本,其中34B模型版本开源。零一万物当时宣称,根据 Hugging Face 英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B预训练模型成为全球开源大模型“双料冠军”,这也是迄今为止唯一成功登顶 Hugging Face 全球开源模型排行榜的国产模型。

此前,国内不少大模型都陷入过“套壳”质疑,不少企业正是基于开源模型(特别是LLaMA系列)做微调,包括二次训练等,也有企业直接基于开源模型做应用层的开发,因此研发成本更低,但往往缺乏技术护城河,不被市场看好。

OpenAI CEO Sam Altman此前就表示,“套壳”OpenAI的公司活不长久,因为OpenAI已经在解决模型本身的问题,同时这些仅在成本和速度上与OpenAI一较高下的公司,竞争优势并不会长久且持续,企业必须提供真正独特的价值。

相关内容

热门资讯

清华大学互联网产业研究院院长朱... 5月28日,由北京商报社、《中外企业文化》杂志社主办的“2025深蓝媒体智库年度论坛”在北京国际饭店...
原创 A... 昨夜的美股高歌猛进,虽然这与A股的关系不大,但是美股大型科技股的上涨跟我们多少还有些关联吧,比如说看...
原创 深... 文丨詹詹 郭小兴 编辑丨杜海 来源丨新商悟 (本文约为800字) 近期,深蓝汽车可谓连遭舆论风波。...
原创 武... 武清,已经找到了楼市“甜区”。 今年以来,大打改善牌,核心地段的改善洋房掀起一股热潮。 城投春上...
重磅活动!王涵:长期视角下的经... 上证·首席讲坛”由上海证券报和中国首席经济学家论坛共同打造,致力于搭建高端交流平台,邀请业内顶级专家...
银行行业28日主力净流出6.1... 5月28日,银行行业上涨0.28%,今日主力资金流出6.1亿元,成分股21只上涨,17只下跌。 主力...
深铁5个月四次“输血”万科近1... 金融界5月28日消息 在万科深陷债务的关键节点,已经从万科退休多年的大佬王石罕见发声,正在尝试与万科...
原创 A... 今日的A股,成交量又只有万亿成交量了,比昨日更离谱的是沪深300成交量只有1600亿,TMT赛道的成...
医疗大模型浪潮:讯飞医疗领航,... 在医疗人工智能领域,大模型的发展正迎来政策与市场的双重机遇。近日,动脉智库发布了《2025医疗大模型...
食品饮料-零食行业:鸣鸣很忙(... 今天分享的是:食品饮料-零食行业:鸣鸣很忙(02143),招股说明书梳理,零食量贩龙头,引领万亿元赛...
收评:沪指震荡跌0.18%,医... 27日,两市主要股指盘中弱势下探,深证成指、创业板指一度跌约1%,全A成交额再度萎缩。 截至收盘,沪...
刚刚,备案!万亿巨头出手 【导读】泰康稳行完成私募基金管理人备案登记,泰康人寿首期投资规模预计为120亿元 中国基金报记者 吴...
助小微企业走出融资困境 小微企业创新迭代快捷、市场反应敏锐、细分领域广泛,在推动科技创新、吸纳人员就业、丰富文化业态等方面发...
越跌越买!红利又被抢疯了 上周三$中证红利ETF(SH515080)$创了阶段新高后有些回调,一下子又被买疯了,这周一和这周二...
李彦宏念念不忘,百度电商重启在... 文/华尔街科技眼 Leon 临近6.18大促,各大平台、商家都开始了预热。网红罗永浩于5月23日...
特朗普:若加拿大成为美国第51... 当地时间5月27日,美国总统特朗普在其社交媒体平台“真实社交”上发文表示,加拿大非常希望成为美国“金...
煤炭板块午后逆势上行,国企红利... 5月28日,三大股指午后小幅走低,而国企红利板块逆势上涨。截至下午13:30,国企红利ETF(159...
比亚迪回应山东经销商“资金链断... 针对近期“比亚迪山东经销商济南乾城汽车贸易有限公司‘资金链断裂’”传闻,比亚迪集团品牌及公关处相关人...
精致时代下,国际品牌如何赢得中... 汇聚行业论坛洞察,解读前沿报告观点,提炼关键趋势,为您呈现深度思考与精准研判。 作者|Huiyan ...
重磅!牧原递交港股IPO申请,... .................. 5月27日,牧原股份向香港联交所提交上市申请。牧原股份提到,按...
东南亚消费者为何愿为猫人买单?... 在国货出海浪潮奔涌的当下,越来越多中国品牌怀揣着“品牌全球化”的野心踏浪而行。 当多数玩家困守低价红...
又一场暴风雨来临?日本长债拍卖... 周三,投资者屏息以待日本40年期国债拍卖,因该国收益率波动持续冲击全球债券市场,全球借贷成本上周遭遇...
确认了!她接棒父亲任董事长 近日,利群商业集团股份有限公司(以下简称“利群股份”)发布公告称,现年42岁的徐瑞泽接棒父亲徐恭藻,...
液相捕获技术掀起肿瘤精准医疗革... 近年来,精准医疗领域迎来了前所未有的发展浪潮。从基因检测技术的迭代升级,到靶向药物的精准应用,再到免...
国电南瑞跌0.58%,成交额3... 5月27日,国电南瑞跌0.58%,成交额3.53亿元,换手率0.20%,总市值1775.89亿元。 ...
阳光电源:5月27日融资买入6... 证券之星消息,5月27日,阳光电源(300274)融资买入6679.61万元,融资偿还1.06亿元,...
新易盛:5月27日融资买入5.... 证券之星消息,5月27日,新易盛(300502)融资买入5.26亿元,融资偿还6.93亿元,融资净卖...
创业板系列指数走势分化,同类规... 截至午间收盘,创业板成长指数上涨0.7%,创业板指数上涨0.02%,创业板中盘200指数下跌0.3%...
深化“医险协同”模式,泰康绿通... 在长寿时代背景下,健康管理需求日益凸显,人们对于高品质就医资源的需求愈发迫切。作为一家大民生工程骨干...