李开复旗下“零一万物”大模型被指抄袭LLaMA
三言科技Pro
2023-11-14 15:47:49

原标题:李开复旗下“零一万物”大模型被指抄袭LLaMA

三言科技消息 近日有业内人士透露,某大厂新模型就是 LLaMA 的架构,但是为了表示不一样,把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。

业内人士认为该大厂是李开复旗下的零一万物。

此前,李开复带队创办的AI大模型创业公司零一万物宣布,正式发布首款研发的最强开源人工智能大模型系列——Yi。

此次发布的首个公开版本共包括两款:Yi-6B和Yi-34B,其数据参数量分别为60亿和340亿,均支持开源。

在Yi-34B 的 Hugging Face 开源主页上,开发者 ehartford 质疑称该模型使用了Meta LLaMA 的架构,只对两个张量(Tensor)名称进行了修改,分别为 input_layernorm 和 post_attention_layernorm。

零一万物近日还完成新一轮融资,估值已超10亿美元。

机器之心对抄袭一事求证了零一万物,得到回复称:

“GPT 是一个业内公认的成熟架构,LLaMA 在 GPT 上做了总结。零一万物研发大模型的结构设计基于GPT 成熟结构,借鉴了行业顶尖水平的公开成果,同时基于零一万物团队对模型和训练的理解做了大量工作,这是我们首次发布获得优秀结果的地基之一。与此同时,零一万物也在持续探索模型结构层面本质上的突破。”

相关内容

热门资讯

宇信科技携手阿尔特、光轮智能 ... 据宇信科技公众号,6月25日,北京宇信科技集团股份有限公司(简称“宇信科技”)联合阿尔特汽车技术股份...
部分银行将杠杆比例提升至140... 本报(chinatimes.net.cn)记者李明会 北京报道 6月26日早盘,国际金价再度失守40...
北京核心商圈茶言颂品牌直营店走... 新式茶饮赛道的品牌核心竞争力,不在于概念包装与流量宣传,而在于线下终端的精细化管理能力与常态化长效运...
李东生:坚定“AI向实”,以“... “全球供应链正从效率优先转向更加注重安全、稳定和韧性,中国制造也在经历新一轮重构,并通过扎根当地的发...
2026 HarmonyOS学... HDC2026,华为专家、B站开发者UP主以及学生开发者代表等登台HarmonyOS学生公开课,结合...
中国人民银行、海关总署就《黄金... 来源:金融一线 6月26日金融一线消息,为进一步规范黄金及黄金制品进出口行为,促进贸易便利化,优化营...
AI算力“烤”热培育钻石,金刚... 文|《科创板日报》 经历持续数年的行业低谷后,培育钻石赛道近期现拐点。 6月25日,A股培育钻石板...
彭志辉:被任正非点名的野生钢铁... 文 / 董轩 来源 / 节点财经 江西籍90后“天才少年”彭志辉,正在搅动A股市场的风云。 2026...
德国监管机构启动账务调查,扎兰... 来源:环球市场播报 监管机构指控该公司或遗漏了一笔与收购 About You 相关的交易信息 扎兰...
苹果涨价,股价大跌 本周四,最新公布的美国多项经济数据表现稳健、美伊和谈取得进展,多重利好提振市场情绪,标普500指数和...