马斯克打脸OpenAI!全球最大模型Grok-1开源
新周刊
2024-03-20 08:56:36

原标题:马斯克打脸OpenAI!全球最大模型Grok-1开源

本文经授权转载自

钛媒体

(ID:taimeiti)

作者:林志佳

马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。

钛媒体App获悉,北京时间3月18日早上,“硅谷钢铁侠”、亿万富翁马斯克旗下AI初创公司xAI宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通过磁链下载基本模型权重和网络架构信息。

(图/钛媒体)

xAI表示,Grok-1是一个由xAI 2023年10月使用基于JAX和Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家(MOE)模型,远超OpenAI的GPT模型。而此次开源的模型是是Grok-1预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。

对此,英伟达科学家Jimfan评价称,这是有史以来最大的开放大型语言模型,由世界级团队训练,通过磁力链接发布。Apache 2.0。314B,专家混合(8个活跃中的2个)。就连活动参数仅(86B)就超过了最大的Llama。迫不及待地想看到基准测试结果以及人们用它构建的内容。

langchain的Andrew Kean Gao评论认为,“Grok是有史以来最大的开源大模型,是llama2尺寸的4倍。”

ChatGPT则和马斯克在评论区互相嘲讽。

马斯克随后发推文表示,“告诉我们更多有关OpenAI的‘开放’部分的信息”。他直言,xAI这个平台“已经是迄今为止最透明和最求真的平台(说实话,门槛并不高)”。

(图/钛媒体)

截至发稿前,Grok上线GitHub后狂揽了6000星,586个Fork。

据悉,2023年7月,特斯拉CEO马斯克宣布成立一家新的人工智能公司xAI,新公司使命是“了解宇宙的真实本质”,目标是打造OpenAI的竞争对手。

作为OpenAI创始人之一,也是最新的OpenAI批评者,马斯克此前已表示,OpenAI已偏离了其预期目的,成为了一个以利润为导向的实体。他直言,OpenAI最初是作为一个非营利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI已经成为一家利润最大化的公司……这根本不是他的初衷。”

马斯克还谴责OpenAI遭到微软的控制。他表示,世界需要一个替代GPT的AI技术选择。

去年11月,马斯克正式发布xAI旗下首个大模型和应用成果方案Grok,并将Grok AI助手内置在社交平台X上。马斯克曾表示,“在某些方面,它是目前存在的最好的(AI技术)。”

当时马斯克表示,调优之后的Grok大模型具有330亿个参数,性能基准上接近Llama 2-70B,在HumanEval编码任务、MMLU基准上的结果分别为63.2%、73%。

今年2月,马斯克向美国旧金山高等法院提起诉讼,起诉OpenAI和公司联合创始人、CEO奥特曼(Sam Altman),公司总裁Greg Brockman以及 OpenAI 的若干实体,控告OpenAI团队违约、出尔反尔(“允诺禁反言”)、不正当竞争等。

马斯克在46页、1.4万字诉讼文件中声称,OpenAI违背初衷,背叛了OpenAI这家AI公司成立时达成的一项协议,即开发技术的目的是“造福人类”而非利润。他认为,OpenAI最近与微软的密切关系损害了该公司最初对开放、开源通用人工智能(AGI)领域的贡献,他要求OpenAI开放技术并寻求偿还他提供的资金。

3月初,OpenAI“反击”称,“当创始团队讨论以营利为目的的结构以进一步实现使命时,马斯克希望我们与特斯拉合并,否则他想要完全控制。马斯克离开了OpenAI,表示需要有一个与Google/DeepMind相关的竞争对手,而他将自己做这件事。他说他会支持我们找到自己的道路。”而且该公司驳回马斯克的所有主张,并称为事情发展到这一步感到遗憾。

马斯克则直接回应,OpenAI并不开源,Grok要直接开源(Open)。

如今,Grok-1正式开源,其拥有3140亿参数,具备先进MOE架构,远超GPT-3.5、llama2等,是迄今为止参数量最大的开源大语言模型。

(图/钛媒体)

xAI称,这个版本包含了Grok-1在2023年10月完成预训练阶段时的基础模型数据。根据Apache 2.0许可协议,向公众开放模型的权重和架构。以下是钛

媒体App梳理的关键信息:

该基础模型通过大量文本数据训练而成,未专门针对任何具体任务进行优化。

3140亿参数构成的混合专家模型,其中25%的参数能够针对特定的数据单元(Token)激活。而xAI团队利用定制的训练技术栈,在JAX和Rust的基础上,从零开始构建了此模型,完成时间为2023年10月。

模型参数数量高达3140亿,具备混合专家模型(Mixture of Experts, MoE)8架构,每一个数据单元(Token)由2位专家处理,共64个处理层,用于处理查询的有48个注意力机制单元(attention heads),用于处理键(key)/值(value)的有8个注意力机制单元,嵌入向量(embeddings)的维度为6,144,采用旋转式嵌入表示( RoPE) ,使用SentencePiece分词系统处理,包含131,072种数据单元,支持激活数据分布计算(activation sharding)和8位数字精度量化(8-bit quantization)

最大序列长度为8,192个数据单元,以处理更长的上下文信息

纽约时报点评道,开源Gork背后的原始代码,是这个世界上最富有的人控制AI未来战斗的升级。

Meta CEO扎克伯格刚刚也对Grok做出了评价:“并没有给人留下真正深刻的印象,3140亿参数太多了,你需要一堆H100,不过我已经买下了”。

值得一提的是,近期南加州大学的论文称,OpenAI发布的GPT-3.5-turbo 的参数规模也在7B(70亿)左右,除非是MoE 架构可能不同,并估计gpt-3.5-turbo的嵌入大小为 4096,称花费不到1000美元就把最新版gpt-3.5-turbo模型的机密给挖了出来。

有网友形容,马斯克对于模型技术这么大方,中国企业终于有福了。

(图/钛媒体)

3月17日,北京师范大学新闻传播学院教授、北京师范大学传播创新与未来媒体实验平台主任 喻国明在一场演讲中表示,别人一开源中国 AI 模型就使用是不正确的做法,对于安全性有所影响,必须国内要解决数据开源的规则问题。同时,大模型算力不足下,中国不应该“一窝蜂”做300多个大模型,而是应该做一些垂直行业、边缘计算的小模型,从而解决实际应用问题。

“模型的价值不在于数据、算法、算力的大小,而在于能否为人创造真正的价值大小,并且在价值链条中扮演关键角色。价值的最终实现,取决于大模型与小模型之间的融合与协同。”喻国明表示。

读完点个【在看】👇

相关内容

热门资讯

液相捕获技术掀起肿瘤精准医疗革... 近年来,精准医疗领域迎来了前所未有的发展浪潮。从基因检测技术的迭代升级,到靶向药物的精准应用,再到免...
国电南瑞跌0.58%,成交额3... 5月27日,国电南瑞跌0.58%,成交额3.53亿元,换手率0.20%,总市值1775.89亿元。 ...
阳光电源:5月27日融资买入6... 证券之星消息,5月27日,阳光电源(300274)融资买入6679.61万元,融资偿还1.06亿元,...
新易盛:5月27日融资买入5.... 证券之星消息,5月27日,新易盛(300502)融资买入5.26亿元,融资偿还6.93亿元,融资净卖...
创业板系列指数走势分化,同类规... 截至午间收盘,创业板成长指数上涨0.7%,创业板指数上涨0.02%,创业板中盘200指数下跌0.3%...
深化“医险协同”模式,泰康绿通... 在长寿时代背景下,健康管理需求日益凸显,人们对于高品质就医资源的需求愈发迫切。作为一家大民生工程骨干...
普华永道港股连丢单,上海传出裁... 五一假期后,上海普华永道传出消息将进行裁员,涉及咨询、审计等多个业务条线。据时代财经了解,中国大区并...
什么情况?据传嘉能可购买大量L... 财联社5月28日讯(编辑 潇湘)有迹象显示,嘉能可公司近来可能一直在伦敦金属交易所(LME)买进俄罗...
字节否认为大额储户子女提供实习 近日,有网友在社交平台爆料,某银行私人银行可为高净值客户子女量身打造实践机会,其中不乏摩根大通、中金...
为人形机器人穿上“新衣” 这家... 《科创板日报》5月27日讯(记者 张洋洋)从跨界合作到跨界投资,各行业对人形机器人企业的布局全面开花...
港股通互联网ETF:5月27日... 证券之星消息,5月27日,港股通互联网ETF(513040)融资买入49.58万元,融资偿还58.6...
【盘中播报】7只A股跌停 银行... 证券时报•数据宝统计,截至上午10:28,今日沪指跌0.08%,A股成交量415.15亿股,成交金额...
央企ETF:5月27日融资买入... 证券之星消息,5月27日,央企ETF(159959)融资买入0.06万元,融资偿还28.62万元,融...
美联储鹰派立场vs加拿大经济放... 周三(5月28日),美元兑加元在亚洲交易时段早盘小幅上涨,汇价在1.38上方交投。美国消费者信心数据...
华密新材:5月27日融资买入2... 证券之星消息,5月27日,华密新材(836247)融资买入230.18万元,融资偿还260.97万元...
RWA项目完整落地手册1.0版... (1) 一、RWA 介绍 1)1.RWA 的定义 · RWA的全称:Real World Asset...
王兴立下军令状 文 |电厂,作者 | 何畅,编辑 | 高宇雷 除了每隔几天都有进展发布的AI行业,外卖大概是互联网...
华银APP订购白银铂金现货欺骗...   华银APP如今受害者众多,投资人在该平台做交易,只要是大资金买入,基本都是反向走势,一买涨,就使...
股息率破7%的银行ETF优选(... 近期银行势头不减,板块吸引效应明显。数据显示,5月27日,银行ETF优选(517900)单日成交17...
港股汽车ETF:5月27日融资... 证券之星消息,5月27日,港股汽车ETF(520600)融资买入3498.9万元,融资偿还3316....
5.28黄金暴跌后如何布局?今... 前言:不为模糊不清的未来担忧,只为清清楚楚的现在努力。不被短线行情的上蹿下跳而迷惑,只为趋势行情的布...
裁员3000人!沃尔沃断臂求生... 财联社5月27日讯(编辑 刘蕊)当地时间周一,瑞典汽车制造巨头沃尔沃汽车表示,作为削减成本的主要举措...
输掉“国补”的拼多多,一夜没了... 又是熟悉的暴跌,拼多多发布财报后,股价盘前又跳水了,跌幅一度逾20%。 截至当日收盘,拼多多美股跌幅...
浙江恒威:5月27日融资买入3... 证券之星消息,5月27日,浙江恒威(301222)融资买入342.99万元,融资偿还167.91万元...
韩国综合指数涨逾2% 上证报中国证券网讯 5月28日,韩国综合指数高开高走,截至9时44分,该指数涨逾2%,报2690.4...
中电工程 矢志能源报国 书写发... 中电工程 矢志能源报国 书写发展新篇 《人民日报》(2025年05月28日第 08 版) 今年...
长华化学跌2.09%,成交额2... 5月27日,长华化学跌2.09%,成交额2.57亿元,换手率19.71%,总市值34.76亿元。 异...
黄金交易提醒:特朗普的&quo... 汇通财经APP讯——周三(5月28日)亚市早盘,现货黄金震荡微涨,目前交投于3307.34美元/盎司...
还是湖人!曝詹姆斯大概率执行5... 5月28日消息,美国记者Shams今天在一档节目中谈到了湖人球员詹姆斯下赛季很可能继续效力湖人。 ...
银行反诈守好百姓钱袋子 近年来,电信网络诈骗套路不断翻新,让人防不胜防。银行作为反诈的重要力量,持续行动帮百姓守好钱袋子。 ...