木头姐为何抛售、Groq为何轰动?以及想要“弯道超车”英伟达的12家独角兽
华尔街见闻
2024-02-22 10:54:59

原标题:木头姐为何抛售、Groq为何轰动?以及想要“弯道超车”英伟达的12家独角兽

华尔街明星基金经理、方舟投资管理公司的CEO“木头姐”凯茜·伍德(Cathie Wood)最近接受媒体采访时直言,她减持套现约450万美元的英伟达股票,在她看来未来对英伟达GPU芯片的需求并没有预期的那般火热,英伟达将面临更多的竞争。

木头姐称,看看科技巨头们,比如Meta、亚马逊、Alphabet,它们都在开发自己的AI芯片。它们更加专业化,目的性更为明确,而英伟达的芯片则更加通用。

“木头姐”话音刚落,Groq LPU(Language Processing Units语言处理单元)芯片惊艳亮相,号称“性价比高英伟达100倍”(芯片的速度比英伟达GPU快10倍,但价格和耗电量都仅为英伟达的十分之一),再加上谷歌自研AI芯片TPU设计者的光环,不少人直呼:英伟达的劲敌出现了。

根据Groq官网的介绍,LPU是一种专为AI推理所设计的芯片。不同于英伟达GPU需要依赖高速数据传输,Groq称,他们的LPU芯片在系统中没有采用高带宽存储器(HBM),而是选择使用SRAM,速度比GPU所用的存储器快约20倍

Groq公司更是“喊话”英伟达称,在执行推理任务中LPU可以取代GPU,通过其专用化的设计,LPU能够为特定的AI应用提供优化的性能和能效比。

Groq的效益成本问题才是关键

原阿里技术副总裁贾扬清发文分析称,要保证LPU和H100同样吞吐量,就需要更多的卡,而一张LPU卡仅有230MB的内存,且售价超2万美元,在运行Llama-2 70b模型时,需要305张Groq卡才足够,而用H100则只需要8张卡。

从目前的价格来看,这意味着在同等吞吐量下,Groq的硬件成本是H100的40倍,能耗成本是10倍。如果运营三年,Groq的硬件采购成本为1144万美元,运营成本为76.2万美元。相比起来,8卡H100的硬件采购成本是30万美元,运营成本是7.2万美元。

但华为“天才少年”左鹏飞在知乎上发文反驳了贾扬清的说法,左鹏飞认为大家混淆了售卖价和成本价。应该以Groq自己生产卡的成本价来计算推理成本。虽然 Groq 卡的售卖价是2万美金,但其成本价非常低,预计每卡成本在1200美金左右。

左鹏飞直言,GPU的成本大头则在HBM,但 Groq 直接丢掉了HBM,可以按 SRAM 的成本价估算卡成本。按1200美金/卡的成本计算,500张Groq卡的总成本是60万美金。Groq 公司拿这60万美金只能采购两台英伟达H100。两台英伟达 H100 能跑出 500 tokens/s的性能吗?

Groq如何降低成本?

分析指出,毫无疑问,按照当前硬件成本,Groq LPU服务器比英伟达要贵得多,一方面正如左鹏飞所言LPU卡的官方售价虚高,而另一个关键点在于,LPU的架构比较适用于有大量用户并发访问的场景,通过高吞吐大并发的做法将单个用户的单次请求成本显著降下来

这就不得不提到LPU底层独特架构,不同于传统的CPU和GPU架构,Groq从头设计了一个张量流处理器 (TSP) 架构, 以加速人工智能、机器学习和高性能计算中的复杂工作负载。

每个TSP都还具有网络交换的功能,可直接通过网络与其他TSP交换信息,无需依赖外部的网络设备,这种设计提高了系统的并行处理能力和效率。

而Groq闪电般的响应速度迅速引爆互联网讨论,而“快”的关键则在于,LPU没有采用HBM,而是使用SRAM,而这种设计也能够显著提高吞吐量。

这意味着LPU无需像使用高带宽存储器(HBM)的GPU那样频繁地从内存中加载数据。这一特点不仅有助于避免HBM短缺的问题,还能有效降低成本。

因此,由于AI的推理计算,相较于模型训练需要的数据量远小,Groq的LPU因此更节能。在执行推理任务时,它从外部内存读取的数据更少,消耗的电量也低于英伟达的GPU。

但有分析指出,Groq闪电般的速度是建立在很有限的单卡吞吐能力,SRAM还有两个特点,第一是面积大,第二是功耗高。在同容量情况下,SRAM的面积是DRAM的5倍-6倍以上,而面积就是成本,所以SRAM按单位面积算,并不便宜。

AI芯片的主战场将由训练转向推理?

在Groq LPU推出之前,大模型训练和推理都是基于英伟达GPU来设计,采用的CUDA软件技术栈。而Groq LPU的“一夜走红”也让市场开始推断风向变了,AI芯片的主战场将由训练转向推理。

在AI领域,工作任务有两大类:训练和推理。训练阶段对大规模的计算力和内存容量有着极高的需求,但对于访问速度的依赖相对较小。推理阶段则截然不同,AI模型必须以极致的速度运行,目的是为了能够向终端用户提供尽可能多的Token,以此来加快回应用户指令的速度。

有分析认为,未来一年AI推理市场将大幅增长,相较于AI训练,AI推理与用户终端场景需求更加紧密,训练后的大模型需要通过AI推理服务于实际的场景,目前基于英伟达GPU的AI推理方案依然成本高企,在性能、时延等方面影响用户使用体验。

这一次Groq之所以突然爆发,也是因为Groq搭载的Llama2或Mistreal模型的云服务上线,如果Groq LPU推理芯片可以从硬件上解决性能和成本问题,让AI推理服务大规模部署,或许未来会有更多的AI推理类应用落地。

分析认为,英伟达A100采用的Ampere架构设计为广泛的计算任务提供支持,包括但不限于机器学习。A100的Tensor Core技术和对多种数据类型的支持确实为深度学习提供了强大的加速,但TSP的专门优化使其在机器学习任务上可能提供更优的性能和能效比

由于高能效比,Groq就想到了把TSP变成专用集成电路,也就是ASIC。ASIC的特点在于特定的应用或算法进行了高度优化,以实现最佳性能、最低功耗和最小面积等目标。由于它们专门用于执行一种或一组相关任务,因此在完成这些任务时往往比非定制化的芯片更高效,特别是在推理领域。

数据显示,目前,数据中心定制芯片市场约为300亿美元,当更多可替代英伟达GPU的新一代专用推理芯片出现在数据中心,而基于云端的AI训练芯片的增长或许会逐渐放缓,这或许也是英伟达为什么要开始进军定制芯片市场的重要原因。

推理芯片公司试图从英伟达GPU庞大市场里分一杯羹

媒体汇总了目前处于竞争最前线的12家公司。这些初创企业平均历史只有五年,融资额度最高的已有7.2亿美元,而他们未来或许都有可能成为英伟达“王位”的有力挑战者。

相关内容

热门资讯

外部扰动边际改善 私募机构静待... ● 本报记者 王辉 今年以来备受市场关注的海外扰动因素于近日迎来边际改善,海外股市近期普遍有所反弹,...
618卖不过大牌?这些文创商家... 一只勇猛威武的泥塑小老虎,虎身由羊皮和羊毛制作,通体蓬松,虎头是纯手工彩绘,怒目圆睁,看起来古朴又有...
淡出政治舞台?马斯克称将削减政... 在巨额资助了2024年美国大选后,特斯拉首席执行官、世界首富马斯克表示,他将削减政治开支,把目光转回...
LPR降了!100万房贷30年... 央广网北京5月20日消息(记者 冯方)5月20日,最新贷款市场报价利率(LPR)公布。其中,1年期L...
中科院王春阳团队重要突破!成功... 据央视新闻,中国科学院金属研究所王春阳研究员联合国际团队近期取得重要突破,成功揭示固态电池短路机制,...
中国中免:5月20日融资买入5... 证券之星消息,5月20日,中国中免(601888)融资买入5768.71万元,融资偿还7903.66...
双良节能:5月20日融券卖出1... 证券之星消息,5月20日,双良节能(600481)融资买入479.64万元,融资偿还649.85万元...
全球首次机甲格斗定档!机器人E... 截至2025年5月21日 13:22,中证机器人指数(H30590)下跌0.67%。成分股方面涨跌互...
国开行已向技术改造和设备更新领... 新华社北京5月21日电(记者张千千)记者21日从国家开发银行获悉,截至今年4月底,国开行已向技术改造...
A股上市公司回购增持贷款活跃,... 近期,A股上市公司回购增持贷款热度攀升。截至5月19日17时,共有622家上市公司或重要股东获回购增...
小米YU7定位豪华高性能SUV... 5月21日上午,雷军发文称:小米YU7,马上就要发布了。不少朋友说,SUV市场比轿车市场竞争更激烈,...
短线修复性反弹! 以下是为您生成的中文快讯: 稀有金属涨价,近 3 个月铋涨幅达 7 倍,中国铋产能占全球 81%,出...
深夜,金价爆了! 金价又突然飙升! 5月20日晚,现货黄金持续走高,突破3280美元/盎司,日内涨超1.6%。 数据...
宁德时代在港上市,为何九成募资... 近期市场对宁德时代的分歧主要来自两点:一是对美出口敞口,二是对行业可持续增长的担忧 文|康国亮 成孟...
直击农夫山泉2024股东大会 界面新闻记者 |杨涵 2025年5月20日,农夫山泉在杭州总部召开年度股东大会,参会股东人数创下...
张良点金:抄底, 你上车了没有... 昨天黄金你抄底了没有? 昨天我说3265是重点,破位则确立阶段性底部,那么也就意味着连续震荡半个多月...
掌上白银APP现货订购实际为非...   掌上白银交易软件背后的公司:上海华通白银国际交易中心有限公司,该公司旗下不光是有掌上白银APP一...
谷歌旗下Waymo获准在旧金山... 谷歌旗下的自动驾驶子公司Waymo周一表示,已获得加州的批准,将在旧金山半岛的更多地区以及更南部的地...
数十位航天专家创立,已批量落地... 作者 | 林晴晴 编辑 | 袁斯来 36氪获悉,空间激光通信技术研发商「极光星通」近日已完成超亿元人...
原创 “... 雷军投了个铜匠,铜师傅冲刺IPO。 文/每日财报 南黎 在铜质文创领域,一个以“铜装饰界的小米”自诩...
构建未来世界的新秩序,刘煜辉今... 今天(5月20日)上午,知名经济学家刘煜辉在一场交流中,以“做多赢家的溢价”为题,分享了对中美贸易战...
上纬新材:股东金风投控拟减持不... 每经AI快讯,上纬新材(SH 688585,收盘价:7.78元)5月20日晚间发布公告称,截至本公告...
欲全资控股富创优越发力“第二增... 5月20日晚间,华懋科技(603306.SH)公告称,其拟并购深圳市富创优越科技有限公司(以下简称“...
​资金流信用信息平台破解中小微... “这笔贷款从申请到放贷仅用了3天,而且不用抵押担保,切实解决了我们资金周转难题。”庆阳市某商贸公司负...
中毅达:5月20日融资买入1.... 证券之星消息,5月20日,中毅达(600610)融资买入1.6亿元,融资偿还2.67亿元,融资净卖出...
A股:不用等明天了,主力资金3... 今天 A 股这走势简直比悬疑剧还刺激!刚一开盘,大盘就像打了鸡血似的往上冲,最后收盘稳稳卡在 338...
监管批复!金剑威就任玉环农商银... 2025年5月20日,根据国家金融监督管理总局消息,《玉环农商银行关于金剑威副行长任职资格的请示》获...
沙钢股份:5月20日融资买入4... 证券之星消息,5月20日,沙钢股份(002075)融资买入4891.64万元,融资偿还6536.62...
HK创新药:5月20日融资买入... 证券之星消息,5月20日,HK创新药(159567)融资买入6747.66万元,融资偿还8558.8...