快捷搜索:  

gpu粥少僧众,真的要延后出货吗?

"gpu粥少僧众,真的要延后出货吗?,这篇新闻报道详尽,内容丰富,非常值得一读。 这篇报道的内容很有深度,让人看了之后有很多的感悟。 作者对于这个话题做了深入的调查和研究,呈现了很多有价值的信息。 这篇报道的观点独到,让人眼前一亮。 新闻的写作风格流畅,文笔优秀,让人容易理解。 这篇报道的结构严谨,逻辑清晰,让人看了很舒服。 " 账号设置我的关注我的收藏申请的报道退出登录登录搜索36氪Auto数字时氪将来消费智能涌现将来城市启动Power on36氪出海36氪研究院潮生TIDE36氪企服点评36氪财经(Finance)职场bonus36碳后浪研究所暗涌Waves硬氪媒体品牌企业号企服点评36Kr研究院36Kr创新咨询企业服务核心服务城市之窗行政部门服务创投发布LP源计划VClubVClub投资机构库投资机构职位推介投资人认证投资人服务寻求报道36氪Pro创投氪堂企业入驻创业者服务创投平台 首页快讯资讯推荐财经(Finance)科技(Technology)创新城市最新创投汽车(Car)企服专精特新直播视频专题活动搜索寻求报道我要入驻城市合作GPU粥少僧多,真的要延后出货吗?半导体产业纵横·2024-03-13 19:04关注2024年的AI服务器市场依然火爆,英伟达会采取哪些策略?

过去一年,用于AI服务器的GPU一直供不应求,而从将来一年的发展态势来看,相关产品的紧张(Nervous)程度有增无减。 

据TrendForce(集邦咨询)预测,2024年全球服务器整机出货量约1365.4万台,年增长率约2.05%。同时,市场仍聚焦部署AI服务器,出货占比约为12.1%。 

从各大ODM出货动态来看,今年(This Year),增长幅度最高的是Foxconn(富士康),预估出货量年增约5%~7%,包含Dell 16G平台、AWS Graviton 3与4、Google Genoa和Microsoft Gen9等订单。AI服务器订单方面,Foxconn今年(This Year)已斩获Oracle订单,同时也承接了部分AWS订单。 

增长幅度排名第二的是Inventec,预估出货量年增约0~3%。AI服务器方面,除了北美CSP,祖国客户,如ByteDance需求最强,预估今年(This Year)Inventec 的AI服务器出货量年增长率可达双位数,占比约10%~15%。 

排在Inventec之后的是广达和Supermicro,预计今年(This Year)服务器出货量年增长率持平。 

整体而言,各家ODM在2024年的出货仍以AI服务器最为强劲,主要受惠于北美云端数据中心厂商订单带动,预计今年(This Year)AI服务器出货增长率和占比都将达到两位数百分比。就出货种类而言,今年(This Year),搭载高端AI训练芯片(如英伟达H系列和AMD的MI系列产品)的机种出货量有机会翻倍增长。这对英伟达和AMD来说,意味着更大商机。 

店大欺客?

目前(Currently),英伟达占据80%的AI服务器GPU芯片市场份额,AI系统和互联网大厂都需要该公司的GPU,因此,英伟达在该市场拥有很大话语权。 

最近,有外媒报道,英伟达可能刻意延后出货,以限制竞争对手接单。 

报道称,如果英伟达发现客户正在寻求更好的业务机会,则可能会拖延数据中心GPU的出货。英伟达的竞争对手、人工智能芯片创业公司Groq表示,由于客户担心英伟达报复性出货延迟,都心存恐惧(Fear)地对取得可能设计人工智能技术保密。 

Groq首席执行官罗斯(Jonathan Ross)表示,由于潜在客户担心被英伟达发现与其它厂商讨论(Discuss)接单,客户们都会否认自己曾与这些竞争对手公司会面。实际上,这种情况在业界并不少见。罗斯说:“很多人都说,如果英伟达听说客户正在会面,它们(They)会否认这一点。问题是你必须提前一年向英伟达付款,可能会在一年内得到硬件,也可能需要更长时间。” 

外媒甚至暗示,微软、Google和亚马逊等科技(Technology)巨头正打造自有人工智能加速器,但都坚称不打算成为英伟达的竞争对手,因为英伟达在人工智能市场中占有主导地位。 

针对罗斯的声明,英伟达CEO黄仁勋告诉行业分析师,他试图公平地向客户分配GPU,并将避免向不立即使用加速器的公司出售产品。 

在Groq指控英伟达使用延后出货手段后,AMD前副总裁赫克尔曼(Scott Herkelman)表示,英伟达的确采取类似策略,他甚至称英伟达为“GPU独占集团”。他在社交媒体X上发文写道:“这种情况发生的次数比预期的要多。” 

赫克尔曼的表态十分引人关注,因为他从2016年起负责AMD的图形业务部门,该部门在消费者和数据中心业务方面与英伟达竞争,直到2023年离开AMD。更重要的是,他在2012年9月~2015年5月间担任英伟达GeForce业务总经理。 

不过,目前(Currently)尚不清楚是否有证据证明英伟达确实有上述行为。 

如何保持行业领导地位?

英伟达在占据AI服务器用GPU市场主动地位的情况下,一定会想方设法达成利润最大化,具体措施方面,除了高定价,保持客户粘性是很重要的方式,在这方面的具体措施,包括技术性的,如用CUDA软硬件生态系统牢牢地抓住广大工程师,还有就是商业操作层面的,要尽量降低竞争对手的获客机会。 

在当前的AI服务器和相关GPU市场行情下,无论是GPU提供商,还是系统集成商可能互联网大厂,都越来越敏感了,特别是互联网大厂,都在做两手准备,在向英伟达采购更多GPU的同时,正在加紧自研相关芯片。对于英伟达的各种客户而言,更多地接触AMD和英特尔是必然。 

微软、Meta、亚马逊等云服务提供商为了降低芯片成本,并使芯片供应链多元化,减少对英伟达的依赖,不仅开始提升采购AMD的MI300系列产品数量,要求ODM厂设计专门采用MI300系列产品的AI服务器,还纷纷加重自研HPC芯片力度,争取将更多自研芯片用于自家的互联网和云计算系统。 

AMD是英伟达最大的竞争对手,由于受到越来越多英伟达客户的关注,对AMD产品的采购量在增加,使得该GPU“二哥”的行业地位持续提升,这在资本市场上有越来越明显的表现。最近,AMD股价涨幅超过9%至每股192.53美元,创造历史(History)新高,2月份累计上涨了14.8%,市值首度突破3000亿美元。 

根据道琼斯市场数据,AMD的市值达到了3110亿美元。在近期的连续上涨之后,AMD股价越来越贵,其市盈率接近50倍,远高于英伟达的32倍。 

这样看来,虽然英伟达依然很风光,但受限于先进制程、封装产能,以及来自各级别芯片对手的竞争,该公司的危机意识也在增加。 

对于英伟达来说,要加快推出新品和优化原有产品的节奏。 

英伟达AI年度盛会“GTC 2024”将于3月18日在米国登场,届时,黄仁勋将公布旗下最新的AI芯片、采用新一代Blackwell架构的B100 GPU。据悉,该新品将由台积电3nm制程代工生产,最快今年(This Year)第四季度出货。 

GTC大会不仅将世界各地的专业工程师、研究人员会聚一堂,还将邀请多位科技(Technology)大老亲自到场,活动预计将涌进超过30万人(线下和线上总参与人数),今年(This Year)的GTC也被外界看作是体坛2024和2025年AI关键技术发展进程的重要风向标。 

英伟达即将发布的B100,与目前(Currently)的H系列GPU相比,整体效能有大幅提升。其中,光是HBM内存容量,就比H系列最强的H200芯片高出约40%的容量,使得B100能应对高效能HPC可能加速LLM的AI训练需求。据了解,B100芯片的AI效能,至少是Hopper架构H200的两倍,可以达到H100的4倍以上。 

多家AI服务器系统大厂已经开始争夺B100,包括已成为英伟达B100模组供应商的代工大厂纬创,以及提供3nm可能4nm制程技术的台积电,还有现已开始接到来自英伟达B100 AI服务器水冷项目订单的代工大厂英业达。英业达表示,今年(This Year)的AI服务器市场仍以英伟达产品为主流,并以高端训练用的AI服务器产品为市场主力。 

对于即将发布的新品B100,英伟达对所搭载的散热技术也进行(Carry Out)了升级,从原来的气冷转为水冷,对此,黄仁勋曾提到,自己坚信浸没式水冷技术是将来发展方向,将带动整个散热市场迎来全面的革新。据悉,英伟达从B100开始,将来所有产品的散热技术,都将由气冷转为水冷。 

祖国市场给英伟达增添了更多危机感

英伟达对竞争对手带给它威胁的重视程度,从它对祖国大陆市场及本土芯片企业的态度就可以看出来。 

祖国大陆市场占英伟达销售额的20%左右,近两年,该公司不得不多次改变GPU性能规格,以满足米国行政部门的出口要求。 

2022年8月,米国行政部门禁止向祖国大陆出口英伟达的A100和H100芯片,因为这些芯片的通信带宽达到了600GB/s可能更高。针对祖国大陆市场,英伟达随后推出了A800和H800处理器,通信带宽都明显低于600GB/s。 

2023年10月,米国商务部工业与安危局(BIS)表示,将使用 “性能密度”作为新参数对受限芯片进行(Carry Out)分类。根据新规定,英伟达的A800、H800、L40、L40S和RTX 4090相关产品被禁止销往祖国大陆。针对这项规定,英伟达又于去年11月推出了三款AI芯片——H20、L20和L2,但要到2024年第二季度才能量产交付。 

针对RTX 4090在祖国大陆销售受限问题,英伟达开发出了RTX 4090 D显卡,通过降低部份规格,以符合米国出口管制要求。据悉,RTX 4090 D满足综合运算性能(TPP)4800限制,RTX 4090的TPP是5286。 

最近,英伟达推出了最新版本的祖国特供GPU和显卡RTX 5880 Ada,符合4800 TPP的限制规定。英伟达将AD102芯片用于RTX 6000 Ada和RTX 5000 Ada,RTX 5880 Ada很可能使用相同芯片的变体。AD102拥有18,432个CUDA内核。 

随着近几年米国限制国策的出台,以及祖国本土企业和产品竞争力的提升,英伟达等厂商的技术和产品优势正在缩小。例如,H20在性能和效率上仍比祖国本土AI芯片具有优势,但这种优势正在缩小,因为多家祖国本土芯片厂商正在快速发展。 

由于祖国本土AI芯片与英伟达特供版产品之间的差距在缩小,进入2024年以来,多家祖国互联网大厂和云服务提供商表示,今年(This Year)下订的英伟达H20等产品数量将远少于原本想买的,因为来自祖国本土的相关芯片用量增加了。 

测试结果(Result)显示,H20能在多个处理器之间高效传输数据,比祖国本土相关芯片更适合AI计算应用,但是,需要更多H20才能表现出英伟达常规GPU的算力,这就大幅提高了成本。相比之下,祖国本土最先进的AI芯片也能处理AI相关应用,只是处理任务的复杂度低于英伟达的。知情人士表示,多家祖国互联网大厂和云服务提供商已经把一些AI芯片订单转至本土厂商,以华为为例,据悉,该公司去年已从本土互联网大厂手中拿到至少5000组Ascend 910B芯片订单,预定今年(This Year)交货。 

2月下旬,黄仁勋在接受外媒采访时表示,如今,整个科技(Technology)行业都在争相开发和优化自己的芯片技术,无论是TPU团队、AWS Trainium和Interentia团队,还是微软的Maia项目,以及祖国各大云服务提供商和初创公司,都在这一领域投入了大量的精力。这种竞争态势确实非常激烈。 

对于祖国大陆的竞争对手,黄仁勋表示,华为是非常好的公司。尽管他们(They)受到现有半导体制程技术的限制,但他们(They)仍然可以通过将许多芯片聚集在一起来构建非常强大的系统。为了与华为竞争,英伟达正在向客户提供两款专门针对祖国市场的新AI芯片样品。 

这是英伟达首次公开将华为列为竞争对手。此前,英伟达唯一一次公开提到华为是在2017年的一份财报中,当时,该公司表示,华为将使用英伟达的Volta HGX架构为数据中心构建AI系统。在那份报告中,英伟达还将华为列为其AI智慧城市平台的合作伙伴,而现在,华为成为了英伟达不得不重视的竞争对手。 

结语

经过2023年的火爆,2024年的AI服务器市场很可能会更加旺盛,这给相关高性能芯片、特别是GPU厂商提供了更多商机。 

对于行业领导厂商而言,众多竞争对手,甚至包括客户都虎视眈眈。站得越高,如果处理不好的话,摔得就会越惨,需要在技术、产品和商业推广等多方面,充分发挥原有优势,压制竞争对手,才能保持行业地位。 

对于英伟达来说,2024年的AI服务器GPU市场依然会是它的天下。但在不断变化、发展的高性能计算市场,谁能断定两三年后的技术和产品市场会有多大变化呢?就像两年前,谁能断定华为能在2023年达成电话处理器制造突破一样。 

本文来自微信公众号“半导体产业纵横”(ID:ICViews),作者:畅秋,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。

+12

好文章,需要你的鼓励

半导体产业纵横特邀作者0收  藏+10评  论打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮微  博沉浸阅读返回顶部参与评论评论千万条,友善第一条登录后参与讨论(Discuss)提交评论0/1000你可能也喜欢这些文章上榜一个季度后,英特尔跌出十大晶圆代工厂榜单ASML被曝计划搬离荷兰,半导体产业会迎来巨变吗?英伟达跌了又涨,半导体股过热了吗?骁龙X Elite再添新成员,AI如何放大高通PC的胜算?效仿华为,他们(They)大举进军芯片更快更强,光子芯片迎来产业爆发谁能终结英伟达?华尔街热议万亿芯片大佬泡沫,他却在忙着回复“为啥常年穿皮衣”掩膜的“大”麻烦最新文章推荐氪星晚报 | 京东正式发布3C数码“先人一步”计划;蔚来推出买车送电话活动;李强:发挥我国应用场景丰富的优势,为人工智能产业发展营造更加宽松的环境2023年营收3223亿欧元,大众计划今年(This Year)推30款新车华为北汽合作车型“享界S9”曝光,纯电轿车最高时速214km | 最前线小鹏汽车(Car)证实联合创始人退位:2大清华系高管卸任小米宁王北汽联手,投资10亿建首都电池工厂海尔智家徐萌:份额遥遥领先、高端绝对引领刚提车就“直降5万”,车主除了被割还能怎么办?用AI功能要付费,这是电话厂商没告诉你的“秘密”SHEIN、TEMU左右夹击,亚马逊也被逼“下沉”新款iPhone SE挤牙膏?目的可能是为了清除“钉子户”半导体产业纵横特邀作者

赋能祖国半导体产业,我们(We)一直在路上。

发表文章357篇最近内容GPU粥少僧多,真的要延后出货吗?2小时前更快更强,光子芯片迎来产业爆发昨天(Yesterday)芯片行业,没电了2024-03-11阅读更多内容,狠戳这里下一篇不再兼容,鸿蒙5.0要彻底脱离安卓,背后深层原因

背后的深层原因

2小时前

热门标签广州科学城发那科色轮竞争法蓝宙海带跨境又一春11处特工皇妃大风刮过奢侈品管理专业小城镇长三角城市群公共服务设施区域经济(Economy)学京津冀城市群澳大利亚旅游(Travel)石川合肥链家龙腾公关专员火鸡面马飞次日达蕉岭吴清平七维科技(Technology)触不可及两只老虎宠爱死亡搁浅关于36氪城市合作寻求报道我要入驻投资者关系商务合作关于我们(We)联系我们(We)加入我们(We)网站谣言信息举报入口热门推荐热门资讯热门产品文章标签快讯标签合作伙伴阿里云火山引擎高德个推星球日报(Daily)鲸准氪空间富途牛牛企服点评人人都是产品经理领氪36氪APP下载iOS Android36氪本站由 阿里云 提供计算与安危服务 违法和不良信息、未成年人保护举报电话:010-89650707 举报邮箱:jubao@36kr.com 网上有害信息举报© 2011~2024 首都多氪信息科技(Technology)有限公司 | 京ICP备12031756号-6 | 京ICP证150143号 | 京公网安备11010502036099号意见反馈36氪APP让一部分人先看到将来36氪鲸准氪空间

推送和解读前沿、有料的科技(Technology)创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

GPU粥少僧多,真的要延后出货吗?

您可能还会对下面的文章感兴趣:

赞(641) 踩(73) 阅读数(6580) 最新评论 查看所有评论
加载中......
发表评论