财经新闻网消息:
近期,国内AI服务器市场最受关注的消息之一就是“阿里云A100服务器业务暂停租赁”。 不过,这一消息并未得到证实,但却引起了市场关注。 这也反映出国内算力供不应求的不争事实。
从行业来看,算力资源的短缺确实催生了一个“好生意”,即算力租赁。 在这条赛道上,既有中北通信、云赛智联、恒威科技等传统IDC服务商参与,也有恒润股份、宏博股份、莲花健康等跨界玩家参与。
市场预计,随着算力供需矛盾升级,算力租赁或将进入新一轮涨价。 另一方面,在芯片掌控的背景下,不少算力运营商都在寻找算力的国产替代机会。 从行业角度来看,打造AI算力市场“第二极”是必由之路,这也有望加速解决“可用性”和“易用性”问题。
价格上涨传导至租赁市场
近日,有消息称,由于算力需求旺盛、供应紧张,阿里云官网暂停了A100服务器租赁业务。 市场普遍猜测阿里云目前没有可供对外租赁的库存,但这一消息并未得到证实。
国盛证券在研报中表示,随着拿卡变得更加困难,算力运营商开始“抢单”,H800服务器的报价甚至上涨到300万台。 硬件成本的增加已传导到算力租赁报价上。
以中北通信为例。 该公司于9月初签署了算力服务协议,显示其基于H800设备构建算力服务平台,提供960P算力服务。 服务费12万元/人/含税。 年。 10月25日,该公司另一份协议显示,其向对方租赁了800P算力资源,租赁价格达到25000美元/P/年(按当日汇率折算人民币17.9万元)。
“对AI算力的需求非常旺盛,各大互联网公司开始选择租用而不是购买的策略。这与之前各大互联网公司自建数据中心形成鲜明对比。这导致了租赁市场继续上涨。”国内一位领导表示。 一位IDC厂商告诉记者。
但在他看来,还有另一层供应不平衡的问题。 “由于算力仍以资产投资为主,传统IDC厂商较少参与此轮扩张。”他还表示。
浙商证券在一份研究报告中举了一个例子。 GPT-3训练使用了128台 A100服务器(训练34天),对应640P算力。 GPT-4模型训练使用了3125台 A100服务器(训练90-100天)。 天),对应于计算能力。 从GPT-3到GPT-4,模型参数大小增加了约10倍,但用于训练的GPU数量增加了近24倍。
因此,在该组织看来,国内15家大型头部模型厂商对于标准GPT-3模型的训练需求需要1920台A100/A800服务器,对应15360块GPU。 如果考虑国内五家大型头部模型厂商对标准GPT-4模型的训练需求,则需要额外增加13705台A100/A800服务器,对应近11万块GPU。
然而,国内获取芯片却受到明显阻碍。 美国商务部工业与安全局(BIS)上周更新了《先进计算芯片和半导体制造设备出口管制规则》。 此举旨在限制中国先进工艺技术和人工智能领域的发展。 A800、H800等国内主要产品受到影响。
可开采增量空间有限
国盛证券认为,短期内算力供需双方将出现阶段性失衡。 一些具有先发优势的公司已经拥有一定规模的算力储备,手头算力的价值有望因稀缺性而增加。 市场普遍认为算力租赁有望迎来一波“涨价”潮。
二级市场上,10月底至11月初,算力租赁概念已回归平静,个股出现回调甚至跌停。 但11月6日,这个概念再次集体上涨。 截至收盘,中北通信涨幅近7%,锐捷网络、优科德、弘芯电子涨幅也均超过6%。
AI算力租赁的商业本质是拥有大模型训练的软件研发厂商需要向拥有GPU资源的厂商租用GPU算力,并按月或按年支付租金。 从市场角度来看,其本质是AI算力的固定资产变现。 就其商业模式而言,可挖掘的增量价值空间有限。
浙商证券分析认为,从收益端看,AI算力租赁价格受市场供需和市场竞争影响:当供大于求时,AI算力租赁厂商议价能力较高;当供大于求时,AI算力租赁厂商拥有较高的议价能力;当供大于求时,AI算力租赁厂商拥有较高的议价能力; 而当算力资源紧缺缓解后,AI算力租赁厂商的议价能力减弱,存在租金下行的风险。
从成本端来看,考虑到算力租赁水平和折旧年限,AI算力租赁的毛利率基本固定,提升空间有限:因为AI算力租赁的成本由设备折旧和折旧组成。摊销、数据中心能耗成本、人工运维成本构成,AI算力租赁厂商对于大部分成本处于被动接受状态,议价能力较弱。
有业内人士认为,算力租赁业务的盈利规模基本由投资规模决定。 增加利润最有效的方式就是加大投入,扩大算力规模。
寻找国内算力的替代机会
据机构统计,目前全国已有30多个城市正在建设或规划智能计算中心,部分已投入运营或即将投入运营,规划总算力达数十个。
如果未来国家智能计算中心算力达到(对应),对应的AIDC建设规模空间为50-750亿元。 据不完全统计,已明确公开宣布地方规划或在建智能计算中心规模已超标。
在此背景下,由于英伟达禁止向中国销售,国内计算资源可能无法快速扩张,因此AI计算芯片和AI计算服务器的国产化就显得尤为重要。 市场开始寻求算力国产替代机会。
国盛证券认为,国产替代的短期突破点是兼容CUDA。 目前,国内GPU厂商沐希已经完成了一系列GPU的测试,目标算力为15@FP32,并兼容CUDA生态; 海光信息协处理器DCU产品兼容“类CUDA”环境。 短期内,CUDA兼容有望解决国内算力是否可用的问题。
从长远来看,需要构建独立的软硬件生态系统。 华为近日发布异构计算架构CANN 7.0。 CANN搭建了从上层深度学习框架到底层AI硬件的桥梁,支持华为盛思、Caffe、Caffe等主流AI框架。
该机构认为,拥抱类似CANN的具有自主技术的软件架构是打造AI算力市场“第二极”的必由之路,也有望解决国内算力是否“容易”的问题。使用。”
需要看到的是,不少算力运营商已经走上了寻求国产替代的道路。 中北通信在近期机构交流中透露,公司近期与华为就华为根技术生态联盟合作、技术与业务合作等进行了交流,并与Super 达成了算力合作意向。 国内算力部署规划详细。 正在实施中。
恒威科技还表示,公司与华为升腾正在探讨异构智能计算中心的技术解决方案和运维解决方案方面的合作,并正在推动一些实际项目的实施。 此外,还与华为升腾合作进行私域模型训练的测试和移植,并推送一体机。
宏芯电子近日也向机构透露,公司已与燧原科技、摩尔线程签署协议,建立战略合作关系,深度绑定国内核心AI算力芯片企业,推动AI算力芯片和服务器国产化。
就连跨界玩家宏博股份也表示,该公司子公司英博数码实时关注并同步国内硬件的训练数据,并与主流领先公司保持深入、密切的技术交流。
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com