算力租赁概念纪要分享
计算机首席观点:
我们从上周就开始强调“AI王者归来”并组织一系列电话会。我们再次强调:我们认为国内AI应用端将迎来发展黄金阶段,主要基于:
(1)自8月以来,国内基础大模型端先后不断开放,面向全社会使用,目前国内由于z策的大力支持,已经具备了这个条件;
(2)当前,百度、讯飞、阿里、腾讯等代表性厂商模型能力大幅进化,技术实力基本对齐GPT-3.5水平,并向GPT-4迈进。本土大模型综合能力的大幅突破,有望驱动AI应用迈入落地新阶段,迎来了很重要的阶段。
北京时间 11 月 7 日凌晨,美国人工智能公司 OpenAI 的开发者大会正式开启,创始人 Sam Altman 在台上和同事,只用 45 分钟时间,就推出了团队最新的成果 GPT-4 Turbo,后者不仅更快、有更长的上下文、而且更好的控制。
此次会议对GPT进行了六大升级,分别为更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制。这里面非常重要的一点,就是发布了GPTs,通过GPTs定制专用版ChatGPT,让开发者通过简单的自然语言对话,生成所需要的定制化AI助手,AI技术已经不止于应用于对话机器人等终端,而是要变成一个进一步提升生产力的工具。
从OpenAI 新发布会可以看到整个GPT 升级又上一个台阶,且它推出了一系列工具包,这对后续整个产业发展,尤其对算力的需求,包括多模态的需求是一个指数级的上升趋势。
因为美国对英伟达高端芯片的禁令影响,在这个角度上看,拥有存量算力的公司显得非常稀缺。我们主要推荐的标的第一有足够存量,要已经拥有高性能的英伟达的卡,其次有持续拿卡的能力,这两项能力在当前的时间显得尤其稀缺。
算力租赁领域,我们重点看好汇纳科技。汇纳科技成立合资公司,布局算力租赁业务提供支撑:2023年9月,公司与并济科技共同出资设立四川汇算智算科技有限公司,注册资本1.5亿元,公司持股51%。开展的业务方向为提供人工智能算力租赁服务、模型训练和推理服务,数据处理与分析服务,算力中心整体解决方案等。
同时,双方约定了总数不超过200台内嵌英伟达A100 GPU高性能服务器的授权运营事宜,该合资公司预计形成算力规模约4,500P;远期规划新增运营算力总规模不低于10000P。合资公司业绩承诺2023年度实现净利润不低于1,000万元,2024及2025年度实现净利润均不低于5,000万元。该合作旨在实现双方协同效应,在帮助公司开拓高性能算力服务业务的基础上,继续推进公司后续算力平台建设和运营解决方案,以及专属大模型训推一体化解决方案等融合方案。
在高性能算力服务领域,合资公司股东并济科技具备行业先发优势、稳定客户资源、持续设备采购能力与稀缺算力资源等核心竞争优势。其自 2020 年起开展相关业务,属于行业早期参与者,已实现供应环节与客户环节的全打通:在客户端,其拥有各类客户的成功经验,包括运营商、央国企、科研机构及顶尖高校等,积累了大量项目经验与客户资源;在供应端,其拥有 320 台市场稀缺的英伟达 A100 和 A800 系列服务器,H800系列服务器也在陆续到货中,供应能力持续稳定。
风险提示:行业格局变化;技术路线变化存在不确定性。
通信首席观点:
在未来核心硬件紧俏的市场格局下,国内算力租赁仍有较大发展空间。根据Omdia统计预测,第二季度英伟达的H100 GPU出货量超过816吨。考虑到单H100芯片(叠加散热器)总重量超过3公斤,则单二季度英伟达H100出货量约30万片。
根据GPU Utils预测,H100 GPU当前供给缺口近43万片。我们认为从GPU客户类型看,主要分为训练LLM的创业公司(OpenAI、Inflection等)、云服务提供商(Azure、Google Cloud、AWS)、垂类应用龙头(特斯拉等),由于云厂商、垂类应用公司自身仍对GPU有较大需求,GPU对于LLM等创业公司仍是较为“稀缺”资源。
回顾国内,我们认为算力租赁介于上游GPU供应商及下游客户间,起到了“中介人”的角色,即租即用的商业模式一定程度上降低了算力使用门槛,也令中小型LLM创业公司触及高性能GPU芯片。
国内算力租赁已经形成几大区域以及核心公司:北京是以鸿博股份为核心,上海以恒润股份为核心,深圳以利通电子为核心,广州以润建股份为核心,背后是互联网厂商的需求。他们的GPU大规模搭建的能力、IDC资源、资金支持以及渠道能力都较为领先。
同时,建议关注算力调优的公司,大模型算力客户主要关注硬件是否为超算架构的物理集群,且单次大模型训练需要用到上百张甚至几千张卡,通讯协议与节点调度甚至直接影响大模型训练速度。大模型训练的参数多、循环次数多,单次训练的算力需求,算力调优也很重要,建议重点关注恒为科技。
IDC厂商也有望逐步发力算力租赁。为解决GPU资源利用率低的问题,并满足GPU灵活调度和分配的需求,以此来降低人力成本,AI算力池是大势所趋。资源池化建立在GPU远程调度之上的,但是提供了更加细粒度的GPU算力分配手段。
国内IDC厂商跟进AIGC进程,布局超算中心,提供配套算力资源池相关的数据中心机房基础设施。根据北京超级云计算中心,大模型算力客户主要关注硬件是否为超算架构的物理集群,且单次大模型训练需要用到上百张甚至几千张卡,通讯协议与节点调度甚至直接影响大模型训练速度。
大模型训练的参数多、循环次数多,单次训练的算力需求大,我们认为算力调度可协助GPU实现算力资源优化,一定程度上解决大模型GPU训练资源不足的掣肘。工信部数据显示,2021年,我国算力核心产业规模达1.5万亿元。据中国信息通信研究院测算,2021年,我国云计算市场规模超过3000亿元。从IDC公司扩建计划看,奥飞数据、光环新网等纷纷在京津冀、大湾区扩建机房,侧面印证大城市算力缺口仍客观存在,IDC厂商仍有发力空间。
光模块:我们认为当前AI已逐渐在垂直应用领域内落地开花,算力需求量有望进一步上升,同时光通信也具有重要的发展机遇。
以数通光模块为例:
(1)传统受云计算流量增长驱动,伴随AI大算力时代的加速到来,有望获得新增长极。
AI大模型数量增加带来的训练量增长以及AI应用场景下网络架构的改变(从传统以太网架构转变为IB架构)都将显著拉升数通光模块需求。站在中长期维度,AI算力大时代的也将加速推动光模块领域的技术演进,硅光、LPO、CPO等都是充满潜力的前沿技术领域。
(2)行业内龙头优势明显,持续巩固领先地位。
以数通光模块为例,从竞争格局来看,光模块领域龙头效应显著,客户关系、供应链能力、成本管控能力、量产能力等均是核心,头部企业通过“正反馈”持续巩固领先地位。行业技术加速变革,头部企业内生&外延并举,前沿技术领域全面布局。光模块领域建议重点关注中际旭创。光模块上游包括光器件、芯片等等明年横向扩展非常多。整体看,建议重点关注中际旭创、新易盛以及长光华芯。
风险提示:行业竞争加剧,AI发展不及预期。