申港证券近日发布电子行业研究周报:AI降本有望加速端侧应用和推理算力需求。
以下为研究报告摘要:
市场回顾
上周(2.3-2.7)申万电子行业指数上涨6.14%,在申万31个行业中排名第4,跑赢沪深300指数4.16%。申万电子行业三级子行业中光学元件、模拟芯片设计、数字芯片设计、集成电路封测、LED指数涨跌表现相对靠前,分别跑赢沪深300指数8.36%、6.13%、6.09%、5.52%、5.20%。
每周一谈:AI降本有望加速端侧应用和推理算力需求
DeepSeek系列大模型聚焦算法创新,带动AI训练和推理成本降低。根据DeepSeek公众号消息,公司近期发布V3和R1模型,以低成本实现性能对齐海外领军闭源模型。DeepSeek-V3为自研MoE模型,拥有671B参数,激活参数37B,在14.8T token上进行了预训练。通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS大幅提高至60TPS,相比V2.5模型实现了3倍的提升。模型API服务定价为每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元。同时,DeepSeek-R1模型推理能力提升,在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。
根据半导体产业纵横公众号消息,DeepSeek-V3训练成本为557.6万美元,约为GPT-4的1/20,技术核心在于算法优化和数据效率提升,而非依赖算力堆叠。根据DeepSeek及新智元公众号消息,DeepSeek-V3采用MoE架构并创新性地采用了门控网络(gating network)将Token路由到相应的专家,提高训练效率;采用FP8混合精度训练,实现训练加速和减少GPU内存使用;采用多头潜在注意力(MLA)来实现高效推理,实现多Token预测(MTP)技术。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力;在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果。
AI芯片和云服务公司适配DeepSeek,推动应用加速。根据芯东西公众号2月7日报道,摩尔线程、海光信息、华为昇腾等16家国产AI芯片企业相继宣布适配或上架DeepSeek模型服务,三大电信运营商、腾讯云、阿里云等云计算企业也相继宣布对DeepSeek的支持。除国内企业外,英伟达、AMD、英特尔、Cerebras Systems、Groq等海外AI芯片企业,以及亚马逊云科技、微软Azure两大海外云计算巨头已宣布支持DeepSeek模型。
我们认为,deepseek系列开源大模型对AI产业发展带来新的启发。大模型可以依靠算法创新而不是算力堆叠来获得高性价比,更低的调用成本将加速AI应用的爆发。端侧AI应用有望加快落地,一方面云服务改善AI使用体验将促进移动端换机,有利于AI手机、眼镜等消费电子上量,另外,蒸馏小模型的本地部署将带动AIPC等换机,端侧SoC和存储芯片等将迎来利好。AI应用的扩大将加大推理端调用规模,推理端算力需求有望因此受益,算法创新和数据蒸馏等创新技术或将减弱对高性能算力硬件的依赖,有望加快国产AI算力生态的构建。
投资策略:建议关注AI需求驱动和国产替代逻辑下的AI产业链及端侧消费电子相关标的海光信息、中科曙光、瑞芯微、恒讯科技、兆易创新、中兴通讯、芯源微、三环集团、富创精密、立讯精密、鹏鼎控股、领益智造、东山精密、环旭电子等,先进制程代工企业、半导体设备和零部件及材料公司中芯国际、北方华创、中微公司、华海清科、拓荆科技等。
风险提示:贸易摩擦加剧,需求复苏不及预期,产能扩张不及预期,竞争加剧(申港证券 王伟)
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
【责任编辑:肖洁 】