AI降本有望加速端侧应用和推理算力需求

申港证券近日发布电子行业研究周报：AI降本有望加速端侧应用和推理算力需求。

以下为研究报告摘要：

市场回顾

上周（2.3-2.7）申万电子行业指数上涨6.14%，在申万31个行业中排名第4，跑赢沪深300指数4.16%。申万电子行业三级子行业中光学元件、模拟芯片设计、数字芯片设计、集成电路封测、LED指数涨跌表现相对靠前，分别跑赢沪深300指数8.36%、6.13%、6.09%、5.52%、5.20%。

每周一谈：AI降本有望加速端侧应用和推理算力需求

DeepSeek系列大模型聚焦算法创新，带动AI训练和推理成本降低。根据DeepSeek公众号消息，公司近期发布V3和R1模型，以低成本实现性能对齐海外领军闭源模型。DeepSeek-V3为自研MoE模型，拥有671B参数，激活参数37B，在14.8T token上进行了预训练。通过算法和工程上的创新，DeepSeek-V3的生成吐字速度从20TPS大幅提高至60TPS，相比V2.5模型实现了3倍的提升。模型API服务定价为每百万输入tokens0.5元（缓存命中）/2元（缓存未命中），每百万输出tokens8元。同时，DeepSeek-R1模型推理能力提升，在数学、代码、自然语言推理等任务上，性能比肩OpenAIo1正式版。

根据半导体产业纵横公众号消息，DeepSeek-V3训练成本为557.6万美元，约为GPT-4的1/20，技术核心在于算法优化和数据效率提升，而非依赖算力堆叠。根据DeepSeek及新智元公众号消息，DeepSeek-V3采用MoE架构并创新性地采用了门控网络（gating network）将Token路由到相应的专家，提高训练效率；采用FP8混合精度训练，实现训练加速和减少GPU内存使用；采用多头潜在注意力（MLA）来实现高效推理，实现多Token预测（MTP）技术。DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力；在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时，通过DeepSeek-R1的输出，蒸馏了6个小模型开源给社区，其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果。

AI芯片和云服务公司适配DeepSeek，推动应用加速。根据芯东西公众号2月7日报道，摩尔线程、海光信息、华为昇腾等16家国产AI芯片企业相继宣布适配或上架DeepSeek模型服务，三大电信运营商、腾讯云、阿里云等云计算企业也相继宣布对DeepSeek的支持。除国内企业外，英伟达、AMD、英特尔、Cerebras Systems、Groq等海外AI芯片企业，以及亚马逊云科技、微软Azure两大海外云计算巨头已宣布支持DeepSeek模型。

我们认为，deepseek系列开源大模型对AI产业发展带来新的启发。大模型可以依靠算法创新而不是算力堆叠来获得高性价比，更低的调用成本将加速AI应用的爆发。端侧AI应用有望加快落地，一方面云服务改善AI使用体验将促进移动端换机，有利于AI手机、眼镜等消费电子上量，另外，蒸馏小模型的本地部署将带动AIPC等换机，端侧SoC和存储芯片等将迎来利好。AI应用的扩大将加大推理端调用规模，推理端算力需求有望因此受益，算法创新和数据蒸馏等创新技术或将减弱对高性能算力硬件的依赖，有望加快国产AI算力生态的构建。

投资策略：建议关注AI需求驱动和国产替代逻辑下的AI产业链及端侧消费电子相关标的海光信息、中科曙光、瑞芯微、恒讯科技、兆易创新、中兴通讯、芯源微、三环集团、富创精密、立讯精密、鹏鼎控股、领益智造、东山精密、环旭电子等，先进制程代工企业、半导体设备和零部件及材料公司中芯国际、北方华创、中微公司、华海清科、拓荆科技等。

风险提示：贸易摩擦加剧，需求复苏不及预期，产能扩张不及预期，竞争加剧（申港证券王伟）

免责声明：本文内容与数据仅供参考，不构成投资建议，使用前请核实。据此操作，风险自担。

AI降本有望加速端侧应用和推理算力需求 | 投研报告

即时新闻

要闻推荐

热点专题

精彩视频

精彩图集