DeepSeek带来的AI变革 | 投研报告

华福证券近日发布传媒行业研究报告:DeepSeek带来的AI变革。 

以下为研究报告摘要:

一、用户量:海外加速出圈,迅速登顶全球下载榜单

1、网页端:重度用户为主,DeepSeek在24年12月26日推出V3(对标GPT4o),因其显著的性能,用户迅速开始增长,同时在1月20日发布R1(对标GPT-o1)后,进一步出圈。

2、APP端:大众用户为主,R1推出后,追平GPT-o1,迅速出圈海外。根据点点数据,从DeepSeek在美国下载排名从1月22日的201名,迅速在1月27日登顶第一名;根据七麦数据,截止1月30日,DeepSeek在168个国家位居下载榜第一名。

二、DeepSeek偏好激进性创新:架构(MOE+MLA)+精度(FP8)

1、MOE架构创新:相比过去主流模型的MOE专家模型停留在8~16个,而DeepSeek每个MoE层包含1个共享专家和256个路由专家,有助于降低模型推理时激活的参数量。

2、MLA架构创新:MLA通过联合压缩键值矩阵为低秩向量,将多个头的键值信息融合,使推理时仅需缓存少量低秩向量,大幅降低KV缓存需求,减少内存占用。

3、训练特色:突破大模型训练固定思维(一般模型权重和梯度使用FP16,优化器参数使用FP32),敢于尝试在低精度FP8的模式下训练大模型,并且该尝试同样出现了较好的效果。

三、DeepSeek开源对AI应用和AI终端的影响:产品力竞争时代

DeepSeek从V3到R1,将进一步推动全行业大模型的提升,更快的追赶GPT4o和GPT-o1;同时成本的下降,有助于AI应用和AI终端的普及。未来行业竞争将进入“产品能力竞争”,巨头的流量优势将进一步凸显。

四、DeepSeek对推理成本的影响:用户规模和使用频次

未来推动推理成本增加的核心因素:用户规模和用户使用频次的增加。根据Grok创始人,过去60年,每10年计算成本降低约1000倍,但人们的购买量增加了10万倍,总支出反而增长了100倍。

五、投资建议

AI全球竞争时代来临,看好以为DeepSeek为代表的中国大模型的崛起,尤其看好AI应用和AI终端的落地。预期未来推理成本仍将显著增长,全球AI竞争背景下,国产替代是算力增长核心。

风险提示

AI竞争激烈,AI发展不及预期(华福证券 杨晓峰,甄熙茹)

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

 

投稿与新闻线索: 微信/手机: 15910626987 邮箱: 95866527@qq.com
欢迎关注中国能源官方网站
分享让更多人看到
中国能源网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。
即时新闻
要闻推荐
热点专题
精彩视频
追光者
采煤机的“超大份午餐”一刀煤!
藏在你家的“超级充电宝”
迎冬启序
精彩图集
济青高铁潍东上行联络线两座连续梁合龙
“双十一” 夜间物流忙
2025世界动力电池大会在四川宜宾开幕
浙江首座220千伏新型数字智能变电站投运
DeepSeek带来的AI变革 | 投研报告
分享到: