华为人工智能模型量化相关专利公布 可减少AI模型占用的内存

来源:中国能源网2025年02月07日 10:48

天眼查App显示,近日,华为技术有限公司申请的“人工智能模型的量化方法、处理系统和量化单元”专利公布。

摘要显示,量化单元可以基于运行AI模型的计算设备的各个计算单元的处理粒度,将量化矩阵分割成多个适用于各个计算单元的处理粒度的分块量化矩阵。量化单元可以对分块量化矩阵进行量化处理,以得到量化后的分块量化矩阵,并存储在存储器中,可以减少AI模型占用的内存。量化矩阵可以是权重矩阵,也可以是激活矩阵。量化单元量化过程中,是基于运行AI模型的计算设备的各个计算单元的处理粒度进行量化,并不需要基于张量级别进行离群值的统计,实现AI模型对权重矩阵和激活矩阵都可以进行实时量化。

【责任编辑:王少晨】

投稿与新闻线索: 微信/手机: 15910626987 邮箱: 95866527@qq.com
中国能源网官方微信二维码
欢迎关注中国能源官方网站
分享让更多人看到
中国能源网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。

即时新闻

要闻推荐

热点专题

精彩视频

总书记的两会关切丨全国两会上 习近平多次强调政绩观
两会热点追踪丨全球最快高铁列车最新消息来了
两会热点追踪丨中国发展人工智能有哪些优势?
@“十五五”规划,未来5年我的职业该如何规划?

精彩图集

十四届全国人大四次会议首场“部长通道”集中采访活动举行
两会新华社快讯:习近平参加江苏代表团审议
十四届全国人大四次会议开幕会在京举行
全国政协十四届四次会议开幕会在京举行
华为人工智能模型量化相关专利公布 可减少AI模型占用的内存
分享到: