字节豆包大模型团队提出稀疏模型架构 推理成本最高可降低83%

来源:财联社2025年02月12日 13:47

据豆包大模型团队消息,字节跳动豆包大模型Foundation团队近期提出UltraMem,一种同样将计算和参数解耦的稀疏模型架构,在保证模型效果的前提下解决了推理的访存问题。据介绍,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。

【责任编辑:刘澄谚】

投稿与新闻线索: 微信/手机: 15910626987 邮箱: 95866527@qq.com
中国能源网官方微信二维码
欢迎关注中国能源官方网站
分享让更多人看到
中国能源网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。

即时新闻

要闻推荐

热点专题

精彩视频

总书记的两会关切丨全国两会上 习近平多次强调政绩观
两会热点追踪丨全球最快高铁列车最新消息来了
两会热点追踪丨中国发展人工智能有哪些优势?
@“十五五”规划,未来5年我的职业该如何规划?

精彩图集

十四届全国人大四次会议开幕会在京举行
全国政协十四届四次会议开幕会在京举行
两会丨十四届全国人大四次会议举行新闻发布会
两会·政协开幕丨全国政协十四届四次会议首场“委员通道”集体采访活动举行
字节豆包大模型团队提出稀疏模型架构 推理成本最高可降低83%
分享到: