字节豆包大模型团队提出稀疏模型架构 推理成本最高可降低83%

来源:财联社2025年02月12日 13:47

据豆包大模型团队消息,字节跳动豆包大模型Foundation团队近期提出UltraMem,一种同样将计算和参数解耦的稀疏模型架构,在保证模型效果的前提下解决了推理的访存问题。据介绍,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。

投稿与新闻线索: 微信/手机: 15910626987 邮箱: 95866527@qq.com
中国能源网官方微信二维码
欢迎关注中国能源官方网站
分享让更多人看到
中国能源网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。

即时新闻

要闻推荐

热点专题

精彩视频

能源之问 | 深耕采煤沉陷区新能源 助力海南新型电力系统建设
院士对话|“十五五”,氢能发展最好的切入点在哪里?
网传深圳比亚迪坪山工厂出现火情:浓烟滚滚,火势明显
院士对话:如何提升区域能源的自给率

精彩图集

力箭二号遥一运载火箭发射成功
美以伊战事30天——战争阴影下两座城市的日常
世界最大水下盾构隧道实现双层贯通
十四届全国人大四次会议第二场“部长通道”集中采访活动举行
字节豆包大模型团队提出稀疏模型架构 推理成本最高可降低83%
分享到: