商汤科技“日日新SenseNova5.0”大模型体系解析 | 投研精选
来源:中国能源网 2024年04月26日 09:11
2024-04-26 09:11 来源:中国能源网

中国银河近日发布研究包公,分析:商汤日日新5.0对标GPT-4Turbo,打造“云、边、端”全栈大模型矩阵,以下为研究报告摘要: 事件:4月23日,商汤科技SenseTime在上海、深圳等多地举报技术交流日活动,发布行业首个“云、边、端”全栈大模型产品矩阵,并全新升级“日日新SenseNova5.0”(以下简称“日日新5.0”)大模型体系。

中国银河近日发布研究包公,分析:商汤日日新5.0对标GPT-4Turbo,打造“云、边、端”全栈大模型矩阵。


以下为研究报告摘要:


事件:4月23日,商汤科技SenseTime在上海、深圳等多地举报技术交流日活动,发布行业首个“云、边、端”全栈大模型产品矩阵,并全新升级“日日新SenseNova5.0”(以下简称“日日新5.0”)大模型体系。


“日日新SenseNova”大模型体系加速迭代,综合能力全面对标GPT-4Turbo。去年4月商汤首次公布“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”,截止目前已经升级迭代到第五个版本。今年2月发布的“日日新4.0”参数在百亿量级,最高支持上下文本长度128K(约12万以上中文字),本次发布的“日日新5.0”,模型采用MoE(混合专家架构),基于超过10TB tokens中英文训练、覆盖大量合成数据集,模型参数量在6000亿左右,推理时上下文窗口长度超过GPT-4Turbo(支持128K上下文),可以有效达到200K左右,同时拥有端侧扩散和语言模型,在知识、推理、数学、代码等综合能力全面对标GPT-4Turbo。


文理双修能力大幅提升,多模态能力测试排名榜首。“日日新5.0”主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4Turbo,主流客观评测上达到或超越GPT-4Turbo。1)文科能力:创意写作能力、推理能力以及总结能力均大幅提升,为教育、内容产业等垂直应用场景提供有力辅助;2)理科能力:数理能力、代码能力及推理能力达到业内领先水平,在数学方面的提升,比GPT-4提升了100%,比Llama2、3提升了400%,为金融、数据分析等场景落地提供坚实基础。3)多模态能力:其图文感知能力达到全球领先水平,根据国模太大模型权威综合基准测试体系MMbench,综合得分排名首位,在其他多模态榜单如MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU等均取得领先成绩。我们认为,“日日新SenseNova”发布节奏超预期,综合能力大幅提升,处于国内行业领先水平,推动国内通用大模型厂商加速迭代,有望降低应用端成本和门槛,进一步拓宽应用端场景,推动AI商业化进程提速。


国内首个建立“云、端、边”全栈大模型矩阵,下沉终端及垂直新场景。


除“日日新”大模型系列之外,公司还发布了“商量”2.0和小模型商量S版(SenseChat S)等不同参数量级模型版本,可适配移动端等不同终端及场景的应用需求;公司推出18亿参数规模的SenseChat-Lite版本端侧?模型,以适配在智能手机、电脑、VR眼镜等智能终端设备领域;针对金融、医疗、政务等企业级大模型应用需求,公司推出企业级大模型一体机,支持千亿模型急速和知识检索硬件加速,实现本地化部署、开箱即用。我们认为,未来通用大模型领域可能会更加集中在头部厂商,更多厂商需要向行业专业化转型,寻求赋能行业以及终端应用突破,垂类大模型以及端侧大模型将是未来主战场,市场空间广阔。


投资建议:国产大模型持续加速迭代,垂类和端侧大模型赋能应用场景端打开市场空间,建议重点关注:1、多模态大模型:商汤-W(0020.HK)、科大讯飞、昆仑万维(传媒覆盖)、万兴科技、拓尔思、大华股份、海康威视、苏州科达、云鼎科技;2、AI医疗:嘉和美康、卫宁健康;3、AI办公:金山办公、福昕软件、彩讯股份;4、AI教育:科大讯飞、欧玛软件、拓维信息;5、AI法律:通达海、金桥信息、华宇软件;6、AI金融:恒生电子、财富趋势、同花顺;7、AI能源:朗新集团、国能日新等。


风险提示:技术研发进度不及预期风险;供应链风险;政策推进不及预期风险;消费需求不及预期风险;行业竞争加剧风险。(中国银河 吴砚靖,胡天昊 )


【责任编辑:肖洁 】

投稿与新闻线索: 微信/手机: 15910626987 邮箱: 95866527@qq.com
投稿与新闻线索: 微信/手机: 15910626987邮箱: 95866527@qq.com
欢迎关注中国能源官方网站
分享让更多人看到
中国能源网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。
即时新闻
加载更多新闻
为你推荐
加载更多
商汤科技“日日新SenseNova5.0”大模型体系解析 | 投研精选
分享到: