Nvidia发布6.3万亿Token大型AI训练数据库 | 投研报告

甬兴证券近日发布全球AI产业跟踪:Nvidia发布6.3万亿Token大型AI训练数据库。 

以下为研究报告摘要:

Nvidia:发布6.3万亿Token大型AI训练数据库

据IT之家,近日英伟达宣布推出一款名为Nemotron-CC的大型英文AI训练数据库,总计包含6.3万亿个Token,其中1.9万亿为合成数据。Nemotron-CC的开发过程中使用了模型分类器、合成数据重述(Rephrasing)等技术,最大限度地保证了数据的高质量和多样性。同时他们还针对特定高质量数据降低了传统的启发式过滤器处理权重,从而进一步提高了数据库高质量Token的数量,并避免对模型精确度造成损害。

Adobe:推出新款生成式AI工具

据IT之家,近日Adobe宣布推出一系列全新的生成式AI工具,旨在自动化处理劳动密集型生产任务,例如批量编辑图像和翻译视频演示文稿,其中包括“Firefly Bulk Create”应用,该工具允许用户一键快速调整多达10,000张图像的尺寸或替换所有背景,从而避免繁琐的逐张编辑操作。

Salesforce:称微软Copilot使用率低

据IT之家,近日Salesforce首席执行官马克?贝尼奥夫表示基于客户反馈,微软Copilot并未给客户带来变革性的体验,使用率极低,客户更倾向于ChatGPT等工具的情况。

科大讯飞:深度推理模型X1发布,唯一全国产算力训练

据IT之家,近日讯飞发布星火深度推理模型X1,讯飞星火4.0Turbo底座能力迎来全新升级,同时首发星火语音同传大模型。X1为国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型,与通用大模型相比,讯飞星火X1号称在解题过程更接近人类的“慢思考”方式,且用更少的算力,“实现了业界一流的效果,多项指标国内第一”。技术上,其中文数学能力国内第一;应用上,已落地教育、医疗等多个真实场景。

投资建议

Nvidia发布训练数据库、讯飞发布深度推理模型,AI训推两端持续升级迭代;Adobe发布新款Gen AI工具,AI应用渗透率有望继续提升,我们看好AI全产业链景气提升,建议关注IaaS层投资机会,标的方面建议关注MSFT、GOOGL、META、AMAZON等标的。

风险提示

产业发展不及预期、政策推进力度不及预期、国产替代不及预期(甬兴证券 李行杰,夏明达 )

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

 

投稿与新闻线索: 微信/手机: 15910626987 邮箱: 95866527@qq.com
欢迎关注中国能源官方网站
分享让更多人看到
中国能源网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。
即时新闻
要闻推荐
热点专题
精彩视频
追光者
采煤机的“超大份午餐”一刀煤!
藏在你家的“超级充电宝”
迎冬启序
精彩图集
济青高铁潍东上行联络线两座连续梁合龙
“双十一” 夜间物流忙
2025世界动力电池大会在四川宜宾开幕
浙江首座220千伏新型数字智能变电站投运
Nvidia发布6.3万亿Token大型AI训练数据库 | 投研报告
分享到: