词元经济发展,不能止于数据规模

来源:科技日报2026年05月11日 09:04作者:刘园园

近来,“词元”(Token)在互联网上频频“出圈”,对“词元经济”的讨论热度也持续不减。日前发布的《全国数据资源调查报告(2025年)》显示,2025年全国年度数据生产总量达52.26泽字节(ZB),全球占比超27%;词元调用量约21100万亿,呈指数级增长。

所谓词元,是人工智能大模型处理信息的基本单元。它可以是单个汉字、标点符号,或一个词语片段。我们每次向人工智能大模型提问,以及大模型生成的文字、图片或视频等,都离不开词元的调用和运算。而词元经济,则是指在人工智能领域,围绕词元的生产、调用、分发与结算所衍生形成的新型经济形态。

可以说,词元正成为人工智能产业发展的“晴雨表”。词元调用量的不断攀升,充分彰显了我国人工智能产业欣欣向荣的发展态势。“养龙虾”全网爆火,让人们切身感受到人工智能不仅会“聊天”,还能“干活”;DeepSeek-V4预览版本正式上线并同步开源,关键性能指标达到国内外领先水平;豆包大模型披露付费计划,尝试在免费版的基础上,推出包含更多增值服务的付费版本,打开国产大模型“价值变现”的商业化想象空间……

当前,我国词元经济发展方兴未艾,但也面临诸多挑战。比如,在高端制造、金融投资等对精度和可靠性要求严苛的专业领域,从词元数据质量到模型推理过程,国产人工智能大模型的表现还“欠些火候”;“数据孤岛”现象依然存在,公共数据开发利用处于起步阶段,高质量数据集短缺,数据要素流通仍需“拆墙铺路”;利用人工智能大模型生成虚假信息、侵犯版权及肖像权等乱象层出不穷,亟须监管为其“套上缰绳”;人工智能大模型的商业模式尚在探索,清晰且可持续的“生意经”仍待市场验证。

充分激发词元经济活力,关键在于找准制约词元价值释放的瓶颈所在,精准发力、协同推进,构建起良好的词元经济生态。例如,突破核心算法等方面的技术短板,助力国产大模型在更多实际应用场景中“落地生根”;打破“数据孤岛”,让数据要素更高效地“跑起来”;健全人工智能和数据安全领域的政策法规,为词元的生成、流转及交易划好“红线”;打通大模型商业价值闭环,培育“模型即服务”“智能体即服务”等新业态,实现技术创新与商业模式创新“双向奔赴”。

推动词元经济健康发展,不应止步于词元规模的快速增长,更应着眼于发展质效的全面提升。唯有系统破解词元经济发展面临的堵点,充分释放数据要素的价值潜力,方能夯实我国人工智能产业高质量发展的根基。

投稿与新闻线索: 微信/手机: 15910626987 邮箱: 95866527@qq.com
中国能源网官方微信二维码
欢迎关注中国能源官方网站
分享让更多人看到
中国能源网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。

即时新闻

要闻推荐

热点专题

精彩视频

多批次君乐宝奶粉吃出虫子?
能源之问 | 深耕采煤沉陷区新能源 助力海南新型电力系统建设
院士对话|“十五五”,氢能发展最好的切入点在哪里?
网传深圳比亚迪坪山工厂出现火情:浓烟滚滚,火势明显

精彩图集

“五一”假期我在岗
未来产业的未来力量——“人造太阳”背后的青春“聚变”
第十三批在韩中国人民志愿军烈士遗骸今日回国
力箭二号遥一运载火箭发射成功
词元经济发展,不能止于数据规模
分享到: