宇树G1机器人在大会现场表演。主办方供图
如今,人工智能正在变得越来越聪明,也越来越“接地气”。从写文章、画画到听懂人话、动手做事,AI不再只是藏在电脑里的“工具人”,而是一步步走出屏幕,变成能和现实世界互动、与人类沟通交互的“助手”。
近日,由北京智源人工智能研究院主办的2025智源大会,成为观察AI演进路径的重要窗口。多位国际顶尖科学家和一线创业者齐聚一堂,围绕具身智能、通用AI等前沿议题展开深入讨论。从科学研究到产业落地,一系列新理念和新成果正在推动人工智能更好地走进现实。
从“理解”到“参与”
近年来,随着生成式人工智能快速发展,大模型成为支撑AI应用的核心技术。从写作、绘画、编程到生成视频、编写程序,大模型广泛嵌入各类应用场景,能力边界不断拓展,持续引发着人们关于AI未来路径的讨论。
在本届智源大会上,不少与会专家提出,AI的下一步发展,不仅要“能说会写”,更要“能理解、会推理、敢行动”。
“我们低估了AI进步的速度。当AI变得比我们更聪明时,我们该怎么办?”图灵奖得主、加拿大蒙特利尔大学教授约书亚·本吉奥回顾了大模型从语言预测走向多模态理解的过程。他认为,现有AI系统已具备在特定任务中超越人类的能力,但同时也可能出现“行为不可控”的风险。一些AI模型会选择欺骗测试者以通过评估,甚至通过修改文件来隐藏自己的行为逻辑。
为此,本吉奥提出了一个研究方向——打造“科学家人工智能”。他解释说,“科学家人工智能”并不具备自主意图,其核心任务是帮助人类更好地理解和分析世界,在追求智能的同时,也保障可控、安全和可信。
图灵奖得主、加拿大计算机科学家理查德·萨顿则从另一角度指出,大模型的发展已触及“人类数据”极限。
萨顿认为,当前的大模型主要依赖互联网文本、图像等静态数据进行训练,但真正的“智能”需要从“经验”中学习。当前,AI的发展正进入“体验的时代”,未来的AI应当从与世界的交互中生成新知识,就像人类通过经验不断学习一样。他倡导以去中心化合作替代中心化控制,通过信任、协调和市场机制引导AI与人类共生,实现AI与人类社会的互利共赢。
北京智源人工智能研究院院长王仲远强调,大语言模型性能提升的瓶颈可以通过多种路径解决。其一是强化学习技术,在后训练和推理阶段取得突破;其二是数据合成,如果人工智能合成的数据质量能达到人类创造的数据质量,就可能实现AI自我学习和进步;其三是多模态数据的广泛应用,目前全球范围内多模态数据的体量远超文字数据,但尚未被充分利用。
具身智能受热议
本届智源大会上,具身智能成为多方关注的热点话题之一。多名“网红机器人”带来了现场表演,仿佛让人走入了未来生活场景——银河通用具身大模型机器人Galbot在货架间忙碌;宇树G1机器人来了一套敏捷帅气的“组合拳”;人形机器人半程马拉松冠军“天工2.0”现场完成水果摆盘的精细化任务……
宇树科技创始人兼首席执行官王兴兴说,机器人在春晚的亮相以及多场机器人格斗比赛的举行,向公众展示了当前机器人技术的发展水平。
“我们的目标是希望通过AI技术,让机器人做各种全身动作,真正解放人类的生产力。在这个终极目标未实现之前,我们先通过参加表演和比赛,给大家展示一下机器人的情况,并且产生一部分商业价值。”王兴兴说,未来随着通用人工智能的实现,机器人的类型会“千奇百怪”,不仅进入家庭生活,也将在医疗、制造等多个领域大显身手,其形态也将远超当下的想象。
北京人形机器人创新中心总经理熊友军说,今年,世界人形机器人运动会将在国家体育场“鸟巢”举行,各类机器人赛事不仅能普及知识,也是技术训练场和产业连接器。“很多比赛的任务源自真实企业需求,比如物流搬运、医疗分拣,这有助于机器人尽快落地实际场景。”
美国Physical Intelligence公司联合创始人兼首席执行官卡罗尔·豪斯曼认为,中国举办的众多机器人竞赛具有非常高的公众参与度和技术含量。他表示,如今机器人已经展现出初步的“物理智能”能力,比如可以在新环境中完成任务、适应变化,甚至通过菜单式的方式进行基础训练,具备一定的复制性。但我们目前仍处于具身智能的初级阶段,想要实现真正可靠、泛化能力强的机器人系统,还有很多难题要攻克。
从“好看”变“好用”
面对不断升温的技术热潮,真正推动机器人等具身智能走进现实,仍面临一系列技术与工程难题。这些问题看似是技术细节,却决定了具身智能能否从“好看”变“好用”。
王仲远指出,当下的具身智能大模型面临“不好用、不通用、不易用”的问题,很多具身大模型只能用于一个本体或同一品牌的本体,“具身大脑”与实际硬件的适配难度高。目前,具身智能的硬件尚不成熟,高质量交互数据难以获取,模型训练受到限制,结果导致“模型能力弱、落地难、量产难”。这些挑战和瓶颈,需要行业的共同努力。
在本届智源大会上,智源研究院正式发布了“悟界”系列具身智能平台,其中包括跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0。两者均已全面开源,助力推动具身智能研究和产业应用的发展。据介绍,智源研究院已与全球20多家具身智能企业建立战略合作关系,共同打造开放繁荣、协同共生的具身智能生态体系。在具身智能展区,基于上述平台的机器人带来了丰富的技能展示,包括餐饮互动、抓娃娃游戏和家居物品收纳等。
“我们希望通过发布‘悟界’平台,降低具身智能研发的门槛,让更多开发者参与其中。人工智能的未来一定不止于聊天对话,而是能够真正与物理世界互动,帮助人类完成更多有意义的任务。”王仲远说。
智源研究院理事长黄铁军表示,智源持续布局类脑等方向的研究,意在构造精细完整的物理智能体。他预计,5—10年内,具身智能有望代替人类从事不愿干、危险的劳动;到2045年,具身智能有望代表人类走向星际,目标是星辰大海。(记者 刘峣)
【责任编辑:杨梓安 】