机器人和具身智能——上海交通大学教授熊振华

2026-05-19 16:54    2025机器人与人工智能论坛  深圳核博会

2025年11月14日,上海交通大学教授熊振华在深圳核博会机器人与人工智能论坛发表《机器人和具身智能》主旨报告。报告围绕具身智能如何赋能机器人研究展开,先回顾工业机器人、协作机器人、移动操作、仿生假肢、无人系统、特种机器人、软体机器人和手术机器人等代表性方向。随后介绍大模型与视觉、语言、动作融合带来的机器人新范式,强调具身智能通过感知、规划与执行一体化提升泛化能力。报告最后指出,具身智能在服务机器人中进展较快,但进...


2025年11月14日,上海交通大学教授熊振华在深圳核博会机器人与人工智能论坛发表《机器人和具身智能》主旨报告。

报告围绕具身智能如何赋能机器人研究展开,先回顾工业机器人、协作机器人、移动操作、仿生假肢、无人系统、特种机器人、软体机器人和手术机器人等代表性方向。随后介绍大模型与视觉、语言、动作融合带来的机器人新范式,强调具身智能通过感知、规划与执行一体化提升泛化能力。报告最后指出,具身智能在服务机器人中进展较快,但进入核电等高可靠工业场景仍面临精度、效率和成功率门槛,需要结合具体应用继续探索。

关键点
1. 报告人背景与主题引入(00:00)
主持人介绍熊振华教授来自上海交通大学,长期从事机器人技术和智能制造研究,并邀请其作“机器人和具身智能”相关报告。

2. 工业机器人快速发展与国产化提升(00:48)
报告指出,工业机器人近年来发展很快,年均增速可达百分之十以上,中国已连续多年在工业机器人市场规模上居世界第一,本土品牌供应量也首次超过百分之五十,体现出制造和应用能力的提升。

3. 机器人从机器走向人机共融(01:55)
工业机器人已广泛用于切割、搬运、打磨、焊接、喷涂等场景,并向高灵活性、仿生行为、多机器人协作方向发展。报告强调,机器人正从单纯机器发展到与人协作,再进一步向更具人形和人性化能力的方向演进。

4. 团队机器人研究的四类方向(03:43)
报告以所在研究团队为例,介绍了工业机器人与系统、生机电一体化、无人系统与特种机器人、软体机器人四类研究方向,覆盖制造、健康、无人机、危险环境作业和前沿柔性结构等领域。

5. 协作机器人重视安全与易用性(04:45)
协作机器人需要在共享空间中与人共同工作,因此本质安全、防护机制和使用便捷性非常重要。报告提到零代码编程、拖动示教、轨迹智能优化,以及通过相机和智能传感器实现散乱零件抓取、装配和分拣等应用。

6. 移动操作与多机器人协作拓展应用空间(06:01)
在机械臂基础上增加移动底盘后,机器人可变为移动操作机器人,能够在更大空间中完成搬运、装配等任务。多个移动操作机器人协同工作也类似自然界蚂蚁、蜜蜂的群体协作。

7. 仿真假肢与人机接口服务康复需求(06:31)
仿真假肢需要轻量化、小自由度和多种驱动方式,并通过近红外、肌电等传感器获取人体信号、解码意图,以帮助截肢患者完成日常生活任务。相关技术还可扩展到游戏、演示控制等人机接口,脑机接口也被认为对康复具有重要影响。

8. 无人机、特种机器人与软体机器人应用广泛(08:06)
无人机研究包括飞控、自主探索、敏捷飞行和检测应用,也可与地面、海上系统协同。特种机器人可用于炼钢、加注等危险环境;软体机器人则可实现驱控感一体化,用于柔性假肢、蛇形检测、装配等任务。

9. 手术机器人体现精细操作能力(09:33)
报告介绍了团队孵化的单孔手术机器人相关工作,展示其通过小型机械臂完成剥鸡蛋、剥葡萄皮等精细操作,说明国内手术机器人已具备完成国际同类系统相关能力的基础。

10. 大模型推动机器人进入具身智能阶段(09:59)
人工智能大模型在语音识别、图像识别和自然语言处理方面取得显著进展,相当于增强了“大脑”能力。报告认为,具身智能强调人工智能不仅处理信息,还要通过实体、运动和环境交互发挥作用,本质上是将人工智能应用到具有物理实体的机器人中。

11. 具身智能的类型与赋能路径(11:45)
具身智能可体现在人形机器人、机器狗、工业机械臂、核电专用机器人以及可穿戴智能等类型中。其关键是将大模型、数据训练、机器人本体、结构和环境结合起来,打通感知、规划和执行环节。

12. 视觉-语言-动作模型提供端到端框架(12:37)
报告重点介绍视觉-语言-动作模型,将视觉、语言和动作纳入统一框架,使机器人能够根据图像和指令直接生成动作。相比传统显式解析每个环节的方式,这种隐式端到端方法挑战较大,但优势在于更强的任务泛化能力。

13. 具身智能研究聚焦桌面操作、导航和人形机器人(13:49)
具身智能相关研究非常活跃,常见方向包括桌面操作、家庭整理、导航、移动操作、无人机和人形机器人。报告举例说明,多视角图像、模仿学习和低成本硬件可用于学习装配、厨房操作、抓取不同物体、双臂叠箱子等任务。

14. 泛化能力是动作学习的核心难点(16:27)
报告指出,通过动作示教让机器人学会任务并在未知环境中泛化,是当前研究的重要挑战。许多工作希望用更少训练获得更好的泛化能力和稳定性,而不是只完成单一任务。

15. 未来应用场景与核电落地挑战(17:08)
具身智能有望赋能工业制造、医疗健康、仓储物流、家庭服务和公共服务等领域。报告也强调,核电等特殊工业场景不是典型泛化场景,且对精度、效率和成功率要求很高,因此具身智能直接落地仍有门槛,但未来可在泛化任务和智能化应用中提供想象空间。

时间线
00:00 - 会议主持人介绍报告人学术背景、研究方向和报告主题。
00:48 - 报告开场说明机器人在核电领域具有应用前景,并从工业机器人发展趋势切入。
01:55 - 报告讨论工业机器人、人机协作、多机器人协同和人形化趋势,提出机器人正向更灵活、更智能、更接近人的方向发展。
03:43 - 报告转入团队代表性研究,依次介绍工业机器人系统、协作机器人、移动操作、仿真假肢、人机接口、无人机、特种机器人、软体机器人和手术机器人等工作。
09:59 - 报告进入人工智能与具身智能部分,说明大模型带来的能力提升,以及具身智能强调实体、运动和环境交互。
11:45 - 报告梳理具身智能的类型、数据和模型赋能方式,并说明其目标是贯通感知、规划与执行。
12:37 - 报告重点介绍视觉-语言-动作模型及其端到端特点,并展示其在桌面操作、移动操作、导航和人形机器人等研究中的应用。
17:08 - 报告展望具身智能在工业、医疗、物流、家庭和公共服务中的潜力,并总结其在核电场景应用仍需解决可靠性和落地门槛问题。

AI 延伸阅读(下文由AI生成,其内容可能存在偏差,请注意甄别):

机器人与具身智能加速融合,拓展工业、医疗与核电应用新空间

上海交通大学熊振华教授围绕“具身智能赋能机器人研究”进行了系统分享,从机器人产业发展、关键技术演进、典型研究案例到人工智能大模型带来的新变化,展示了机器人从传统自动化装备向具备感知、理解、规划和执行能力的智能系统升级的趋势。当前,工业机器人市场持续增长,中国已连续多年成为全球最大工业机器人市场,本土品牌供应量占比首次超过50%,表明国产机器人在本体制造、系统集成和工程应用方面的能力正在显著提升。机器人应用也已从汽车制造中的焊接、喷涂、搬运、打磨等典型场景,逐步扩展到核电、医疗、仓储、家庭服务和危险环境作业等更复杂领域。

机器人技术的发展方向正在从单一自动化执行走向高灵活性、仿生行为、多机器人协作和分布式智能控制。过去机器人多被视为独立运行的“机器”,如今则越来越强调与人共享空间、协同作业和安全交互。协作机器人需要具备本质安全、防护感知、拖动示教、零代码编程和轨迹智能优化等能力,使非专业人员也能更低门槛地使用机器人。与此同时,人形机器人热度上升,机器人形态正从传统机械臂、移动底盘向更接近人的结构演进,未来有望进入工业生产、公共服务、医疗康复和核电运维等场景,推动机电系统与生命系统进一步融合。

上海交通大学在机器人研究方面形成了较为完整的布局,涵盖工业机器人与系统、生机电一体化、健康机器人、无人系统、特种机器人和软体机器人等方向。在工业机器人领域,相关研究服务于汽车焊接、装配、加工和系统集成等场景,早期高校承担了许多企业尚难以独立完成的核心技术研发任务。在健康机器人方向,研究重点包括仿真假肢、康复辅助、人机接口和脑机接口等,通过机械结构设计、生物电信号解码和智能控制,帮助截肢患者完成日常抓取、搭积木等动作,也为康复训练和人机交互提供了新的技术路径。

在典型机器人研究中,视觉赋能是提升机器人柔性化能力的重要手段。通过相机、三维视觉和智能传感器,机器人可以识别散乱零件并完成抓取、装配和分拣,从而适应更加复杂多变的工业现场。移动操作机器人则将机械臂与移动底盘结合,突破固定工位限制,获得更大的工作空间,可用于搬运、装配和多机器人协同作业,其协作方式类似自然界中蚂蚁、蜜蜂等群体智能系统。无人机系统则在飞控、自主探索、敏捷飞行、建图和巡检等方面展现出能力,可服务于复杂环境检测和地空协同任务。

面向危险和极端环境,特种机器人具有重要应用价值。在核电、炼钢、危险物质加注等场景中,机器人可以替代人员执行高风险任务,降低安全风险并提升作业稳定性。软体机器人则代表了另一类前沿方向,其特点是驱动、感知和控制一体化,能够适应柔性抓取、检测、装配、仿生假肢和蛇形机器人等任务。手术机器人也体现出国产机器人技术的进步,单孔腔镜手术机器人可通过多个小型机械臂完成高精度操作,例如剥鸡蛋壳、剥葡萄皮等,说明机器人在微创医疗和精细操作领域已具备较强发展潜力。

人工智能大模型的发展为机器人带来了新的想象空间。语音识别、图像识别和自然语言处理能力的提升,使机器逐渐具备类似“大脑”的信息处理能力,但具身智能强调人工智能不能只停留在数字世界,而要拥有可与真实环境互动的物理实体。换言之,具身智能是将大模型、数据训练、感知、规划和执行能力赋能到机器人本体中,使机器人能够通过身体结构、传感系统和环境反馈完成真实任务。其形态不仅包括人形机器人,也包括专用机器人、机器狗、工业机械臂和可穿戴智能系统等。

视觉—语言—动作一体化模型,即VLA模型,是当前具身智能研究中的热点方向。传统机器人方法往往依赖显式建模、任务规划和控制算法,而VLA尝试通过统一框架,将图像输入、语言指令和动作输出连接起来,使机器人能够根据环境信息和人的自然语言指令自动识别目标、生成动作并执行抓取、移动、装配等任务。这种端到端的学习方式具有更强的泛化潜力,也推动机器人从“按程序执行”转向“理解任务并自主行动”。

具身智能的典型应用正在从桌面操作扩展到家庭服务、移动操作、双臂协作和具身导航等领域。在桌面任务中,机器人可完成抓取、整理、叠放和装配,为家庭服务和工业柔性操作奠定基础。未来,机器人有望承担叠被子、刷碗、整理房间、厨房操作和做菜等家务任务,但关键难点在于从单一任务走向多任务泛化。双臂机器人能够模拟人的双手协同,用于叠箱子、复杂装配和多物体操作;人形机器人、机器狗和移动机器人则可以通过视觉、语言指令和环境感知实现导航、跟随、问答和自主部署。通过动作示教、模仿学习和第一视角数据训练,机器人有望提升在未知环境中的理解能力、稳定性和泛化能力,但这仍是当前研究的核心难点。

从应用前景看,具身智能将在工业制造、医疗健康、仓储物流、家庭服务和公共服务中持续释放价值。在工业场景中,它可以增强机器人的协作安全、学习能力、柔性操作和复杂任务执行能力;在人形机器人进入工厂的趋势下,特斯拉等企业已开始推动相关探索,但成本、可靠性和效率仍是现实约束。医疗健康领域则可借助手术机器人、康复机器人和辅助设备提升精准性、自主性和服务能力。仓储物流场景中,具身智能可支持移动搬运、分拣、路径规划和多机器人协作,使机器人更好适应复杂仓储环境。

对于核电场景,机器人仍然具有长期而明确的应用需求。核电环境具有高风险、复杂性和特殊作业要求,机器人可在巡检、搬运、维护、检测等环节发挥作用。具身智能为核电中的部分泛化任务、复杂交互任务和智能化作业提供了新的技术框架,但核电并不是一般开放场景,而是对安全性、精度和可靠性要求极高的特殊场景,因此具身智能要直接落地仍面临较大挑战。当前许多具身智能演示系统的成功率距离工业级应用仍有差距,而传统工业机器人在特定任务中已经能够达到很高精度和稳定性。未来需要围绕核电的具体任务需求,将机器人本体技术、人工智能算法和具身智能框架结合起来,探索真正适合核电场景的可落地应用路径。



维度网

中国核电网


阅读推荐

正在加载

阅读排行