多模态具身感知与交互是人工智能领域的前沿方向,致力于让智能体通过融合视觉、语言、触觉等多模态信息,实现对环境的深度理解与自然交互。该技术是数字人、机器人、智能系统实现拟人化认知与行为的关键支撑,在智能制造、元宇宙、人机协作等领域具有广阔应用前景。
目前该领域仍面临多模态信息融合不充分、动态场景响应滞后、仿真与真实环境差异大等核心挑战,制约了技术规模化落地。针对这些问题,本论坛旨在系统解析智能体如何实现从“感知”到“交互”的跨越,推动具身智能在理论与应用层面的突破。
本论坛将系统解析多模态具身智能的核心问题,涵盖从高精度仿真环境构建、数字人建模与驱动、自然手势交互机制,到多模态感知协同与场景理解等关键技术。论坛旨在汇聚学界专家,共同探讨如何突破现有技术瓶颈,推动具身智能在虚实融合环境中的创新应用与生态发展。
论坛安排
📍论坛名称:
多模态具身感知与交互
顺序 | 主题 | 主讲嘉宾 | 单位 |
1 | 手物交互及其世界模型 | 清华大学 | |
2 | 4D高斯数字人动画采集与驱动技术 | 翁冬冬 | |
3 | 空间约束和年龄因素对儿童空中手势运动的影响 | 吕菲 | 北京邮电大学 |
4 | 具身交互场景的结构化建模与感知 | 朱晨阳 | 国防科技大学 |
5 | 面向具身智能的大小脑协同和组合式场景仿真 | 盛律 | 北京航空航天大学 |
6 | Panel环节 | 刘烨斌 | 清华大学 |
翁冬冬 | 北京理工大学 | ||
吕菲 | 北京邮电大学 | ||
朱晨阳 | 国防科技大学 | ||
盛律 | 北京航空航天大学 |
论坛主席
王涌天
CCF杰出会员,北京理工大学教授
北京理工大学杰出教授,长江学者特聘教授,国家杰出青年科学基金获得者,北京市混合现实与新型显示工程技术研究中心主任。兼任科技部国家重点研发计划专项专家组成员,全国信息技术标准化技术委员会委员。长期从事虚拟现实、增强现实、技术光学等领域研究,发表SCI论文320余篇,授权发明专利230余项,主持制定虚拟现实领域国家标准6项。获国家技术发明奖、国家科技进步奖各1项,省部级科技奖励10余项。
论坛讲者
刘烨斌
清华大学教授
清华大学自动化系长聘教授,国家杰青。研究方向为三维视觉、数字人、空间智能,发表TPAMI/SIGGRAPH/CVPR/ICCV等论文百篇,谷歌学术引用13000余次。研究成果对8家知名(华为、字节、商汤等)企业技术许可。担任IEEE TVCG编委,多次担任CVPR、ICCV、ECCV领域主席,SIGGRAPH Asia技术委员会委员。任中国图象图形学学会三维视觉专委会主任。获2012年国家技术发明一等奖(排名3),2019年中国电子学会技术发明一等奖(排名1)。
报告题目:手物交互及其世界模型
报告摘要:灵巧手与物体的交互与操作是数字人和人形机器人核心困难与挑战。现实世界中人手与环境及物体的交互数据和先验构成了人形机器人与世界交互的世界模型基座。如何通过对现实世界中人手动作的重建与生成,并构建基于多模态大模型的灵巧手动作世界模型,是数字人和人形机器人研究的核心问题。本报告围绕灵巧手操作的运动捕捉、运动生成,以及手物交互视频生成,机械灵巧手世界交互等任务,并从具身智能的数据获取(真机数据、仿真数据、人体数据)关系进行分析,对报告人及国际前沿进展进行介绍,并展望未来发展趋势及机遇。
翁冬冬
北京理工大学教授
北京理工大学光电学院教授,博士生导师,国家级领军人才。长期在虚拟现实、增强现实、人机交互等领域从事教学和科研工作,主要研究方向包括虚实融合可交互虚拟角色构建、新型交互式显示等方面。主持了包括国家重点研发计划“实时高逼真孪生数字人关键技术研发与应用示范”“多模态虚实融合人机交互系统与应用示范”、国家自然基金“三维点云视觉感知驱动的大范围户外增强现实理论与方法研究”等多个科研项目。执笔起草了国内首个数字人国家标准,主持开发国内首个京剧数字人项目(梅兰芳大师复现)。以“圣威特——全球领先VR解决方案开拓者”“EVA——元宇宙时代下超逼真智能数字人行业引领者”为题指导学生获得挑战杯、互联网+等国家级创新创业大赛金奖2项。获授权专利24项,发表SCI/EI论文75篇,制定国家标准2项,出版专著2部。先后获得国家技术发明二等奖(2)、北京市技术发明一等奖(7)、中国图象图形学学会科技进步一等奖(1)等。
报告题目:4D高斯数字人动画采集与驱动技术
报告摘要:本报告系统梳理了 4D 高斯数字人动画的采集与驱动技术,重点涵盖从采集到驱动的整体系统架构、采集系统的搭建与同步方法,以及基于空间结构参数的动画驱动机制。报告首先介绍多视角相机阵列与同步触发系统的集成方案,包括时间码同步、几何标定及多源数据融合流程,用于获得连续、时空一致的高斯点云序列。随后,报告分析数字人驱动方法中基于同构网格的低维几何特征表示的技术路线,该方法绕开传统基于时间序列的驱动方式,也不依赖 3DMM 模板参数,而是通过结构一致性约束建立高斯点云与目标网格之间的映射关系,实现动画形变与运动控制。最后,报告总结该技术体系在实时渲染、多人交互和虚实融合应用中的可行性与优势,并对其在沉浸式数字人表现与内容生产中的应用前景进行讨论。
吕菲
北京邮电大学教授
北京邮电大学数字媒体与设计艺术学院副院长,教授,国家级青年人才。担任ACM SIGCHI中国执行委员会委员、中国计算机学会人机交互专委会执委、中国工业设计协会信息与交互设计专委会委员。担任国际顶级会议ACM CHI 2019设计分会副主席、国际重要会议HWID 2021大会程序主席、国际重要会议ACM SUI 2023工作坊与专题会议主席。研究方向为交互设计,主持国家自然科学基金项目、北京市社会科学基金项目(优秀)、百度项目等课题,在ACM CHI、IJHCS、SCIENCE CHINA Information Sciences等国内外重要期刊/会议上发表学术论文30余篇。出版学术专著1部、教材1部,获iF设计奖1项,授权国家专利8项。
报告题目:空间约束和年龄因素对儿童空中手势运动的影响
报告摘要:本工作通过两项受控实验(饼状菜单研究与目标获取研究),探究了儿童在不同空间约束条件下(即不同方位/距离)的空中手势交互表现,以及年龄因素对此类交互场景的影响。第一个实验记录了儿童在不同条目数量的菜单下沿特定方向操作的速度与准确度,第二个实验评估了儿童手臂运动的速度-准确度权衡特性(SAT)。本工作还对比了6-8岁与9-12岁两个年龄组的表现差异。基于这些实验,提出了一种改进的儿童空中手势交互式UI菜单设计方案。该改进方案为设定合适的方向参数与难度指标提供了建议,能显著提升儿童使用空中交互菜单的便捷性与操作效率。
朱晨阳
国防科技大学副教授
国防科技大学计算机学院副教授,入选中国科协青年人才托举计划、中国图学学会青年人才托举计划、湖湘青年英才、国防科技大学卓越青年科技人才计划。主要研究方向为计算机图形学、三维视觉和空间智能,共发表相关领域CCF A类等高水平论文40余篇,包括SIGGRAPH(TOG), CVPR, ICCV, ECCV, AAAI等,三维感知与建模相关成果获得湖南省自然科学一等奖(4)和计算机学会自然科学一等奖(3)。
报告题目:具身交互场景的结构化建模与感知
报告摘要:本报告聚焦具身智能系统对环境高效建模与感知的核心需求,探讨基于结构化环境信息与大模型技术的协同创新路径。拟从建模和感知两个方面进行汇报:在建模方面,通过大模型技术实现环境建模的范式转换,跳过显式三维几何细节重建,直接从隐式特征中提取关键结构化信息进行建模,在保证准确性的同时降低计算开销,为场景建模提供轻量化、可解释的新框架;在感知方面,针对三维感知任务,探索二维大模型知识向三维场景的迁移机制,利用结构化空间表征将二维语义预测结果与三维环境高效关联,无需额外训练即可实现实时感知,突破相关方法对大规模标注数据或模型调优的依赖。
盛律
北京航空航天大学教授
北京航空航天大学软件学院教授,入选国家级青年人才、小米青年学者和斯坦福2024年全球前2%顶尖科学家排行榜单。主要研究方向为三维视觉和具身智能。在IEEE TPAMI/IJCV以及CVPR/ICCV/NeurIPS/ICLR/ECCV等重要国际期刊和会议发表论文超过70篇,Google Scholar显示被引用数7500余次。现任ACM Computing Surveys编委,CVPR、ICLR、ECCV和ACM Multimedia领域主席,以及多个领域顶会顶刊审稿人和程序委员。任CCF和CSIG多个专委会执行委员,VALSE执行领域主席。主持或参与多项国家自然科学基金、科技部重点研发计划和省部级重点研发计划项目。
报告题目:面向具身智能的大小脑协同和组合式场景仿真
报告摘要:随着多模态大模型和生成式大模型的不断进步,围绕具身智能的研究工作已经从单一的导航、抓取等任务扩展到复杂环境中通用交互任务的广泛解决。在本次报告中,讲者将主要探讨复杂环境下具身智能的大小脑协同的基本形式,并以此为基础探讨实现具身智能体泛化解决能力的几种设计思路,包含在仿真环境和真机操作下的若干尝试和实践。此外,为满足真实三维数据稀缺瓶颈下的具身智能“虚实融合”训练的需求,本次报告也将分享利用扩散模型先验构建高精度、可编辑三维视觉内容的系列工作,研究成果有效提升具身智能体对复杂动态具身任务的学习效果。
CNCC2025
CNCC2025将于10月22-25日在哈尔滨举办。专题论坛将在往年多样化主题的基础上,首次通过“基础-前沿-未来”的一体化设计,满足不同背景参会者的需求,构建从知识获取到创新激发的完整路径,打造系统化、进阶式的参会体验。重点设置9大主题板块,每个主题板块的专题论坛由三大核心模块组成:面向前沿领域的体系性Tutorial、聚焦前沿突破的专题论坛以及探讨未来发展路径的思辨论坛。
点击“阅读原文”,进入官网。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...