智元机器人:发布行业首个机器人世界模型开源平台Genie Envisioner
XM外汇官网APP获悉,智元智元机器人推出了面向真实世界机器人操控的机器世界模型平台——Genie Envisioner(GE)。与传统的布行“数据—训练—评估”模式不同,GE首次将未来帧预测、业首策略学习与仿真评估融合在以视频生成核心的个机闭环架构中,使机器人在同一模型下实现“看”、器人“想”、世界“动”的模型整合推理与执行。GE-Act基于3000小时的开源真实数据,显著提升了跨平台泛化和长时序任务的平台执行能力,为具身智能的智元发展提供了新的技术路径。
01

核心创新:

视觉中心的机器世界建模范式

GE的核心创新在于其视觉中心建模范式,直接在视觉空间中建模机器人与环境的布行交互,保留了空间结构和时序信息。业首这种方法带来了两个关键优势:
- 高效的个机跨本体泛化能力:GE-Act在新平台上只需1小时(约250个演示)的遥操作数据即可实现高质量任务执行,远超现有模型。通过在视觉空间学习的通用操控表征,模型能够快速适应不同平台。
- 长时序任务的精确执行能力:GE-Act在复杂的长时序任务中表现优异,如在纸盒折叠任务中,成功率达76%,而其他优化模型的表现均低于48%。这一能力得益于其未来时空预测和创新的稀疏记忆模块,帮助机器人保持关键历史信息,避免误差累积。
02
技术架构:三大核心组件
GE平台包括三个紧密集成的组件:
- GE-Base:多视角视频世界基础模型,通过自回归视频生成框架处理多个视角输入并保持空间一致性。基于约3000小时的真实数据,训练采用两阶段策略,确保模型对不同运动速度的鲁棒性。
- GE-Act:平行流匹配动作模型,拥有160M参数的轻量级架构,将GE-Base的视觉潜在表征转换为执行指令。其异步推理模式使得系统能够以200毫秒完成54步动作推理,实现实时控制。
- GE-Sim:层次化动作条件仿真器,将视觉预测扩展至动作条件,支持闭环策略评估。GE-Sim能够将低层控制指令转化为视觉预测,同时为策略优化提供高效的评估平台。
这三个组件相辅相成,共同构成了强大的视觉中心机器人学习平台。
EWMBench: 世界模型评测套件
为评估世界模型的质量,团队开发了EWMBench评测套件,采用多项指标全方位打分。与其他先进模型的对比中,GE-Base在视觉建模质量上取得最优成绩,验证了其可靠性。
相关文章

中国工程院院士、华南理工大学教授、广东院士联合会副会长韩恩厚:以合作赋能梅州铜箔产业发展
“梅州是块人杰地灵的宝地,崇文重教的氛围让我坚信,这里未来发展潜力可观。”首次到访梅州,中国工程院院士、华南理工大学教授、广东院士联合会副会长韩恩厚便被这座城市的独特魅力深深吸引。在2025院士专家入2025-12-19
8月23日6时05分,珠海市气象台发布热带低压动态,昨夜至今热带低压总体西行,今晨23日)5时其中心位于海南省三亚市偏东方向约860公里的南海海面上北纬17.2度,东经117.6度),距离我市东南方约2025-12-19
据广东梅州大埔县应急管理局通报,8月22日下午,大埔县湖寮镇工业小区二期)基础设施施工现场在对二号挡土边坡进行加固工程施工时发生崩塌,致2名施工人员被困,并导致下方液化石油气库2个气罐遭掩埋造成泄漏。2025-12-19
8月21日,第四届琶洲算法大赛——“湾区杯”数据合规方案制定赛决赛在广州数据交易所落幕。决赛现场,从初赛中脱颖而出的10支队伍围绕康养行业跨境数据合规这一课题展开角逐,最终,六支队伍凭借出色的合规方案2025-12-19
全链赋能出品牌!驻翁源县龙仙镇工作队用林下菌菇撑起乡村振兴“致富伞”
全链赋能出品牌!驻翁源县龙仙镇工作队用林下菌菇撑起乡村振兴“致富伞”_南方+_南方plus立秋后,正是食用菌快速生长的时节。在韶关市翁源县龙仙镇的林下经济示范基地里,竹荪等食用菌正破土而出,承载着当地2025-12-19
8月23日,位于珠海市香洲区旅游路的骑乐马术俱乐部内,89匹身姿矫健的注册马匹依次列阵,为期三天的中国马术协会骑手分级考核在此拉开帷幕,考核内容涵盖了盛装舞步和场地障碍两大类别。本次考核不仅是对骑手实2025-12-19

最新评论