快科技3月10日消息,今日,“稚暉君”創業項目智元機器人發布了首個通用具身基座模型——智元啟元大模型(Genie Operator-1)。
該大模型開創性地提出了Vision-Language-Latent-Action(ViLLA)架構,該架構由VLM(多模態大模型)+MoE(混合專家)組成,實現了可以利用人類視頻學習,完成小樣本快速泛化,降低了具身智能門檻,並成功部署到智元多款機器人本體。
通過ViLLA架構,智元機器人在五種不同複雜度任務上測試GO-1,相比已有的最優模型,GO-1成功率大幅領先,平均成功率提高了32%(46%- 78%)。
其中 “Pour Water”(倒水)、“Table Bussing”(清理桌麵) 和 “Restock Beverage”(補充飲料) 任務表現尤為突出。
此外還單獨驗證了ViLLA架構中Latent Planner的作用,可以看到增加Latent Planner可以提升12%的成功率(66%- 78%)。
據介紹,GO-1大模型借助人類和多種機器人數據,讓機器人獲得了革命性的學習能力,可泛化應用到各類的環境和物品中,快速適應新任務、學習新技能。
同時,它還支持部署到不同的機器人本體,高效地完成落地,並在實際的使用中持續不斷地快速進化。
這一係列的特點可以歸納為4個方麵:
人類視頻學習:GO-1大模型可以結合互聯網視頻和真實人類示範進行學習,增強模型對人類行為的理解,更好地為人類服務。
小樣本快速泛化:GO-1大模型具有強大的泛化能力,能夠在極少數據甚至零樣本下泛化到新場景、新任務,降低了具身模型的使用門檻,使得後訓練成本非常低。
一腦多形:GO-1大模型是通用機器人策略模型,能夠在不同機器人形態之間遷移,快速適配到不同本體,群體升智。
持續進化:GO-1大模型搭配智元一整套數據回流係統,可以從實際執行遇到的問題數據中持續進化學習,越用越聰明。
據悉,2020年,彭誌輝(稚暉君)以“華為天才少年計劃”最高檔年薪201萬元,加入華為團隊,從事昇騰AI芯片和AI算法相關研究工作,2022年年底從華為離職,2023年2月聯合創立智元機器人。
【本文結束】如需轉載請務必注明出處:快科技
責任編輯:拾柒
本文地址: http://one.zhutima.com/?id=24
文章来源:天狐定制
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
2025-07-04 17:17天狐定制
2025-07-04 17:16天狐定制
2025-07-04 17:12天狐定制
2025-07-04 16:51天狐定制
2025-07-04 16:38天狐定制
2025-07-04 16:22天狐定制
2025-07-04 16:15天狐定制
2025-07-04 15:40天狐定制
2025-07-04 15:10天狐定制
2025-07-04 14:58天狐定制
扫码二维码
获取最新动态