人型机器人之窗:从视觉模型剖析人型机器人进展

摘要

现阶段人型机器人模型发展重点包含视觉-动作学习模型(VLA)的优化,以及结合多元数据、提升指令解读与理解人类意图。在训练数据方面,主要透过世界模型、人类影片与VR远端训练等方式,并更著重「第一人称视角」,以增强其感知能力。尽管人型机器人的最终目标是实现通用性,但现阶段模型发展仍面临诸多挑战,使欧美与中国厂商各自发展出不同的路径。

一. 视觉模型为机器人感知核心
二. 人型机器人模型厂商布局动态
三. 拓墣观点

图一 人型机器人模型运作示意图
图二 人型机器人训练资料说明
图三 Apple HAT模型说明
图四 ViLLA架构说明

表一 第一人称视角和第三人称视角算法比较
表二 第一人称资料集举要

 

人型机器人之窗:从视觉模型剖析人型机器人进展

请输入您的会员账号与密码,即可浏览全文

Login 如何购买 下载完整报告档案 1.23MB PDF

会员专属
您好,该资料属会员权益方可浏览,您需成为会员且购买此产业项目权限才可观看,详细说明如下:
  • 拓墣产业研究院之「产业数据库」为付费的会员服务,若您尚未具备会员身份,欢迎您申请加入或是与我们的客服联络了解。
  • 若您所属公司机关已具有拓墣会员身份,并且设定予贵公司人员在线申请,请先行移至「申请会员账号」填写申请数据后送出,我们会尽快为您审核办理。若未开放在线申请,请您询问贵公司的承办联系人处理,谢谢。
  • 由于贵公司无采购此产业项目,因此您将无法浏览此篇文章,欲查询贵公司所购买的产业项目明细,请至「会员权益」查询,谢谢。
  • 客户服务专线: 02 8978-6498 ext.822
    客户服务信箱:

宣传推广

产业洞察

预估2026年全球AI光收发模组市场规模达260亿美元,关键零组件吃紧成扩产瓶颈

根据TrendForce最新研究,全球AI专用光收发模组市场进入高速成长阶段,预估市场规模 [...]

成本上调带动,预估2Q26动力电芯价格续涨

根据TrendForce最新锂电池产业研究,2026年第一季电池原料价格强势上涨,支撑动力 [...]

零组件交期拉长压抑通用型server成长动能,预估2026年整体server出货量年增13%

根据TrendForce最新server产业研究,尽管2026年AI将同步推升通用型ser [...]

Apple入局折叠手机可望拿下近2成市占,应力管理成改善折痕关键

根据TrendForce最新显示产业研究,折叠手机市场最快将于2026下半年迎来Apple [...]

预估2026年中国人型机器人产量年增94%,宇树、智元合计拿下近8成市场

根据TrendForce最新人型机器人深度研究报告,2026下半年全球人型机器人产业将进入 [...]