close

DEV Community

cognitalk
cognitalk

Posted on

人形机器人发展中缺失的核心要素——人机交互、情感共鸣与设计初衷


https://www.youtube.com/watch?v=9eHNYMuvQjA

这视频里,斯坦福机器人专家兼机器人编舞家 Catie Cuan(ART Lab 创始人)主要探讨了人形机器人发展中缺失的核心要素——人机交互、情感共鸣与设计初衷

以下是视频的核心内容整理:

一、 机器人发展中的“盲区”

  • 视野局限: 现阶段的机器人(如 1X、Unitree 等人形机器人)过于追求“功能性”和“替代体力劳动” [00:31]。行业陷入了“机器人必须长得像人、必须能做家务/洗碗”的狭隘愿景中 [10:18]。
  • 期望过高的陷阱: 引用了机器人泰斗 Rodney Brooks 的观点:机器人长得越像人,人类对它的期望就越高(引发镜像神经元反馈),但这往往会导致实际体验与预期的巨大落差 [09:40]。

二、 艺术与机器人的奇妙结合(Music Mode 案例)

  • 在谷歌的突破: Catie 曾在谷歌担任驻场艺术家。当时有 200 台机器人在大楼里做擦桌子、分垃圾等实用工作,但工程师们对它们很冷漠 [06:28]。
  • “让机器人成为音乐本身”: 她与团队开发了名为 “Music Mode” 的软件,将机器人的关节运动数据实时转化为音符(比如转动躯干发出低音、抓取器开合发出清脆声) [07:30]。
  • 情感共鸣: 当机器人一边擦桌子一边交织出交响乐时,许多谷歌员工被感动到哭。这证明了人类渴望在技术中感受到美好与情感连接,而不仅仅是冰冷的工具 [08:41]。

三、 她的技术探索:VLI 模型

  • 更懂人类的机器人: 她的实验室正在构建一种名为 VLI(Vision Language Interaction,视觉语言交互) 的模型 [03:32]。
  • 以人类反应为衡量标准: 传统的机器人根据指令做事,而该模型会根据人类的即时情绪和反应(比如人类的积极情感是增加了还是减少了)来评估机器人动作的成败,从而让机器人能更自然、直观地与人类社交 [03:51]。

四、 重新审视人类的价值与“为什么而建”

  • 人类是惊人的动物: 拥有机器人无法比拟的表达潜力。哪怕是日常中开一扇没见过的门、走一段没走过的楼梯、与人聊天,其背后所需的灵巧度、 specifying 和 specification,都是人类基因历经无数代进化才拥有的顶尖能力 [12:44]。
  • 终极追问——“为什么”: Catie 在斯坦福开设了一门跨计算机与戏剧表演的课程(CS 334)。她告诉学生,在当今技术(AI、3D打印器官、大模型)能轻松实现任何可能性的时代,好玩或者“能建出来”已经不是核心,真正重要的问题是:你为什么要建它(Why)?你的价值主张是什么? [15:33]。
  • 时间的价值: 时间是唯一无法扩展、对每个人都公平且不可逆的珍贵资源。把时间花在真正有挑战、有生命价值的重大问题上,这个“为什么”会支撑你走得更远 [17:13]。

Top comments (0)