【视觉语言模型:让机器人读懂人类情绪】This article is part of our exclusive IEEE Journal Watch series in partnership with IEEE Xplore (http://t.cn/A6BqT0mS
随着机器人的灵活操作能力及其他肢体性能不断提升,人类与机器人并肩工作的场景也愈发普遍。若这一趋势成为现实,机器人需要在情绪感知能力上实现怎样的升级,才能顺利与人协作?
在近期一项研究中,研究人员训练协作型机器人识别人类情绪。这套识别体系不仅依托面部表情,还会结合互动场景中的各类环境信息。研究人员邀请40名志愿者开展实验,测试机器人识别情绪、调整行为的能力,以及在人机协同完成任务时,这类能力会如何影响人类对机器人及其性能的观感。该研究成果已于5月18日发表在《IEEE机器人与自动化快报》上。实验结果表明,机器人的情绪感知能力在人机互动中仍存在明显局限 (http://t.cn/AXaSIMru)。
该研究由Seung Chan Hong主导,是他在澳大利亚墨尔本大学就读本科期间的毕业论文课题。他表示,当下人们大多追捧机器人运动能力的进步,但这只是整体问题的一环。“除了提升机器人的肢体性能,我们还需在人机交互领域做出创新。”
这也促使他进一步探究人机互动中的情绪感知问题。起初,Seung Chan Hong与研究团队借助视觉语言模型(VLM)训练机器人识别人类情绪。该模型与ChatGPT等大语言模型原理相近,同时还可接收视觉信息输入。http://t.cn/AXaSIMrm
发布于 北京
