#每日一篇学术文章# 【基于大语言模型的双模式人机交互方法研究】（Research on a Dual-Mode Human–Robot Interaction Method Based on a Large Language Model）当前导览机器人系统面临两大核心瓶颈：（1）仅支持单一交互模态（主动式或反应式），缺乏模态间的协同调度机制；（2）过度依赖

#每日一篇学术文章# 【基于大语言模型的双模式人机交互方法研究】（Research on a Dual-Mode Human–Robot Interaction Method Based on a Large Language Model）
当前导览机器人系统面临两大核心瓶颈：（1）仅支持单一交互模态（主动式或反应式），缺乏模态间的协同调度机制；（2）过度依赖预定义内容库，制约了自然、灵活且类人化的交互体验。针对上述问题，本文提出一种基于大语言模型（LLM）的双模态人机交互（HRI）方法。该方法主要包含以下模块：（1）主动交互模块。该模块依托机器人自身传感器阵列实现环境信息的实时感知，进而提供多维度类人化服务，涵盖安全预警、情境播报及个性化推荐等功能。（2）反应交互模块。该模块融合查询路由器和检索增强生成（RAG）方法，构建自适应响应机制，旨在提升回答准确性的同时优化响应时效。在导览场景下的验证实验表明，所提方法具有显著的效能优势：F1-score 达到 92%，相较纯 LLM 基线提升 8 个百分点（PPs），较传统 RAG 基线提升 6 个百分点；响应延迟相较于静态RAG方法中最快的基线方法（标准检索-余弦相似度法）改善了48.4%；在自然度（4.35）、智能性（4.05）、可靠性（4.48）及激励性（4.45）等李克特量表维度上均优于其他对比方法。本研究为人机交互系统向更自然、更具拟人化范式的演进提供了一条可扩展的技术路径。

来源： IET Cyber‐Systems and Robotics

发布于浙江