#每日一篇学术文章# 【基于大语言模型的双模式人机交互方法研究】(Research on a Dual-Mode Human–Robot Interaction Method Based on a Large Language Model)
当前导览机器人系统面临两大核心瓶颈:(1)仅支持单一交互模态(主动式或反应式),缺乏模态间的协同调度机制;(2)过度依赖预定义内容库,制约了自然、灵活且类人化的交互体验。针对上述问题,本文提出一种基于大语言模型(LLM)的双模态人机交互(HRI)方法。该方法主要包含以下模块:(1)主动交互模块。该模块依托机器人自身传感器阵列实现环境信息的实时感知,进而提供多维度类人化服务,涵盖安全预警、情境播报及个性化推荐等功能。(2)反应交互模块。该模块融合查询路由器和检索增强生成(RAG)方法,构建自适应响应机制,旨在提升回答准确性的同时优化响应时效。在导览场景下的验证实验表明,所提方法具有显著的效能优势:F1-score 达到 92%,相较纯 LLM 基线提升 8 个百分点(PPs),较传统 RAG 基线提升 6 个百分点;响应延迟相较于静态RAG方法中最快的基线方法(标准检索-余弦相似度法)改善了48.4%;在自然度(4.35)、智能性(4.05)、可靠性(4.48)及激励性(4.45)等李克特量表维度上均优于其他对比方法。本研究为人机交互系统向更自然、更具拟人化范式的演进提供了一条可扩展的技术路径。
来源: IET Cyber‐Systems and Robotics
发布于 浙江
