新智元 26-05-13 14:46
微博认证:新智元官方微博

Voice Agent赛道从来不缺故事,但到了2026年,通用方案在金融、保险等复杂场景几乎集体哑火——听不懂方言、扛不住噪音、一被打断就逻辑崩盘。
深耕汽车金融11年的易鑫,没追通用AI的风口,而是扎进了最难啃的垂类场景,自研了一套工业级Voice Agent系统。
核心是Multi-Agent协同架构。它把一通复杂电销电话拆成多个专注的小任务,每个Agent只管一件事,流程流转由系统物理锁控制,AI根本没有「自由发挥」的机会。用户打断时,对话记录由外部框架统一管理,下一个节点拿到的永远是干净完整的上下文。
配套的降噪引擎让AI学会「选择性失聪」,低信噪比噪音消除率80%;自研Turn-Taking模型同时解析声学信号与语义意图,精准判断客户是否说完,彻底解决抢话和冷场问题。TTS大模型则覆盖普通话、七大主流方言及英语、西班牙语等多语种,剑指全球市场。
方法论层面,易鑫践行的是「Model + Harness」公式——模型负责想,架构负责管,工具链负责干。没有Harness约束的强模型,跑得越快翻车越狠。
实战数据印证了这套逻辑:接通率媲美人工坐席,加微成功率超越人工,接通加微转化率达20%以上。
有用,才是最高级的技术。