xAI正式发布 Grok Voice Agent API
价格仅为每分钟 $0.05
在音频推理基准测试中排名第 1
其核心能力包括:
- 实时语音输入与输出(双向语音通信)
- 支持包括中文在内几十种语言
- 能自动识别用户语言,在对话中自由切换
- 支持调用外部工具
- 实时联网搜索与推理
- 支持情感提示控制语音
- 提供多种人声选择
- 兼容 OpenAI Realtime API 规范
现在,全球数百万辆 Tesla 汽车的语音助手都是 Grok 驱动的。
在车上,Grok 不仅能听懂你说什么,还能直接操作车辆系统:
查询电池、电量、车况
规划路线
从 X 上搜索内容
自动生成旅行计划(路线 + 停靠点 + 沿途推荐)
详细介绍:http://t.cn/AXUpKDQc
发布于 上海
