kimi 刚发布了 Kimi-Audio-7B-Instruct，支持语音识别（ASR）、音频问答（AQA）、音频字幕（AAC）、语音情感识别（SER）、声音事件/场景分类（SEC/ASC）、文本到语音（TTS）、语音转换（VC）和端到端语音对话。论文地址：github.com/MoonshotAI/Kimi-Audio/blob/master/assets/kimia_report.pdf模

kimi 刚发布了 Kimi-Audio-7B-Instruct，支持语音识别（ASR）、音频问答（AQA）、音频字幕（AAC）、语音情感识别（SER）、声音事件/场景分类（SEC/ASC）、文本到语音（TTS）、语音转换（VC）和端到端语音对话。

论文地址：github.com/MoonshotAI/Kimi-Audio/blob/master/assets/kimia_report.pdf
模型地址：huggingface.co/moonshotai/Kimi-Audio-7B-Instruct
repo地址：github.com/MoonshotAI/Kimi-Audio

#AI生活指南# #ai创造营#

发布于日本