karminski-牙医 25-04-26 09:00
微博认证:AI博主

kimi 刚发布了 Kimi-Audio-7B-Instruct,支持语音识别(ASR)、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分类(SEC/ASC)、文本到语音(TTS)、语音转换(VC)和端到端语音对话。

论文地址:github.com/MoonshotAI/Kimi-Audio/blob/master/assets/kimia_report.pdf
模型地址:huggingface.co/moonshotai/Kimi-Audio-7B-Instruct
repo地址:github.com/MoonshotAI/Kimi-Audio

#AI生活指南# #ai创造营#

发布于 日本