爽爽侃车的花总 25-02-18 11:04
微博认证:汽车博主

#又一国产大模型宣布开源#
DeepSeek 之后大模型开源成了大趋势了
大家都不藏着掖着
直接开源互惠
推动整个 AI 产业的发展
最重要的是应用的落地
这两个吉利和阶跃星辰的模型
一个做视频生成,一个做语音交互

阶跃Step - Video - T2V:是目前全球范围内参数量最大、性能最好的开源视频生成大模型,参数量达300亿,可直接生成204帧、540P分辨率的高质量视频。在复杂运动、美感人物等方面生成能力强大,语义理解和指令遵循能力突出。阶跃星辰还发布并开源了针对文生视频质量评测的新基准数据集Step - Video - T2V - Eval,评测显示该模型在指令遵循等方面表现显著超过市面上既有的效果最佳的开源视频模型。用户可在跃问网页端(http://t.cn/A6mLb2XS)和跃问App上体验其视频生成能力。

阶跃Step - Audio:是行业内首款产品级开源语音交互模型,能根据不同场景需求生成情绪、方言、语种、歌声和个性化风格的表达,可与用户自然地高质量对话,语音具有超自然、高情商等特征,还能实现高质量音色复刻和角色扮演。在LlaMA Question、Web Questions等5大主流公开测试集中性能均位列第一,在HSK - 6评测中表现突出。阶跃星辰自建并开源了多维度评估体系StepEval - Audio - 360基准测试,人工横评结果显示,该模型在各个维度上均超过了此前市面上效果最佳的开源语音模型。

发布于 上海