【AIGC日报】2025.12.04 | 今日要闻速览:
1、快手可灵2.6音画同出模型上线,支持画面、语音、音效同步生成
2、火山引擎发布Seedream 4.5图像模型,强化多图组合与设计能力
3、阿里千问App接入最强学习模型Qwen3-Learning,支持拍照答疑
4、Mistral AI发布Mistral 3系列开源模型,最大参数量675B
5、英伟达CFO否认失去AI领先地位,称全球AI基建仍处早期
6、汇丰驳斥AI泡沫论,称74%公司已从生成式AI获正向回报
以下为具体要闻内容:
1.快手可灵2.6音画同出模型上线,支持画面、语音、音效同步生成
快手可灵AI正式上线“音画同出”模型,单次生成即可同时产出画面、自然语音、音效及环境氛围,打通音画创作。模型提供“文生音画”和“图生音画”两条路径,让静态画面开口说话。适用于单人独白、旁白解说、多人对白及音乐表演等多种场景,实现音画全盘掌控。
来源:IT之家
2.火山引擎发布 Seedream 4.5 图像模型,强化多图组合与设计能力
火山引擎推出豆包图像创作模型 Doubao-Seedream-4.5,现开启公测。新模型重点提升了多图组合生成能力,确保多素材融合的自然感与一致性,并优化了海报排版与 Logo 设计功能,支持高精度图文混排。目前已覆盖广告营销、电商运营、影视制作等核心场景,可直接生成“成品级”物料。
来源:IT之家
3.阿里千问 App 接入最强学习模型 Qwen3-Learning,支持拍照答疑
千问 App 正式上线阿里最强学习模型 Qwen3-Learning。该模型基于 Qwen3 训练,具备强大的拍照答疑能力,支持跨文化多语言解题,融合全球 30 多个国家考试体系。同时支持小初高全学科作业及试卷的整页批改,兼容手写体识别,并能生成包含薄弱点诊断的智能小结,帮助用户提升学习效率。
来源:IT之家
4.Mistral AI 发布 Mistral 3 系列开源模型,最大参数量 675B
法国 AI 初创公司 Mistral AI 发布新一代 Mistral 3 系列模型,包括 675B 参数的混合专家模型 Mistral Large 和三款小型密集模型(14B/8B/3B),均以 Apache 2.0 协议开源。Mistral Large 3 在多语言对话和图像理解方面表现顶尖,与市场上最佳指令微调模型相当;Ministral 3 系列则凭借高性价比和低 Token 生成量脱颖而出。
来源:IT之家
5.英伟达 CFO 否认失去 AI 领先地位,称全球 AI 基建仍处早期
针对近期关于竞争对手赶超及 AI 泡沫的担忧,英伟达 CFO 科莱特・克雷斯回应称公司“绝对没有”失去领先地位,强调所有企业都在使用其平台。她指出全球 AI 基础设施建设仍处早期,预计到 2030 年投资总额将达 3-4 万亿美元。此外,她透露英伟达对 OpenAI 的千亿美元投资计划虽未最终敲定,但合作仍在继续。
来源:IT之家
6.汇丰驳斥 AI 泡沫论,称 74% 公司已从生成式 AI 获正向回报
汇丰银行最新报告反驳了“AI 泡沫”观点,指出早前关于“95% 机构无回报”的研究数据不可信。引用沃顿-GBK 的新研究显示,74% 的公司已从生成式 AI 中获得正向回报,生产效率和业务表现显著改善。汇丰认为,AI 带来的投资回报是真实且可量化的,市场不应过度依赖单一且薄弱的数据来源。
来源:IT之家
(AI声明:以上所有信息来源于网络权威来源,由AI进行文字整理及配图生成)
#科技先锋官##AI创造营##德里克文ai日报#
