AIGC日报AI要闻_新浪新闻

【AIGC日报】2025.12.04 | 今日要闻速览：

1、快手可灵2.6音画同出模型上线，支持画面、语音、音效同步生成
2、火山引擎发布Seedream 4.5图像模型，强化多图组合与设计能力
3、阿里千问App接入最强学习模型Qwen3-Learning，支持拍照答疑
4、Mistral AI发布Mistral 3系列开源模型，最大参数量675B
5、英伟达CFO否认失去AI领先地位，称全球AI基建仍处早期
6、汇丰驳斥AI泡沫论，称74%公司已从生成式AI获正向回报

以下为具体要闻内容：

1.快手可灵2.6音画同出模型上线，支持画面、语音、音效同步生成

快手可灵AI正式上线“音画同出”模型，单次生成即可同时产出画面、自然语音、音效及环境氛围，打通音画创作。模型提供“文生音画”和“图生音画”两条路径，让静态画面开口说话。适用于单人独白、旁白解说、多人对白及音乐表演等多种场景，实现音画全盘掌控。
来源：IT之家

2.火山引擎发布 Seedream 4.5 图像模型，强化多图组合与设计能力

火山引擎推出豆包图像创作模型 Doubao-Seedream-4.5，现开启公测。新模型重点提升了多图组合生成能力，确保多素材融合的自然感与一致性，并优化了海报排版与 Logo 设计功能，支持高精度图文混排。目前已覆盖广告营销、电商运营、影视制作等核心场景，可直接生成“成品级”物料。
来源：IT之家

3.阿里千问 App 接入最强学习模型 Qwen3-Learning，支持拍照答疑

千问 App 正式上线阿里最强学习模型 Qwen3-Learning。该模型基于 Qwen3 训练，具备强大的拍照答疑能力，支持跨文化多语言解题，融合全球 30 多个国家考试体系。同时支持小初高全学科作业及试卷的整页批改，兼容手写体识别，并能生成包含薄弱点诊断的智能小结，帮助用户提升学习效率。
来源：IT之家

4.Mistral AI 发布 Mistral 3 系列开源模型，最大参数量 675B

法国 AI 初创公司 Mistral AI 发布新一代 Mistral 3 系列模型，包括 675B 参数的混合专家模型 Mistral Large 和三款小型密集模型（14B/8B/3B），均以 Apache 2.0 协议开源。Mistral Large 3 在多语言对话和图像理解方面表现顶尖，与市场上最佳指令微调模型相当；Ministral 3 系列则凭借高性价比和低 Token 生成量脱颖而出。
来源：IT之家

5.英伟达 CFO 否认失去 AI 领先地位，称全球 AI 基建仍处早期

针对近期关于竞争对手赶超及 AI 泡沫的担忧，英伟达 CFO 科莱特・克雷斯回应称公司“绝对没有”失去领先地位，强调所有企业都在使用其平台。她指出全球 AI 基础设施建设仍处早期，预计到 2030 年投资总额将达 3-4 万亿美元。此外，她透露英伟达对 OpenAI 的千亿美元投资计划虽未最终敲定，但合作仍在继续。
来源：IT之家

6.汇丰驳斥 AI 泡沫论，称 74% 公司已从生成式 AI 获正向回报

汇丰银行最新报告反驳了“AI 泡沫”观点，指出早前关于“95% 机构无回报”的研究数据不可信。引用沃顿-GBK 的新研究显示，74% 的公司已从生成式 AI 中获得正向回报，生产效率和业务表现显著改善。汇丰认为，AI 带来的投资回报是真实且可量化的，市场不应过度依赖单一且薄弱的数据来源。
来源：IT之家

(AI声明：以上所有信息来源于网络权威来源，由AI进行文字整理及配图生成）
#科技先锋官##AI创造营##德里克文ai日报#

发布于福建