【AIGC 日报】2024.12.5 | 今日AI要闻:
1.DeepMind 推出 Genie 2 模型,能够根据文本和图片生成可玩的 3D 世界
2.前实习生田某某与字节跳动合作发表的论文获 NeurIPS 2024 最佳论文奖
3.中国电信举办首届 “TeleAI 开发者大会”,发布多项创新技术和产业联盟计划
更多信息整理详见下文,配图均为我采用AI绘画生成的原创作品,本次作品为悠船(Mid Journey)制作,风格代码为--sref 3420174183。
1.DeepMind 推出 Genie 2 模型,能够根据文本和图片生成可玩的 3D 世界
谷歌旗下的人工智能研究机构 DeepMind 公布了 Genie 2 模型,该模型能够根据用户输入的文字描述和图像实时生成长达一分钟的交互式三维场景。
该模型可以创建具有不同视角的连贯世界,并模拟物体交互、动画、光照、物理反射及非玩家角色的行为,具备较高的画质和场景记忆能力。
DeepMind 正将 Genie 2 视为研究和创意工具,用于快速原型设计和 AI 智能体评估。
来源:IT 之家
2.字节跳动前实习生田某某与北京大学合作发表的论文获 NeurIPS 2024 最佳论文奖
字节跳动前实习生田某某与北京大学合作的论文《视觉自回归建模:通过下一尺度预测实现可扩展的图像生成》在人工智能顶级会议 NeurIPS 中被评为最佳论文。
此前,田某某因被指控篡改代码攻击公司内部模型训练而被字节跳动辞退,并遭到公司起诉索赔 800 万元。
尽管田某某在处理事件期间否认相关指控,但字节跳动最终决定采取法律行动。此事件目前在社交媒体上引发热议,观点褒贬不一。
(日报作者注:我的观点,能力大道德低的人,对社会的破坏性更大,我对这个人的行为持负面态度)
来源:IT 之家
3.中国电信举办首届 “TeleAI 开发者大会”,发布多项创新技术和产业联盟计划
中国电信在 “2024 数字科技生态大会” 期间举办了首届 “TeleAI 开发者大会”,并在会上推出了视频生成大模型、视觉大模型产用一体化平台、具身智能、智传网等创新技术、产品和科研成果。
中国电信还发布了首个央企全自研的视频生成大模型,名为 “VAST(Video As Storyboard from Text)二阶段视频生成技术”,该技术能够根据文本描述生成包含关键构图信息的视频内容。TeleAI 视频生成大模型在视频生成评测榜单 VBench 中排名第一。
此外,TeleAI 展示了具身智能方向的多项成果,包括生活服务人形机器人、商场服务机器人、导盲服务智能机器狗以及整合大模型能力的 AI 智能眼镜。
来源:IT 之家
4.韩国成为首个工业领域机器人替代率超 10% 的国家
韩国在工业领域中将超过 10% 的劳动力替换为机器人,成为全球首个达到此水平的国家。
《2024 年世界机器人年报》显示,韩国每 10000 名员工中有 1102 台机器人,且机器人技术已广泛应用于医院、餐厅等多个行业。自 2018 年以来,韩国机器人的密度年均增长 5%,远超其他国家和地区。
韩国政府在机器人行业大量投资,将其视为应对低出生率和劳动力减少的策略之一。
韩国计划到 2030 年向机器人产业投资 24 亿美元,目标是将本土制造的核心机器人零部件比例从 44% 提升至 80%,并建立有效的技术保障体系。
来源:独立报
5.亚马逊云科技发布 “自动推理检查” 工具,旨在提高 AI 模型准确性
亚马逊云科技(AWS)推出了 “自动推理检查” 工具,该工具通过交叉验证客户信息来确保 AI 模型的响应准确性。
该工具通过 AWS Bedrock 模型托管服务中的 Guardrails 工具实现,它试图理解模型的推理过程,并判断答案是否正确。
在模型生成答案时,“自动推理检查” 将验证它们,并在发现可能错误时提供正确答案的选项。
尽管有专家认为消除 AI 幻觉具有挑战性,因为 AI 模型本质上是基于模式识别的统计系统,但 AWS 强调其工具使用 “逻辑准确” 和 “可验证的推理” 来提高可靠性。
来源:IT 之家
6.中国电信举办终端生态合作大会,宣布 2025 年目标
中国电信在 2024 年终端生态合作暨终端产业联盟会员大会上公布,联盟已有近 2000 家合作伙伴,运营终端产品近万款,预计 2024 年新增终端接入量超 2.3 亿部。
中国电信提出 2025 年目标,计划新增 5G 手机及可穿戴设备 1.3 亿部,智能家庭设备超 8000 万台,产业数字化终端超 6500 万台。
计划推进终端技术在卫星、量子、AI、云、5G 等领域的技术能力升级,包括卫星通信、量子原生应用、AI 摄像头、云电脑、5G 增强通话等方面。
来源:IT 之家
#ai创造营##ai探索计划##德里克文ai日报# @微博科技
