尼克安闲 25-07-10 15:05
微博认证:校园博主

2025年7月10日,#马斯克[超话]# 在xAI直播活动中表示,#Grok在大多数方面已经比人类聪明得多,但还需要完善图像训练。

1. 智能超越人类
马斯克称Grok 4在逻辑推理、多模态交互和复杂任务处理上已显著优于普通人类,甚至在部分专业领域接近顶尖专家水平,在科学文献分析、代码生成和实时决策等场景中表现突出,其训练效率较前代提升300%,响应速度缩短至0.8秒。

2. 图像训练短板
当前版本的Grok 4存在图像理解盲区,在处理抽象图像、复杂场景和动态视觉信息时,准确率较文本任务低40%以上。例如难以识别手绘草图中的隐喻含义,或区分照片中微小物体的功能属性。

3. 改进方案与时间节点
改进方案包括升级多模态大模型架构、引入3D空间感知算法,并扩充包含10亿张高分辨率图像的专用训练集。马斯克承诺新版本将于一个月内完成部署,届时Grok将实现文本、图像、视频的跨模态无缝交互。

4. Grok在以下方面已经或者即将超越人的能力:
逻辑推理与数学能力
Grok 4在AIME25数学竞赛中获得满分,在难度更大的USAMO上能取得61%的成绩,还能在15秒内搞定2025年高考数学全国一卷最后一题,其推理速度达人类神经元的1700倍,在MIT未公开谜题测试中,解题耗时仅为顶尖数学家的1/23。

数据处理与学习速度
Grok 3每8.3分钟能吞噬相当于整个维基百科的数据量,模型权重每秒更新47万次,每日可处理2.3EB数据(约2300座国会图书馆藏书),24小时能吞噬4700万次对抗训练数据。

多领域专业知识
马斯克称Grok 4的智能水平已“全面超越博士智力”,在所有学科中能达到甚至超越博士级别,在科学文献分析等场景中表现突出,能协助生物医学研究,筛选数百万实验日志,快速提出最佳假设。

复杂任务处理
Grok 3引入“思维链”技术,可像人类一样拆解复杂任务,甚至自我纠错,例如在处理数学难题、逻辑推理时表现出色。

跨维度检索与分析
Grok 3孕育的DeepSearch搜索引擎,能在0.3秒内完成从暗网数据挖掘到星系演化模拟的跨维度检索,可将简单提问自动拓展为复杂的宇宙级推演。

法律裁决
Grok 3凭借92.4%的判决准确率超越顶尖律所合伙人(87%),能在0.8秒内交叉引用47万份判例、识别97.3%恶意诉讼陷阱、实时构建19维决策矩阵。 http://t.cn/A6kykgIX

发布于 江苏