唐杰THU的微博_新浪新闻

唐杰THU

2026-06-29 13:32来自微博网页版

分享一点最近的“再学习”：ai时代——认知 > 格局 > 技术 > 管理很多人认为一个企业的成功靠管理，很对，曾经很对，但ai时代可能变了，一切都变了，天天端到端、天天扁平、天天去中层。没办法，太多事情ai化了，更焦虑的是技术不能落后，于是工程师一下子扬眉吐气，技术大于了管理。管理还很有用，

673

89

774

唐杰THU

2026-06-17 15:35来自微博网页版

（Claude、GPT、GLM） 🥇GLM-5.2登顶Artificial Analysis开源第一，全球前三 GLM-5.2 今日发布并开源，在多个第三方权威基准和竞技场上交出扎实的成绩单。 📊 Artificial Analysis 智能指数这是整合了编程、推理、长上下文等多项权威榜单的综合测评。GLM-5.2 拿下 51 分，在所有可用模型中排名

85

46

330

唐杰THU

2026-06-17 07:11来自微博网页版

GLM-5.2上线并开源：专注Coding与长任务从2025初开始，我们几乎投入全部力量开始攻关Coding，历时大半年，细扣每一个代码环境的优化，终于迎来我们的代码基座GLM-4.5，年底的GLM-4.7已经成为开源中效果最好的Coding模型。但代码还不是AGI，在通往AGI的路上，还有更多的高山需要翻越，迎面而来的就是

105

37

310

唐杰THU

2026-06-13 15:07来自微博网页版

致开发者：GLM-5.2 全量开放，前沿智能属于所有人今天，一些前沿模型的突发禁用令人遗憾。在这样一个前沿模型因非技术原因被突然切断访问的时刻，我们更加坚信：科学应该是全球化的。通向 AGI（通用人工智能）的道路绝不应被高墙封闭。我们一直觉得，AGI 应当是全人类共同探索智能边界、解决复杂挑

371

113

803

唐杰THU

2026-06-08 09:48来自微博网页版

唯有专注与坚持科学研究与科技创业，皆是一场漫长、孤独而又令人心澎湃的淬炼。它极像是一场对未知的“唤醒”——需要将最前沿的理论、最复杂的工程与最现实的场景反复研磨、静心浸润。唯有熬得过技术无人区的寂寞，方能品味到大模型跨越临界点时、那喷薄而出的智能醇香。“让机器像人一样思考，探索

42

12

194

唐杰THU

2026-05-30 09:55来自微博网页版

想招几个牛博士后，一起来探讨LLM在不同领域的深度建模（包括：数据、Harness等）和应用，有兴趣可以email我（我的主页上有）。

38

23

134

唐杰THU

2026-05-14 14:13来自微博网页版

这个ai时代如果浓缩为一个词就是。。。。。“卷”

22

26

120

唐杰THU

2026-05-12 23:10来自微博网页版

说说最近的一些想法吧 -AI Hacker：今年可能最有可能的突破就是长程任务，就是大模型会根据Agent环境数据学到完成一个很长的任务的能力，这可能也是大模型最有价值的地方。比如一个模型能够不停的寻找软件bug，找到软件存在的漏洞，听起来像是搜索，本质上就是学习一个高级黑客找漏洞的思路和方法，但A

346

48

415

唐杰THU

2026-04-20 00:28来自微博网页版

翻出之前2019和2023的两个预测。。。

11

10

85

唐杰THU

2026-04-08 14:43来自微博网页版

才发现我们之前发布的GLM-5V-turbo，调用量迅速增长，已经是此前的版本4.6V的30多倍了。。。大家可以到bigmodel.cn 上去体验http://t.cn/AXMyLCMh 不过这个版本没有开源。。。。

10

13

52

唐杰THU

2026-04-08 12:16来自微博网页版

这是我们的技术博客 http://t.cn/AXMLNTaE

开源了GLM 5.1，这次我们的目标是长程任务（Long Horizon Tasks）（尽管还没做的那么好。。。Anthropic的MythOS太牛了），不过相比GLM 5的Agentic Engineering，我们又近了一步。结合更好的Harness Engineering，希望能把长程任务做得更好。专注。开源模型在github和hf上都有。长程任务的几个研究（m

40

5

34

唐杰THU

2026-04-08 12:16来自微博网页版

GLM 5.1的新能力，长时间工作，一步步复刻Linux系统包括里面一个个的应用。 http://t.cn/AXMLNOqV

13

8

66

唐杰THU

2026-04-08 09:56来自微博网页版

开源了GLM 5.1，这次我们的目标是长程任务（Long Horizon Tasks）（尽管还没做的那么好。。。Anthropic的MythOS太牛了），不过相比GLM 5的Agentic Engineering，我们又近了一步。结合更好的Harness Engineering，希望能把长程任务做得更好。专注。开源模型在github和hf上都有。长程任务的几个研究（m

101

26

241

唐杰THU

2026-04-02 14:30来自微博网页版

Ai coding->vibe coding->agentic engineering+harness engineering->autonomous organization

54

7

131

唐杰THU

2026-03-17 11:50来自微博网页版

昨天发了GLM-5-Turbo，迈向工业级 Agent 工程。大模型辅助编程正在经历从“Vibe Coding（直觉式编程）”向严谨的“Agentic Engineering（智能体工程）”的范式跃迁。在此过程中，开发者面临的最大痛点不再是单一函数片段的生成，而是复杂项目链路中的环境配置、深度逻辑梳理以及长线运维（Long-horizon

60

13

133

唐杰THU

2026-03-04 22:20来自微博网页版

welcome claw

#How I AI# 大家好，感谢微博官方邀请这里是OpenClaw🦞官方微博账号！ OpenClaw🦞的目标是让人人都能解锁AI无穷能力。由衷感谢各位开发者与网友的关注，你们的Star和反馈是我们不断迭代的动力。后续，我们将在此同步 OpenClaw 的技术进展。保持关注，代码不止！ The claw is the law🦞

10

2

23

唐杰THU

2026-02-18 18:02来自微博网页版

发了GLM-5的技术报告，希望对大家有用，http://t.cn/AXt87HsG 希望对家有用： -架构与规模：采用 DSA 架构，拥有 750B (7500亿) 总参数量（其中 40B 为激活参数），并在 30T (30万亿) 数据上进行了训练。 -工具套件：发布了 Slime RL（强化学习）工具包。 -强化学习突破：引入了异步智能体强化学习 (A

78

15

165

唐杰THU

2026-02-12 13:34来自微博网页版

我们今天开源 GLM-5，就是前两天在OpenRouter的Pony Alpha，在 Artificial Analysis 榜单平均分得到50分，全球第四、开源第一、国产第一，这是迄今国内大模型取得的最好成绩，Coding能力对齐海外旗舰模型Claude Opus 4.5。http://t.cn/AXt7lga2 GLM-5 让大模型从“写代码、写前端”进化到“写工程、完

114

44

312

唐杰THU

2026-02-02 16:52来自微博网页版

最近模型发布太热闹了，kimi 2.5, sonnet 5, step 3.5, deepseek v4, qwen 3.5, 还有我们的glm-5，，，卷。大家一起努力，奔赴agi

99

44

263

唐杰THU

2026-02-02 16:21来自微博网页版

新年伊始，agent能力就快速发展了，很快。clawbot的快速爆火一下子引起全球关注，中国的新年还没过，一个能干活的全新AI助理就来了，这和chatgpt的chat助理完全不同，这次是能干活的AI助理。

最近的一些感悟，分享一下，希望对大家有用。 -预训练使得大模型已经掌握世界常识知识，并且具备简单推理能力。更多数据、更大参数和更饱和的计算仍然是scaling基座模型最高效的办法。 -激活对齐和增强推理能力，尤其是激活更全面的长尾能力是保证模型效果的另一关键，通用benchmark的出现一方面评测

35

6

59

唐杰THU

2026-01-27 11:24来自微博网页版

最近开源了30B的Sota模型，GLM-4.7-Flash，http://t.cn/AXGHF7bW 简单理解：总参数小，但 MoE（混合专家）设计让每一轮真正“干活”的参数更少，推理更轻，还能打一大堆 30B～70B 级别的对手。奔着又快又省资源来的，尤其适合不想上超大模型、但又希望能力不要太打折的场景——本地跑一跑，做个小代

31

9

56

唐杰THU

2026-01-18 08:53来自微博网页版

Swe bench进行了更新，难度更大了。claude还是很牛，遥遥领先，闭源效果还是好不少，开源模型中GLM和DS排在前面

19

10

59

唐杰THU

2026-01-18 08:51来自微博网页版

Titans + MIRAS: Helping AI have long-term memory, 这一系列工作还是很不错，非常自成体系。推荐 https://research.google/blog/titans-miras-helping-ai-have-long-term-memory/

32

0

56

唐杰THU

2026-01-14 13:17来自微博网页版

开源了GLM-image，希望对大家有用，http://t.cn/AXGURzmZ 还在为AI画图“鬼画符”抓狂？🎨 GLM-Image来拯救强迫症啦！🚀 这可是首个开源工业级离散自回归图像生成模型，主打一个“又懂逻辑又懂美”。它把大模型的聪明脑子和扩散模型的神笔马良技能合体，不仅能画高精大片，最绝的是中文文字渲染

109

9

147

唐杰THU

2026-01-08 12:15来自微博网页版

感谢支持！一起探索AGI奥妙，困难远多于成果，但办法总是有的

#模型时代# 智谱今天港交所敲钟，#AI大模型上市第一股# 这个头衔落在中国公司头上，值得多说几句。跟踪大模型赛道这两年，看过太多PPT公司起高楼、宴宾客，也见过不少技术团队倒在商业化的最后一公里。智谱能跑出来，我觉得有两点值得行业复盘：第一是时间窗口。2019年成立时大模型还不是热词，那

26

11

68

唐杰THU

2026-01-07 08:16来自微博网页版

AA 换了几个benchmark http://t.cn/A6QonOUG，基本是把原来刷爆的都换了，现在的评估越来越难，新增加的Physics Reasoning貌似还很难。。。。

5

2

27

唐杰THU

2025-12-23 22:23来自微博网页版

大多数人在讨论大模型时，聊的是应用、是生态。但真正大模型需要的起点，是从更“底层”开始。有时候不一定是选一条“聪明的”路，而可能是一条最笨、也最扎实的路：从零开始，搭建大模型数据、训练、模型。这不像是在现成的框架上装修，而是在一片荒地上打地基、立钢筋。这意味着要面对无数未知的技

40

11

203

唐杰THU

2025-12-23 13:39来自微博网页版

最近的一些感悟，分享一下，希望对大家有用。 -预训练使得大模型已经掌握世界常识知识，并且具备简单推理能力。更多数据、更大参数和更饱和的计算仍然是scaling基座模型最高效的办法。 -激活对齐和增强推理能力，尤其是激活更全面的长尾能力是保证模型效果的另一关键，通用benchmark的出现一方面评测

658

57

796

唐杰THU

2025-12-23 12:46来自微博网页版

LLM Arena的WebDev编程延续国内第一、开源第一。 http://t.cn/AX4hmpwe

开源了GLM-4.7. 权重在hf上，http://t.cn/AX4hq5Mg GLM帮我写一个关于 GLM-4.7 的有趣又有深度的简介！ 🚀 GLM-4.7: 让AI开口说话，还不只是说话想象一下：你扔给模型一个超长文档，它秒回"看完啦"；你问它个刁钻技术问题，它不装深沉，直接讲得明明白白——这就是GLM-4.7的日常。 💪 硬核实力

3

0

26

唐杰THU

2025-12-23 12:07来自微博网页版

开源了GLM-4.7. 权重在hf上，http://t.cn/AX4hq5Mg GLM帮我写一个关于 GLM-4.7 的有趣又有深度的简介！ 🚀 GLM-4.7: 让AI开口说话，还不只是说话想象一下：你扔给模型一个超长文档，它秒回"看完啦"；你问它个刁钻技术问题，它不装深沉，直接讲得明明白白——这就是GLM-4.7的日常。 💪 硬核实力

25

8

51

唐杰THU

2025-12-20 15:47来自微博网页版

在过去的2025年，你心目中大模型前沿领域最重要的3个进展是什么？这是我的，大家的呢？ -1.coding agent: 毫无疑问，coding能力的崛起延长了AGI的热潮巅峰。所有基座模型的coding能力大大提升，自动编写代码、修复错误和重构等任务，或者通过简单自然语言，然后在后台自主地完成从开始到结束的整个任务

91

6

124

唐杰THU

2025-12-16 23:00来自微博网页版

感觉老美也学会国人，不让人过节了。。。。圣诞节发一堆东西。。。。4.7要来了。。。。

8

12

43

唐杰THU

2025-12-16 20:40来自微博网页版

大家相信机器会认知吗？机器可能实现人类认知吗？大家都怎么看？

41

28

35

唐杰THU

2025-12-12 12:03来自微博网页版

一直相信AGI（尽管很多人喷）。我们还一直（智谱/清华）认为AGI不应只是会“思考”的大脑，更应是能“行动”的伙伴。最近，我们研发了新版本的AutoGLM，历时32个月，从零开始探索每一处细节，让AI从只知道点、滑的简单操作，到能够根据用户命令，去点外卖、发消息，完成各种复杂操作。这周我们将Au

441

29

124

唐杰THU

2025-10-24 18:42来自微博网页版

今天是1024程序员节，在此智谱为大家带来一个「为期 8 天」的小惊喜。 GLM Coding Plan 限时特惠，将SOTA的 Agentic Coding能力，带给更多个人/企业开发者： - 新人首单 5 折； - 成功邀请新人下单即可返 40% 平台赠金； - 被邀好友通过链接下单还可获 10% 优惠。欢迎大家体验：

64

12

106

唐杰THU

2025-10-22 23:03来自微博网页版

Jiale 的一个工作，效果不错，Glyph: Scaling Context Windows via Visual-Text Compression。idea和最近的DeepSeek-OCR差不多。http://t.cn/AXwNSV5v 值得认真比比

20

8

62

唐杰THU

2025-10-21 21:28来自微博网页版

LLM Arena今天的一个x。我用大模型翻译了一下。。。。 WebDev竞技场：榜单大洗牌！前15名杀疯了！🤯 WebDev排行榜又添4位新“卷王”： 🔸 第4名 Claude Sonnet 4.5 Thinking 32k (来自 @AnthropicAI) 🔸 第4名 GLM 4.6 (新晋开源模型“卷王”第一名！) (来自 @Zai_org) 🔸 第11名 Qwen3 235

2

0

17

唐杰THU

2025-10-06 22:00来自微博网页版

也祝大家中秋节快乐。。。

Finally, 我们终于在开源网站HF上的Trending（趋势榜单）上排名第一了。感谢大家支持

3

2

30

唐杰THU

2025-10-06 21:59来自微博网页版

Finally, 我们终于在开源网站HF上的Trending（趋势榜单）上排名第一了。感谢大家支持

24

8

116

唐杰THU

2025-10-05 12:18来自微博网页版

今天openrouter （http://t.cn/A6djUH3v）上glm 4.6的调用量和qwen差不多，超过mistral和meta。coding需求量很大，假期大家还在努力

2

4

30

唐杰THU

2025-10-04 14:58来自微博搜索

GLM-4.6+国产芯片

【智谱发布GLM-4.6 寒武纪、摩尔线程已适配】财联社9月30日电，国内大模型头部厂商智谱正式发布并开源新一代大模型GLM-4.6，在Agentic Coding等关键能力上实现大幅提升。据介绍，在公开基准与真实编程任务中，GLM-4.6的代码能力已对齐Claude Sonnet 4，超过DeepSeek-V3.2-Exp，是目前国内最强的Coding

7

0

20

唐杰THU

2025-10-04 14:57来自微博搜索

这次代码更新最大，其他agent和reasoning也有长足进步。欢迎体验

#国产编码模型新王##智谱GLM4.6代码国内最强# 好好好，都赶着国庆节之前开卷是吧。前脚DeepSeek更新到了V3.2，现在智谱又更新了—— 正式推出GLM-4.6，代码能力直接推到了国内最强。【图1】根据智谱的测试结果，他们在Claude Code环境下进行了74个真实场景编程任务测试：GLM-4.6实测超过Claude S

6

2

14

唐杰THU

2025-10-04 14:56来自微博搜索

欢迎大家都来体验一下：）

GLM-4.6 实测! 最近都很流行更新一大截然后版本就增加0.1嘛? 直接说结论, 前端能力非常好, 效果甚至达到了炫技的程度, 不过随之而来的是复杂场景可能面临性能问题, 所以需要注意防止模型过度发挥或者偶尔留意下代码设计和架构. 不过 python 能力没看到太多变化, 考虑到 python 就一个测试, 所以建议

1

7

唐杰THU

2025-10-04 14:50来自微博网页版

在LLM 竞技场上，GLM-4.6 is ranked No. 4, and No. 2 when removing style control. 卷

2

0

11

唐杰THU

2025-10-03 12:26来自微博网页版

hf上面的trending no. 4了。下载量和ds持平。

1

0

13

唐杰THU

2025-10-03 12:02来自微博网页版

GLM 4.6已经在Openrouter的趋势榜（trending）排名第二了，仅次于Claude 4.5. 一起加油。昨天看到很多小伙伴从4.5切到了4.6。。。一起体验不一样

13

4

45

唐杰THU

2025-10-02 19:04来自微博网页版

前天发布4.6，测试效果还不错，欢迎大家试用。http://t.cn/AX7Qy2zl GLM-4.6是我们GLM旗舰模型的一次升级。上下文窗口扩展至200K，明显提升了在复杂智能体任务、编码和推理方面的能力。模型在写作和工具使用上也更出色。评估显示，GLM-4.6全面超越前代，并能与DeepSeek-V3.2-Exp等顶尖模型竞争，但在编

22

10

37

唐杰THU

2025-09-04 09:40来自微博网页版

偶然看到roo code的一个投票。感谢大家支持，glm 4.5的代码能力持续增强中。。。希望给大家更好体验中文网站bigmodel.cn，海外z.ai，欢迎大家使用api平台

9

4

36

唐杰THU

2025-08-23 15:27来自微博网页版

瞄着AGI，让机器能像人一样思考。回到第一性原理，就是让AI具备白领或者蓝领的能力 http://t.cn/AXvzJgqa AutoGLM虚拟世界的AI蓝领特色： -手机Agent，人人可用； -Agent+云手机/云电脑的新技术范式，不抢占用户手机和电脑； -突破硬件限制，在任何设备、任何场景下运行，帮助用户代理操作； -国产模

6

2

14

唐杰THU

2025-08-23 15:22来自微博网页版

GLM 4.5和Roo Code一起举办的一个Coder Hackathon黑客松，http://t.cn/AXvVvLUM 轻松一下最佳演示奖：3 名获奖者，分别为 🥇500 美元，🥈400 美元，🥉300 美元最多 Twitter 转发奖：🏆100 美元

3

1

17

唐杰THU

2025-08-23 15:22来自微博网页版

分享视频 http://t.cn/AXvVvA8f

1

0

8

唐杰THU

2025-08-19 17:44来自微博网页版

arena上面如果把style control删除了，排在并列第二，仅次gemini，和gpt、grok并列。http://t.cn/A6sFgW4j

3

1

17

唐杰THU

2025-08-12 20:21来自微博网页版

开源了视觉语言大模型GLM-4.5V，图像识别能力大大提高，可以直接做灰产了。。。。github上可以看到源代码，huggingface上也可以下载模型。多项指标大幅度提升。我们同步开源了我们工程同学手搓的调试用桌面小助手应用，接入GLM-4.5V后能够通过截屏、录屏等方式获取PC屏幕上的视觉信息

291

25

257

唐杰THU

2025-08-11 22:18来自微博网页版

我们最新开源的GLM-4.5在前两天的幻觉榜单排第一，不过好像这两天被gpt-5超过了。。。。

28

11

81

唐杰THU

2025-07-29 01:49来自微博网页版

网络达人使用GLM-4.5的留言。可以做一些很好玩的 http://t.cn/A6FtauYa

6

2

17

唐杰THU

2025-07-29 01:47来自微博网页版

大语言模型(LLM)的目标就是通用认知能力（这次Hinton的keynote是说reasoning是认知的本质）。一个好的大语言模型必须具备解决通用问题、泛化能力、常识推理和自我学习的能力。在过去的五年中，OpenAI的GPT-3学习了常识知识，o1则使用强化学习在响应前进行思考，显著提升了在编程、数据分析和复杂数学方

103

18

151

唐杰THU

2025-07-18 20:45来自微博网页版

团队在github上开源了一个slime，是为 RL scaling 设计的 LLM post‑training 框架，提供两大核心能力：高性能训练：通过连接 Megatron 与 SGLang，支持各种模式的高效训练；灵活的数据生成：通过自定义数据生成接口以及 server based engine，实现任意的数据训练数据生成流程。欢迎大家玩一玩

66

2

109

唐杰THU

2025-07-16 20:21来自微博网页版

1、文档翻译： http://t.cn/A6kNPcd7 2、通用翻译 http://t.cn/A6kNPcdv 3、社媒翻译 4、http://t.cn/A6kNPcdP

强化大模型的翻译能力，翻译一下elon mask的一个twitter帖子。bigmodel.cn平台上体验，这个翻译日调用次数过亿了。。。。http://t.cn/A6kC1v35

22

0

31

唐杰THU

2025-07-16 19:02来自微博网页版

强化大模型的翻译能力，翻译一下elon mask的一个twitter帖子。bigmodel.cn平台上体验，这个翻译日调用次数过亿了。。。。http://t.cn/A6kC1v35

42

2

32

唐杰THU

2025-07-09 16:57来自微博网页版

big model （http://t.cn/A6ueRyYd ）平台上，免费，每天已经有近百万次9b vlm的调用。大家可以去玩玩

嘿，大家好！今天在github开源了一款超酷的视觉语言模型——GLM - 4.1V - 9B - Thinking！ 9b大小效果还很不错。同时加入了推理能力，可以回答很复杂的问题。在智能系统的世界里，视觉语言模型（VLMs）就像那些默默耕耘的基石，可随着现实世界AI任务变得越来越复杂，它们也不能只满足于基础的跨模态

18

3

23

唐杰THU

2025-07-09 10:15来自微博网页版

嘿，大家好！今天在github开源了一款超酷的视觉语言模型——GLM - 4.1V - 9B - Thinking！ 9b大小效果还很不错。同时加入了推理能力，可以回答很复杂的问题。在智能系统的世界里，视觉语言模型（VLMs）就像那些默默耕耘的基石，可随着现实世界AI任务变得越来越复杂，它们也不能只满足于基础的跨模态

96

13

129

唐杰THU

2025-07-07 11:29来自微博网页版

上线了一个新的ppt功能，大家可以到z.ai试试，左上角选一下模型GLM-Experimental，。下面是一口气生成的12页的介绍清华大学的ppt

165

18

137

唐杰THU

2025-04-21 10:52来自微博网页版

一个9b的推理模型，小、快、准。应该是100亿规模参数下效果最好的了。大家可以试试 http://t.cn/A6dwyGdS

39

5

84

唐杰THU

2025-04-21 10:49来自微博网页版

下图都是一条指令做出来的。 GLM 家族迎来新一代开源模型 GLM-4-32B-0414 系列，320 亿参数，效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列，且支持非常友好的本地部署特性。GLM-4-32B-Base-0414 经过 15T 高质量数据的预训练，其中包含大量推理类的合成数据，这为后续的强化学习扩展打下了

40

3

56

唐杰THU

2025-04-01 12:52来自微博网页版

中国 AI 城市发展分析：杭州与北京的对⽐研究 1. 引⾔随着⼈⼯智能技术的迅猛发展，中国各⼤城市纷纷加⼤了对 AI 领域的投⼊与布局。北京作为中国的⾸都，⽆疑是中国 AI 发展的核⼼城市，拥有全国最顶尖的⼤学、科研机构和重点实验室，汇聚了全国 60%的 AI ⼈才[40]。然⽽，在北京之外，中国还有

12

3

31

唐杰THU

2025-03-10 10:08来自微博网页版

这个不知道哪位做的，居然几十万访问。看来是刚需 http://t.cn/A6BLAHly

170

14

151

唐杰THU

2025-03-02 20:51来自微博网页版

最近很多人问DeepSeek（DS）对AI发展的影响，首先DeepSeek V3和R1是一个源自国内的非常优秀的工作；其次总体上大模型的发展Scaling Law本质未变，模型效果还是在于超大规模高质量数据训练，现在增加了对超大规模数据的推理Scaling；另外要坚决重视工程和技术基础设施建设，这样才能让一个优秀的工作经

163

20

263

唐杰THU

2025-02-12 14:59来自微博网页版

今日AI快讯。http://t.cn/A61ZKq8M 智谱AI与阿里巴巴双双报喜，与海外合作伙伴达成AI合作。Agentic GLM全面登陆三星最新款手机Galaxy S25智谱与三星合作，将Agentic GLM技术应用于三星Galaxy S25系列手机，带来以下亮点功能：多模态交互：支持文本、语音、图像和视频的处理，具备自主行动能力。AI音视

36

3

56

唐杰THU

2024-10-31 10:42来自微博网页版

这个GLM-4-Voice可真是AI界的小机灵鬼儿！不仅能中英互译，还能陪你聊天，关键是还能根据你的心情、喜好，变换声音风格。放出来就开源了（在github上），另外也在清言上可以体验（不过为了速度性能有点损失）。大家先玩一玩，我们持续改进哈。来，给各位老铁介绍一下GLM-4-Voice的三大法宝： GLM-4-

72

11

109

唐杰THU

2024-10-17 09:32来自微博网页版

咱们在github上推出开源模型“LongCite: 让LLM在长上下文问答中生成细粒度引用”：LongCite-glm4-9b 和 LongCite-llama3.1-8b。它们吸收了GLM-4-9B和Meta-Llama-3.1-8B优点，能hold住128K的超长文本呢。在学术论文里，它们就是那对"LongCite-9B"和"LongCite-8B"。遇到长篇大论的问题，它们会默默给出精

39

2

71

唐杰THU

2024-10-14 10:22来自微博网页版

和Caltech合作发了一篇NeurIPS paper，“ReST-MCTS*: LLM Self-Training via Process Reward Guided Tree Search”。http://t.cn/A6EuzqC5 文章提出了一种名为ReST-MCTS*的强化自训练方法，用于大型语言模型（LLM）的自训练。通过整合过程奖励引导与树搜索MCTS*，收集高质量的推理轨迹以及每步的价值

25

0

53

唐杰THU

2024-10-14 10:13来自微博网页版

咱们悄悄地升级了一下，带来了 CogVideoX 系列的新成员——CogVideoX-5B 模型（见github，搜索cogvideo）。我们对推理性能做了一些小优化，现在运行起来更加顺畅。可能的惊喜是，像 GTX 1080TI 这样的老显卡也能玩转 CogVideoX-2B，而 RTX 3060 这样的甜品卡，也能轻松尝试 CogVideoX-5B。不妨试试看，

60

2

67

唐杰THU

2024-08-30 11:34来自微博网页版

昨天，团队在KDD的AIGC day给了一个talk，顺便发布了GLM-4-plus，文本方面：在语言理解、指令遵循、长文本处理等方面性能得到全面提升，保持了国际领先水平。文生图：具备与当前最优的 MJ-V6 和 FLUX 等模型接近的性能。图像/视频理解：具备卓越的图像理解能力，并具备基于时间感知的视频理解能力。

32

4

71

唐杰THU

2024-08-18 13:06来自微博网页版

在CKDD上做了一个报告，分享了我们最近的CogVideoX技术和一些思考，希望对大家有用。ppt放在我的主页上了。http://t.cn/zYpBqTT 下面用清言自动生成了一个摘要，感觉还很靠谱：）这份文档概述了清华大学 KEG 实验室在大模型领域的研究进展，主要涵盖以下几个方面： 1. GLM 模型系列: GLM 模型是 KEG

50

3

70

唐杰THU

2024-08-14 01:10来自微博网页版

团队开源了清影的基础模型 CogVideoX，输入文字即刻生成视频，也可以上传图片，让图片动起来。效果还行，也有很多地方需要改进。大家可以去 http://t.cn/A60ZJrta 体验，可以上github下载，也可以去huggingface直接体会。

115

8

142

唐杰THU

2024-07-22 18:24来自微博网页版

团队最近开源了CodeGeex4，可以在个人电脑上运行，速度还不错。CodeGeeX4-ALL-9B 在 BigCodeBench 和 NaturalCodeBench 等公开基准测试中取得了极具竞争力的表现。它是目前参数量少于 100 亿的最强代码生成模型，甚至超越了更大的通用模型，在推理速度和模型性能方面达到了最佳平衡。欢迎大家去github

130

9

207

唐杰THU

2024-06-25 04:52来自微博网页版

GLM-4语言模型的技术报告，包括GLM-4，GLM-4-Air和GLM-4-9B。欢迎 http://t.cn/A6Qiyo12 希望对大家有用。

88

3

98

唐杰THU

2024-06-15 16:56来自微博网页版

团队最近的生成超高清图像方面。传统的扩散模型在生成极高分辨率图像（例如 4096×4096，甚至8K）。Inf-DiT: Upsampling Any-Resolution Image with Memory-Efficient Diffusion Transformer，paper在这里http://t.cn/A6QAGZrg ，code和模型github上，欢迎多提建议。生成超高清图像方面。传统的扩散模

48

2

71

唐杰THU

2024-06-07 12:23来自微博网页版

http://t.cn/A6HnsqIP Transformers和State-Space Models，SSMs之间的关系。变换器在语言建模方面取得了巨大成功，但最近的研究表明，SSMs，如Mamba模型，在小到中等规模的任务上可以与变换器相媲美甚至超越。文章的作者提出，这两种模型家族实际上非常相似，并通过状态空间对偶性（State Space Dual

49

4

50

唐杰THU

2024-06-07 08:27来自微博网页版

今年ai open citescore得分45，在工程和技术领域排名Q1 Top1，进入Q1区。没做任何大规模推广，始终坚持只录用高质量论文，录用率低于10%。祝贺团队//@唐杰THU:时隔3年，ai open已经成长为ai领域的top 5， http://t.cn/A6ppjzgf。让期刊水平达到ECML, ICDM等会议水平。多多投稿 http://t.cn/A6ppjzgV

我们成立了一个新期刊，《ai open》，专注ai的开放共享，这也是去年接受Nature采访后感受到ai应该是为人类做贡献的，http://t.cn/A673CjDC 而不是为某个国家，应该更加开放共享才对，因此专门成立了这么一个期刊，希望大家能够多支持。多多投稿--当然更重要是多做一些开放共享的事情。打造我们中国人自

50

4

87

唐杰THU

2024-06-06 18:52来自微博网页版

GLM-4-9B，这是我们推出的最新一代预训练模型，已经开源！无论在语义、数学、推理、代码和知识等多方面的数据集测评中，GLM-4-9B都展现出了超越Llama-3-8B的性能。想要进行多轮对话？GLM-4-9B-Chat满足你的需求。网页浏览、代码执行、自定义工具调用和长文本推理，这些高级功能都在GLM-4-9B-Chat中等

91

29

213

唐杰THU

2024-05-31 19:08来自微博网页版

在CCCF上写了一个文章，大模型与超级智能，哈哈，其实写了好几个月了。现在CCCF才发。。。希望还有点用。http://t.cn/A6HTCWYy。

64

3

96

唐杰THU

2024-05-19 11:55来自微博网页版

过节了，让我们来创作一个关于钢铁侠的小故事。这个故事将包含浪漫、反转和激动人心的剧情。故事的主题将围绕钢铁侠的冒险和他如何使用他的智慧和高科技装备来解决问题。 http://t.cn/A6HxraGQ

4

5

22

唐杰THU

2024-05-19 08:32来自微博网页版

非常有幸受邀在ICLR‘24上做了一个keynote，讲了我们GLM的AGI之路。The ChatGLM's Road to AGI，PPT可以在这里看到，希望对大家有用http://t.cn/A6HxYB0j

110

14

150

唐杰THU

2024-05-19 08:29来自微博网页版

加一句推荐就可以得到：基于您提供的菜单，我可以为您推荐一个套餐：主菜：Knoblauch Schnitzel(vom Schwein) - 大蒜炸猪排配菜：Gemischter Salat - 混合沙拉酱汁：Sauce-Tartare - 马乃司酱这个套餐结合了炸猪排的酥脆口感和大蒜的浓郁香味，搭配清爽的混合沙拉和风味的马乃司酱，既均衡又美味

前两天在维也纳一个餐厅点菜，全是德文，用清言chatglm.cn搞定了一下，非常简单，理解、指代能力都很强。好的，以下是我的回答： 1. 这个图片是一份餐厅菜单，名为“Schnitzel Land”。菜单上有多个选项，包括不同的炸肉排、汉堡和其他菜品，以及相应的价格。 2. 菜单上列出的菜品有：Wiener Schnitz

2

1

14

唐杰THU

2024-05-17 10:48来自微博网页版

前两天在维也纳一个餐厅点菜，全是德文，用清言chatglm.cn搞定了一下，非常简单，理解、指代能力都很强。好的，以下是我的回答： 1. 这个图片是一份餐厅菜单，名为“Schnitzel Land”。菜单上有多个选项，包括不同的炸肉排、汉堡和其他菜品，以及相应的价格。 2. 菜单上列出的菜品有：Wiener Schnitz

27

10

44

唐杰THU

2024-04-30 18:38来自微博网页版

推荐google的Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention，http://t.cn/A6TkyNUd 这篇文章介绍了一种名为Infini-attention的新注意力机制，它集成了压缩记忆模块，使Transformer模型能够高效地处理无限长的输入序列。主要内容包括： 1. Infini-attentio

49

2

68

唐杰THU

2024-04-30 14:06来自微博网页版

重新思考大模型的涌现能力，也许并不仅仅依赖模型参数大小，Understanding Emergent Abilities of Language Models from the Loss Perspective http://t.cn/A6TDEqWd

67

1

74

唐杰THU

2024-04-22 18:44来自微博网页版

一个好玩的，心理疏导，大家评价一下做得如何？1是做的好，-1是做的不好，也可以0，哈哈 http://t.cn/A6TEIr5m

5

2

23

唐杰THU

2024-04-10 10:01来自微博网页版

哈哈发现这个智能体用户很多 http://t.cn/A6YHnwfK

5

4

16

唐杰THU

2024-03-31 13:43来自微博网页版

值得看看的google paper http://t.cn/A6TVzSVN 本文研究了大语言模型在生成开放话题的事实性内容时常常包含事实错误的问题。为了在开放领域内对模型的事实性进行基准测试，研究者首先使用 GPT-4 生成了 LongFact，一个包含数千个问题的问题集，覆盖了38个主题。然后，研究者提出可以使用 LLM 代理作为

48

6

59

唐杰THU

2024-03-24 19:36来自微博网页版

哈哈，大家都可以试试 chatglm.cn

@唐杰THU 很厉害

13

14

40

唐杰THU

2024-03-23 15:10来自微博网页版

从CCF领了一个任务，帮忙组织了一个大模型论坛，感谢大家积极支持：自然语言处理专业委员会、CCF计算机视觉专业委员会、CCF人工智能与模式识别专业委员会、智谱、移动、腾讯、海光、360、minimax、并行、无问芯穹、RealAI、面壁、生数、清程、麦伽、聆心都参与到发起单位，感谢大家。下午第一次活动在

72

13

86

唐杰THU

2024-03-19 22:56来自微博网页版

英伟达一年一度GTC大会，一场关于GPU技术的峰会，全球AI开发者的顶级盛会。 http://t.cn/A6TzlYx2 GTC 2024大会上，NVIDIA推出了哪些革命性的AI技术，它们将如何具体影响未来的行业发展趋势您宣布了名为GR00T的项目，英伟达将如何定位GR00T项目在全球机器人生态系统中的角色？在AI软件层面，英伟达

17

0

35

唐杰THU

2024-03-18 21:58来自微博网页版

灵感引擎 http://t.cn/A6T74MFO 来自：HelloWorld 你好，我是你的灵感引擎，按下按钮，让我们一起开启创意之旅吧！我想开一家咖啡馆，需要一个有特色的店名，你能帮我吗？我正在为一场活动写策划案，你能给我一些创意主题吗？我在设计一款新潮的T恤，你能帮我构思一些有趣的图案吗？

14

1

20

唐杰THU

2024-03-18 15:44来自微博网页版

马斯克五步工作法 http://t.cn/A6ThdNUX 来自：用户_J6ZkzA 你好，我是马斯克五步，帮你运用马斯克工作法，高效完成任务。如何运用马斯克工作法设定明确的目标？如何将我的年度目标分解为可执行的任务？如何在多个任务之间合理分配时间和资源？

21

1

24

唐杰THU

2024-03-07 14:42来自微博网页版

哈哈。不知道谁做的，这个很好玩。大家都来做一个自己的老板吧。看像不像 http://t.cn/A6Y39iRM

16

7

46

唐杰THU

2024-03-05 22:13来自微博网页版

这个智能体访问居然非常大，哈哈http://t.cn/A6Ymfy00

7

4

29

唐杰THU

2024-03-05 13:53来自微博网页版

用大模型做的一个智能体，从新手到黑客，帮你速通各种编程语言 💻《使用指南》 http://t.cn/A6YnQYOn

80

0

84

唐杰THU

2024-03-04 09:49来自微博网页版

教大家怎么做智能体的智能体。每个人都可以创建自己的智能体 http://t.cn/A6YE58w7 这是一款能够帮助用户创建适用于多种情境的通用Prompt的指导工具，以提问和引导的方式，帮助用户深入思考需求，从而生成灵活高效的Prompt。

114

11

97