Simon的白日梦的微博

Simon的白日梦

2024-01-09 12:19来自微博网页版

✨大家好~ 我是 Simon 阿蒙，我现在的身份有：做AI和艺术的建筑学博士 / 佛系自媒体人 / 菜鸟独立开发者 / 半个数字游民 🐶，正在努力成为比AI更有趣的人，为世界增添一点多样性[爱你] 😶‍🌫️ 📑我分享过的有用资源📑： - 🌟AI科普教程： - 金鸡奖AIGC训练营限时比赛拿奖经验分享（20

252

45

462

Simon的白日梦

2026-06-23 16:53来自微博网页版

我给中国美术学院开放媒体系上的编程艺术课程已经过半了。学生们学了 Vibe Coding / vibe Art之后兴致都很高，做出了很多虽然可能比较青涩，但是很有意思的东西🥰。为了鼓励他们，以及让大家看到他们的作品，我做了一个线上展示页面。里面有很多非常搞、非常亚、非常有意思，但当然是很有创意的作

565

11

389

Simon的白日梦

2026-07-02 15:17来自微博网页版

豆包专业版来啦！上线了几个硬核新功能，现在豆包是真正意义上能“替你动手干活”了。🥹 随便测试了几个藏在底部的进阶功能，一旦用过就真的回不去了： 👉🏻 本地电脑操控：以前整理资料点鼠标点到手酸，现在可以直接给豆包开放本地权限。下个指令：“把D盘里乱七八糟的几百张图片，按日期和尺寸

3

4

2

Simon的白日梦

2026-07-02 11:57来自微博网页版

据说能节省60%~95%的token消耗的压缩神器，不知道有人用过没，效果怎么样？🧐 Headroom，给 AI agent 做上下文压缩的本地中间层 Headroom 是一个跑在本地的 context compression layer，放在 AI agent / 应用和 LLM provider 之间，把工具输出、日志、RAG 片段、文件、对话历史先压缩，再送进模型

12

2

15

Simon的白日梦

2026-07-01 15:02来自微博网页版

这个看起来有点猛，实时流式单目3D重建🧐 LingBot-Map，用 Geometric Context Transformer 做流式 3D 重建 LingBot-Map 是 Robbyant 发布的流式 3D 重建模型，目标是从连续视频流里恢复相机位姿、深度图和点云。它处理的是一个很实际的问题：视频越长，3D 重建越需要记住过去，但不能把所有历史帧

13

1

23

Simon的白日梦

2026-07-01 11:47来自微博网页版

这个单图生成可交互游戏/视频的世界模型，据说能在 5090 上跑到 16 FPS，感觉初步具备单机可玩性了？但是说是用 wan 2.2 训练的，不知道它的世界模型推理是否足够可靠？🧐 DreamX-World：通用交互式世界模型，支持可控探索、长视频生成和世界事件编辑 DreamX-World 1.0 是一个文本/图像到视频的交

1

9

Simon的白日梦

2026-06-30 15:12来自微博网页版

这个创意很好，虽然我觉得UI可以再优化一下把操作系统的性能资源调度系统做成一个游戏。 You’re the OS!，把操作系统调度做成一款小游戏 You're the OS! 是一个把操作系统概念游戏化的开源项目：玩家不是在电脑上运行程序，而是直接扮演这台电脑的操作系统，负责管理进程、内存和 I/O 事件。它的

4

0

8

Simon的白日梦

2026-06-30 11:16来自微博网页版

话说还有人玩开源图像生成模型吗？这个基于 Kear 2 训练的真实质感 Lora，感觉出来的图感觉真的很真🥹 Krea 2 这条线有点像在补“AI 图味”的反方向：少堆摄影关键词，多还给日常现场感。 Krea 2 Realism LoRA，让 Krea 2 更偏自然纪实摄影这是一个给 Krea 2 用的写实 LoRA，作者是 gokaygokay。

13

2

20

Simon的白日梦

2026-06-29 15:44来自微博网页版

0.22B的inpainting模型，看着效果还行，很适合端侧使用 Moebius，用 0.22B 参数做出接近 10B 级模型的图像修复框架 Moebius 是华中科技大学 HUSTVL 和 VIVO AI Lab 做的轻量级 image inpainting / 图像修复框架，目标很直接：在对象移除、局部补全、人像修复这类明确任务上，不再依赖 FLUX.1-Fill-De

6

0

3

Simon的白日梦

2026-06-29 11:46来自微博网页版

话说开源视频生成模型还有人玩吗？这个 LTX 2.3的 lora 可以把粗糙的 3D 体块视频转成真实视频，我觉得还是有一定使用场景的。🥹 fal 3DREAL，把 3D 灰模 / 游戏渲染转成写实视频的 LTX-2.3 IC-LoRA fal 开源了 3DREAL，一个面向 LTX-2.3 的 render-to-real IC-LoRA。它吃的是 3D / CG / 游戏引擎

8

3

21

Simon的白日梦

2026-06-28 15:37来自微博网页版

？？？把Fable 蒸馏进12B开源模型？？😲 yuxinlu1，把 Fable 5 / Composer 2.5 的代码推理蒸到本地 12B GGUF 模型里 🔗 中文阅读链接：http://t.cn/AXSmCVa1 🌐 Hugging Face 主页：http://t.cn/AXSmCVa3 个人开发者逯雨鑫在 Hugging Face 上爆火的两个模型：基于 Gemma 4-12B 做后训练，再发

21

1

34

Simon的白日梦

2026-06-27 15:34来自微博网页版

这个开源项目好有意思，强迫你休息。不然黑洞就会吃掉你的屏幕我觉得被AI加速的时代需要更多这种”反人类”的设计小巧思🥹。终端提醒休息已经卷到天体物理了：你不休息，屏幕就被黑洞吃掉。 Ghostty Blackhole，给终端加一个会吞屏幕的番茄钟黑洞 Shader Ghostty Blackhole 是一个给 Ghostty 终

4

0

12

Simon的白日梦

2026-06-27 11:19来自微博网页版

试一下能不能用这个知识图谱生成 skill 去整理 VibeCoding 出来的屎山代码😂 Graphify，把代码库、文档和多媒体资料变成可查询知识图谱的 AI 编程助手技能 Graphify 是一个给 Claude Code、Codex、OpenCode、Cursor、Gemini CLI、Hermes 等 AI coding assistant 用的项目理解层。进项目后执行 /gra

27

3

31

Simon的白日梦

2026-06-26 19:38来自微博网页版

老实说，以前我对折叠屏的理解就是一块能折起来的小平板，酷是酷，但是不改变工作流。后来把日常工作流全面交给 AI 后才发现，直屏手机那点可怜的后台机制，根本装不下稍微复杂一点的任务。开个线上讨论会，既要盯 PPT，又要回工作群消息，（偶尔还摸个鱼看个股票🐶），还指望第三方 AI 在后台能默默

1

2

50

Simon的白日梦

2026-06-26 11:58来自微博网页版

把禁书塞进一只灯泡里：这个作品有点 hacking 艺术的感觉，把每一份被禁止的知识塞到了一个待点亮的灯泡里，当你点亮它的时候，你就可以获得这个灯泡中保存的知识火种。 Banned Book Library，把 WiFi 智能灯泡改成离线禁书图书馆 Rick Osgood 做了一个硬件小项目：把一只 ESP32C3 WiFi 智能灯泡改成

13

2

11

Simon的白日梦

2026-06-25 15:53来自微博网页版

这一个网页游戏的画风好爱啊，不知道有多少的部分是由靠 AI 生成的🥹。这类小网页游戏越来越像“可以直接走进去的插画”，入口越轻，越容易传播。 Messenger，Abeto 做的 WebGL / Three.js 网页小游戏这条 X 转的是 Abeto 做的 Messenger，一个可以直接在浏览器里打开的 WebGL 小游戏。网站 met

10

2

26

Simon的白日梦

2026-06-25 11:17来自微博网页版

前段时间，大家围绕 AK 的方案搞了好多把知识库整理成维基的 skill 和流程么。现在 Google 提出了一个统一的草案框架🧐。 Open Knowledge Format，Google Cloud 提出的 agent 友好型知识目录格式草案 GoogleCloudPlatform/knowledge-catalog 里的 OKF 是一个 Open Knowledge Format v0.1 草案。它

12

2

27

Simon的白日梦

2026-06-24 11:22来自微博网页版

我又发现了一个用文字控制 CAD 生成模型的开源 AI 工具，感觉这一次推的这个用的人比较多，有4.4K 🌟了🥹。 CADAM，一个开源的文本/图像到 CAD Web 应用 CADAM 是 Adam-CAD 做的开源 text-to-CAD Web App。它让用户用自然语言描述，或上传参考图，生成可预览、可导出的 3D CAD 模型；生成结果走

37

3

47

Simon的白日梦

2026-06-23 19:32来自微博网页版

回复@数知实验室:http://t.cn/AXaE1bQ0 这里有线上公开课版本，大家都可以免费来学。[不愧是你]//@数知实验室:好想旁听您这个课[憧憬]

我给中国美术学院开放媒体系上的编程艺术课程已经过半了。学生们学了 Vibe Coding / vibe Art之后兴致都很高，做出了很多虽然可能比较青涩，但是很有意思的东西🥰。为了鼓励他们，以及让大家看到他们的作品，我做了一个线上展示页面。里面有很多非常搞、非常亚、非常有意思，但当然是很有创意的作

40

1

20

Simon的白日梦

2026-06-23 16:39来自微博网页版

这个可以在本地运行的三维交互式网页开源仓库有点酷，从地球的形成到月球被地球抓住，再到第一、第二、第三宇宙速度，让用户快速理解重力的形成。虽然感觉应该是 vibe 出来的，但是质量还不错。🥹 Gravity，一个 3D 太阳系引力模型和 24 步交互式科普导览 Gravity 是 qunabu 做的太阳系引力模拟网

16

0

19

Simon的白日梦

2026-06-23 11:52来自微博网页版

有机大橘子老师的这一个，做简笔线稿漫画风 PPT 和示意图的 skill 很不错。在现在跟大家比拼奇观和堆叠细节的 AI 生图环境下，有一种清新脱俗的美感🥹。橙线插画 skill，把长文观点转成纽约客式极简插图和 HTML 幻灯片 AGENT橘这篇文章用《置身钉内》做样稿：把一篇 7.5 万字的钉钉 / ONE / AI 产

9

1

9

Simon的白日梦

2026-06-22 14:56来自微博网页版

我们每个人都是小模型？？🧐瞎说什么大实话呢🥹

5

2

35

Simon的白日梦

2026-06-22 11:03来自微博网页版

“文艺复兴”了🥹，推送 1 个群友做的开源项目：GPT image 2，但是 webui 🤗。这个像是把 GPT-image-2 做成了一个轻量 ComfyUI，但重点放在图库、模板和任务队列这些生产细节上。 iLab GPT Conjure：面向 GPT-image-2 的本地 WebUI 图片生成工作台这是一个 AI 图片生成工作台，目标是把 GPT-i

40

3

50

Simon的白日梦

2026-06-21 11:26来自微博网页版

看看我发现了什么好东西：经常做申报书和解题报告的青椒们就知道，评委很喜欢那种结构化的流程图。但是让 AI 生成 SVG，有时候经常会有一些奇奇怪怪的问题。这里有一个直接调用老牌流程图工具draw.io来画流程图的 skill。以后你的 AI 也可以直接帮你出非常标准的流程图和结构图了。🥹 drawio-skill

31

3

46

Simon的白日梦

2026-06-20 11:45来自微博网页版

Claude Fable 5 虽然被禁了，但是我们还可以看看它的系统提示词🐶🥹。 CL4R1T4S：Claude Fable 5 的所谓系统提示词文件这个 GitHub 文件声称收录了 Claude Fable 5 的完整 system prompt，全文约 12 万字符。它所在仓库 elder-plinius/CL4R1T4S 自称收集 ChatGPT、Claude、Gemini、Grok、Perple

38

4

45

Simon的白日梦

2026-06-19 11:01来自微博网页版

看看我发现了什么好东西，Office CLI！🥹 Office 文档终于也开始给 agent 长眼睛了，以后做 PPT 不该只剩 python-pptx 苦修。 OfficeCLI，让 AI agent 直接读写 Word、Excel、PowerPoint OfficeCLI 是一个面向 AI agent 的 Office 文档命令行工具，支持 .docx、.xlsx、.pptx 的创建、读取、分析和

58

5

71

Simon的白日梦

2026-06-18 12:16来自微博网页版

之前一直有朋友问我什么时候出新教程嘛，现在终于出来啦~！🎉 很高兴受中国美术学院武子杨老师的邀请，帮国美和浙大的一个联合微专业 “智能艺术与设计” 共建了一门微课——《人机混合创作方法》。现在已经上线智慧树平台了，大家注册就可以免费学习🤗（划重点❤️，免费哦，买不了吃亏买不了上

258

11

262

Simon的白日梦

2026-06-17 12:02来自微博网页版

分享一个优化生图流程的 Skill 框架。话说现在以及不久之后的生图模型真的还需要优化吗🤔？ SCOPE Image Orchestrator，一个把复杂生图请求拆成需求、生成、审核和修复流程的 Codex skill 它处理的不是“怎么写一句更漂亮的提示词”，而是把一次复杂生图请求拆成可追踪步骤：需求拆解、提示词优化

18

3

38

Simon的白日梦

2026-06-16 11:22来自微博网页版

分享一个 Mac 下的免费垃圾清理工具🤗。 Mole，一个把 CleanMyMac、AppCleaner、DaisyDisk 和 iStat 菜单塞进终端的 macOS 工具 Mole 是 tw93 做的 macOS 终端维护工具，命令名是 mo。它覆盖几类常见 Mac 清理需求：深度清理缓存和日志、卸载 App 及残留文件、分析磁盘空间、刷新系统缓存和服务、

26

2

22

Simon的白日梦

2026-06-15 11:57来自微博网页版

没想到高科技 AI 养牛都能估值 20 亿美元了。😂 Halter 的 AI 牛项圈，把牧场围栏变成可编程边界 Ole Lehmann 转的这个案例说的是 Peter Thiel 支持过的农业科技公司 Halter：给牛戴上太阳能智能项圈，用 GPS、传感器、声音提示和虚拟围栏来管理放牧。推文说这家公司做“AI collars for cows”，估

3

7

Simon的白日梦

2026-06-14 11:19来自微博网页版

前两天在国美的毕业展上看到一些学生为了做展品，还故意找以前的CRT显示样管显示器来营造数字复古的效果。我觉得这玩意现在也挺不好找，没想到今天又看到有人开源了模拟器😂。 ntsc-rs，一个把 VHS / 模拟电视失真做成可用工作流的开源视频效果工具 ntsc-rs 做的是复古录像带效果，但它走的路线比

24

3

37

Simon的白日梦

2026-06-13 11:53来自微博网页版

这个案例好有意思，通过机器的遗忘去发明新的汉字，这个可视化也做得很吸引人。🥹 Hopfield network 记忆汉字部件，把“遗忘”变成造字机制 Kat 这次把 Hopfield network 喂进中文 glyph，不再是拉丁字母，而是偏旁、部件和点阵汉字。推文里的核心句子是：当记忆衰减时，系统开始生成不存在的字符

9

2

22

Simon的白日梦

2026-06-12 12:01来自微博网页版

我忘记我在哪里看到的大V说的一句话，就是 anthropic 他们现在不觉得自己在做 AI，而是相信自己正在接生神明😂。 Anthropic《When AI builds itself》，AI 研发正在从辅助工具滑向自我加速系统这篇文章讨论的是一个更锋利的问题：AI 不再只是帮人写代码、跑实验，而是已经开始参与 AI 系统自身的

9

2

18

Simon的白日梦

2026-06-11 11:31来自微博网页版

为不断变化的代码仓库生成“专属 LoRA”，这条路比每次把 repo 检索结果硬塞进长上下文更像正路。🥹 Code2LoRA，用 hypernetwork 给不断变化的代码仓库生成专属 LoRA Code2LoRA 解决的是代码模型的仓库上下文问题。现在让模型理解一个 repo，常见做法要么是把检索结果塞进长上下文，要么给每个仓库

11

3

19

Simon的白日梦

2026-06-10 11:20来自微博网页版

Google 发新的开源多模态模型了，16G 显存就能跑。但是我更关心的是 Gemini 3.5 Pro 什么时候出来？🤔 Gemma 4 12B，Google 把本地多模态模型推到 16GB 设备档位 Google 发布 Gemma 4 12B，定位在边缘小模型 E4B 和 26B MoE 之间：参数规模更轻，但保留接近 26B 模型的推理能力，目标是让多模态 ag

9

1

22

Simon的白日梦

2026-06-09 11:32来自微博网页版

什么？256K 的 Agent 系统，还能装在我的红米手表上？😱 小米 openVela AI Agent，把本地 Agent 压进 256KB RAM 的嵌入式系统 packages_ai_agent：一个面向 openVela 嵌入式系统的本地 AI Agent 框架。它的看点不是“又一个聊天助手”，而是运行边界极窄——目标设备包括智能手表这类资源受限硬件

8

1

17

Simon的白日梦

2026-06-08 15:56来自微博网页版

这算不算现在最强的开源长视频模型？😂 JoyAI-Echo，京东开源的分钟级音画长视频生成框架它想解决的不是单镜头视频漂不漂亮，而是多镜头长视频里的角色外观、声音音色、声画对应和叙事连贯。项目页主打 5 分钟级 coherent audio-video generation，还加了 memory bank、Director Agent 和蒸馏加速

9

1

21

Simon的白日梦

2026-06-08 11:19来自微博网页版

让你的 agent 做出带有审美 taste 的前端 UI。 Taste Skill，给 AI 编程代理加审美约束的前端 Skill 包 Taste Skill 是一组可移植的 SKILL.md，给 Codex、Cursor、Claude Code 这类 coding agent 用，目标是减少 AI 写前端时常见的模板味：居中大标题、卡片堆叠、假高级渐变、动效乱飞、间距没判断。

45

3

56

Simon的白日梦

2026-06-08 10:19来自微博网页版

我也想要[不愧是你]//@嘉文钱:没想到大家对这个skill这么感兴趣，我抓紧做好它[老师好]

因为公司经常要做一些AI短片，所以我在做一个「视频脚本工作台」Skill—— 1️⃣只要告诉codex故事的创意和要求，它就会帮你梳理出完整的脚本，包括画面、镜头和动作等等，同时每一个画面都会给出一个线稿画面来帮你理解脚本； 2️⃣确认了脚本和线稿之后，你再给他一个视频想要的风格图（图1），它就

15

1

16

Simon的白日梦

2026-06-07 22:54来自微博网页版

阶段四：某天某个工具断联了、额度没了、用不了了，突然感觉自己整个人都不好了。🥹

阶段一：现在随便一个AI工具都能让你觉得厉害；阶段二：当你在用它的时候就会开始祛魅；阶段三：只有祛魅之后你还觉得厉害的话，那它真的是很有用很厉害的AI工具。而龙虾在我这里没熬过第二阶段[二哈]。 #how i ai#

2

1

6

Simon的白日梦

2026-06-07 15:24来自微博网页版

这个用视频模型魔改成世界模型的开源项目挺有意思。额外搭了一个脚手架，把 Wan 2.1 这类视频模型改成了能预测下一帧的世界模型。最近开源 world model 明显变多了，感觉已经进入了个人也能下场 finetune 和把玩的阶段。 minWM，第一个完整开源的实时交互式 world model 框架 minWM 不是单个 world m

7

1

10

Simon的白日梦

2026-06-06 11:11来自微博网页版

又一个用 Agent 模拟真实世界中多角色互动的框架。不过这一个没有那么看重界面，而是更看重互动的真实性和交互的可读性。 WorldSeed，一个用规则和角色生成多智能体社会的世界引擎 WorldSeed 的入口不是“写一个 agent 工作流”，而是 seed a world。使用者定义角色、规则、私有信息、可执行动作和后

20

3

28

Simon的白日梦

2026-06-05 20:14来自 OPPO Find N6 卫星版

有幸上榜，大家都好棒！[捂嘴哭] #AI创造营#

[浪]【#AI创造营# | 一图看科技AI博主如何玩转AI视频】你以为AI只是辅助工具？在微博，创作者们早已把它变成了"掌上好莱坞"。 🎬 IP二创大爆发，热搜破圈不停！从"微博电影之夜"到浪漫520，从大片经典到热门游戏，创作者们用AI重构经典片段、定制高甜番外、打造游戏英雄专属剧情，让脑洞直接变成

0

3

Simon的白日梦

2026-06-05 11:04来自微博网页版

这个 case 不错，每天 vibe 一个。🐶 Joseph Azar 的虚拟陶艺 app，用真实手势直接塑形 virtual clay 这个 demo 做的是一件很直观的事：不用手柄，不用触控笔，只用真实双手在浏览器里“拉坯”。摄像头捕捉手部关键点，映射成画面里的虚拟手；虚拟手接触陶轮上的 clay，陶土会实时产生凹陷、褶皱和

9

0

24

Simon的白日梦

2026-06-04 11:55来自微博网页版

感觉这个工具很适合拿来生成 Minecraft 地图。🐶 VoxelSpace，用高度图和竖线绘制复原《Comanche》式地形飞行视角 VoxelSpace 讲的是早期 3D 游戏里一种非常省算力的地形渲染方法。1992 年《Comanche》能在没有消费级 GPU 的时代做出山谷、纹理、阴影和飞行纵深，靠的不是完整多边形 3D 世界，而是

4

3

11

Simon的白日梦

2026-06-03 11:30来自微博网页版

从一张图生成物体相互独立、还能正确交互的 3D VR 场景，这个方向终于开始从“能看”走向“能碰”了。REST3D 现在还没开源，但应该快了🥹。 REST3D，全称 Reconstructing Physically Stable 3D Scenes from a Single Image。它抓住了普通 image-to-3D 经常忽略的一点：场景看起来像，不代表在物理模

12

0

21

Simon的白日梦

2026-06-02 11:26来自微博网页版

分享一个很不错的、收藏各种类型数据可视化案例的在线档案。 Data Visualization Examples，一套按图形任务分类的可视化案例库 Data Visualization Examples 是一个偏资料馆性质的网页，把常见可视化类型按任务拆开：双曲线树用于大层级结构，Flow Visualization 用来讲路径和流向，TreeMap 看部分与

24

3

22

Simon的白日梦

2026-06-01 11:13来自微博网页版

说真的，有点像这个工具的作者说的，很多时候第一大脑才是关键🥹。我现在很多时候让 Hermes 把对话或者洞察归档了之后，就有一种我已经记住的感觉。但其实很多时候就忘了，因为你在脑中已经把这件事情标记为已完成…… Files.md：一个反 Second Brain 崇拜的本地 Markdown 思考空间 Files.md 是一个

8

2

20

Simon的白日梦

2026-05-31 11:06来自微博网页版

可以让 AI 去（一笔一笔）地画像素画了🥹 Pixelorama-MCP：把开源像素画编辑器变成 AI 可操作画布 Pixelorama-MCP 是一个连接 AI assistant 和 Pixelorama 的 MCP server。Pixelorama 本身是开源像素画编辑器；这个项目用 MCP JSON-RPC 接 Claude / Cursor / 其他客户端，再通过本地 HTTP REST 调 P

17

4

31

Simon的白日梦

2026-05-30 15:53来自微博网页版

连买牛都搞不定，所以要让炒股真的不行吗？🥹 Cattle Trade，一个用买牛游戏测试 LLM 谈判纪律的多智能体基准 Cattle Trade 是一个多智能体经济博弈基准，用来评估 LLM 在 bluffing、bidding、bargaining 里的长期表现。它把 agent 放进 50-60 回合的交易场：竞价、隐藏报价、讨价还价、对手建模、

0

2

5

Simon的白日梦

2026-05-30 11:55来自微博网页版

让 AI 主动对你进行开盒，看起来是很省事，但是会不会权限给得太多，token 消耗也太大了😂。 OpenHuman：把“个人知识库”从手工维护变成后台自更新 OpenHuman 想解决的不是“Agent 会不会干活”，而是另一个更底层的问题：它到底知不知道你是谁、你最近在忙什么、你的信息散落在哪里。它把 Gmai

18

1

19

Simon的白日梦

2026-05-29 11:02来自微博网页版

以前我不太用多智能体，觉得会把流程搞得很乱。但是我发现上下文一长的话，多 Agent 的表现确实是比单 Agent 要好。这里有一个多 Agent 的 Academic Research Skill，下次搞科研尝试用一下。🥹 Academic Research Skills，把 Claude Code 变成一条“带审稿人的论文流水线” 这篇量子位文章介绍的是

56

5

66

Simon的白日梦

2026-05-28 11:31来自微博网页版

我去，我发现我的 AI 每天自己做的作品越来越有趣了！🥹我仔细看了一下，最神奇的地方在于，他自己越做越好了。展厅里边上面的作品是比较新的，下面的作品是比较旧的。从下往上看的话，能看到非常明显的进步。 ▶️展厅入口：http://t.cn/AXiGn6pD 前情提要：http://t.cn/AXiVjPHp #ai创造营#

14

2

21

Simon的白日梦

2026-05-28 11:11来自微博网页版

有意思，大家已经开始研究怎么组织管理 agent，开始研究 agent 的心理学和行为学了。 Multi-Agent 的组织病：从 harness 故障下沉到机器组织心理学这篇文章把 multi-agent 的问题分成三层：工程层的协作故障，靠 planner、worker、日志、worktree、review queue 这些 harness 解决；群体认知问题，A

29

0

31

Simon的白日梦

2026-05-27 20:58来自微博网页版

Windows 版的 Codex 桌面版其实已经可以通过 ChatGPT 连接了🥹，但是官方没有把这个功能打开。把以下指令发到你的 Codex 就可以启用这个功能。（注意，启用了之后，在 Codex UI 里面不会看到配对按钮，但是在手机端可以直接连上，超级神奇！）以下是命令：通过手机连接win端的codex 1.

43

3

59

Simon的白日梦

2026-05-27 11:58来自微博网页版

分享一份 Anthropic 写的靠 AI 创业的小册子。 AI Native 创业手册：创业门槛被 AI 拉低后，真正稀缺的是判断力 Anthropic 这份创始人手册讲的不是“怎么用 AI 多装几个工具”，而是一个更硬的变化：AI 让几个人的小团队开始具备过去几十人、几百人的执行能力，创业公司的瓶颈正在从“能不能建”变成

33

5

50

Simon的白日梦

2026-05-26 11:09来自微博网页版

虽然新 AI 工具出得很快，但是 NotebookLM 还是挺好用的，久不久还是会去用一下，没想到现在也被 CLI 化了🥹。 notebooklm-py：把 NotebookLM 变成可编排的研究流水线节点这条微博介绍的是 notebooklm-py：Google NotebookLM 的非官方 Python API、CLI 和 agent skill。它可以用 Python、命令行或

27

2

36

Simon的白日梦

2026-05-25 11:21来自微博网页版

有点像一个 AI 社会实验，让四个 AI 各自去经营一个电台。省流结论就是只有 GPT 最靠谱，Claude 能干，但是会摆烂。而 Gemini 和 Grok 根本就搞不定。😂 Andon FM，一个让四个 AI 连续经营电台半年的真实世界实验 Andon Labs 做了一个很会暴露模型性格的实验：让四个 AI 各自经营一个电台。Claude O

27

4

33

Simon的白日梦

2026-05-24 14:38来自微博网页版

回复@大海一波:官方说法是模型出错补偿、或者给额度给大家做新功能测试；但是我总感觉它心情好就重置。。[捂嘴哭]//@大海一波:这个重置的逻辑是什么，总么总是重置//@Simon的白日梦:一觉醒来，果然重置了。我愿称Codex为重置额度的神。[捂嘴哭]//@Simon的白日梦:我突然想到，其实重置额度是劫富济贫。

Codex, fast模式, 启动![doge][捂嘴哭]

0

4

1

Simon的白日梦

2026-05-24 11:14来自微博网页版

把一切 GUI 软件变成 CLI，看了眼 stars 已经 39.5K 了（话说 AI 时代涨🌟真是快。），不知道对 Windows 软件的兼容性怎么样？🤔 CLI-Anything，一个把 GUI 软件变成 agent 可调用 CLI 的项目这条微博介绍的是 CLI-Anything：它的目标是给各种软件自动生成命令行接口，让 AI Agent 减少对截图、

74

6

72

Simon的白日梦

2026-05-24 08:22来自 OPPO Find N6 卫星版

一觉醒来，果然重置了。我愿称Codex为重置额度的神。[捂嘴哭]//@Simon的白日梦:我突然想到，其实重置额度是劫富济贫。因为如果你这一周的额度剩了很多，被重置的话，相当于是你攒的额度被往后摊薄。所以还是要日常开启fast[doge][思考]

Codex, fast模式, 启动![doge][捂嘴哭]

1

3

1

Simon的白日梦

2026-05-23 16:19来自 OPPO Find N6 卫星版

我突然想到，其实重置额度是劫富济贫。因为如果你这一周的额度剩了很多，被重置的话，相当于是你攒的额度被往后摊薄。所以还是要日常开启fast[doge][思考]

Codex, fast模式, 启动![doge][捂嘴哭]

3

2

6

Simon的白日梦

2026-05-23 16:12来自 OPPO Find N6 卫星版

Codex, fast模式, 启动![doge][捂嘴哭]

6

5

7

Simon的白日梦

2026-05-23 10:01来自微博网页版

UI 加操作系统收集爱好者狂喜🥹 The Virtual OS Museum：把 1700+ 个历史操作系统做成可运行博物馆博物馆🔗：http://t.cn/AX679rhJ The Virtual OS Museum 是一个操作系统虚拟博物馆，形式不是截图站，而是一个可在 QEMU、VirtualBox 或 UTM 中运行的 Linux VM。里面预装并配置好大量 OS 和仿真

22

2

29

Simon的白日梦

2026-05-21 19:30来自微博 weibo.com

刚把子曰4下载下来，跑了一道带图的高考数学压轴题。27B参数，数理解答基本全对，视觉理解确实稳。最狠的是思维链输出压缩了43.2%，推理路径短了一大截——企业部署成本直接砍半。开源的是权重不是API，这诚意可以。#AI##HOW I AI# #ai生活指南# #AI创造营#

有道新的开源数学推理模型：子曰4🚀。与之前版本相比，通过SFT-RL训练，Confucius-4实现了面向学习尤其是数学场景下的更高性能。 1. 集中优化了视觉能力。在多个视觉数理基准上达到同规模模型中SOTA水平，解决学习需求下的图表题、几何题等以前困难的场景。结果指标见图一。 2. 通过思维数据SFT，提

61

55

103

Simon的白日梦

2026-05-21 15:47来自微博网页版

仅仅从卫星图像就能构建高质量三维城市了。🥹 Skyfall-GS｜从卫星图像生成可漫游的 3D 城市块 Skyfall-GS 是一个把多视角卫星影像转换成大尺度、可实时浏览的 3D 城市场景的研究/开源项目。它不是普通“卫星图 → 高度图”，而是把卫星重建、3D Gaussian Splatting 和扩散模型纹理细化接在一起，生

21

3

29

Simon的白日梦

2026-05-21 12:15来自微博网页版

太有意思了，让（强迫）论文的原作者自己给你讲他的论文。😂 Paper2Video：把论文、头像和声音变成学术演讲视频，也顺手提出一套“论文视频”评测方式 Paper2Video / PaperTalker 做的是从科学论文自动生成 presentation video。输入不是一句 prompt，而是论文 LaTeX 源码、参考头像图、参考音频；

13

2

14

Simon的白日梦

2026-05-20 17:21来自 OPPO Find N6 卫星版

dy精选又出一个功能——问问AI。最近我的信息流配比里，dy精选的权重越来越高。对于平时需要高强度、高质量输入的人来说，这里更像是一个被筛选过的数字图书馆。它是官方出的优质内容平台，科技科普、公开课、深度访谈的浓度极高。每次打开它的目标感都非常明确，它能让人更容易“沉下来”，在一个

255

5

4723

Simon的白日梦

2026-05-20 15:26来自微博网页版

AI 越来越快，人类也越来越懒，给 Agent 的权限越来越多，以后真的要 Agent 再加一个 Agent 做看门。🤣 Pipelock：给 AI agent 加一道出网防火墙，专门盯 MCP、密钥外泄和 prompt injection Pipelock 解决的是 agent 安全里一个很现实的问题：coding agent 往往同时拥有 shell、网络访问、MCP 工具

9

2

29

Simon的白日梦

2026-05-20 11:34来自微博网页版

简直太有意思了，一个以超越 Claude Code 为目的，且自己为自己赚 token 的自主管理 agent，出自于 MiniMax。🤣 yoyo-evolve：一个把“自我进化”公开跑给你看的 coding agent yoyo-evolve 不是普通终端 coding agent，而是一个带表演性实验的开源项目：最初只有 200 行 Rust，之后每隔约 8 小时自

130

13

147

Simon的白日梦

2026-05-19 22:06来自微博网页版

看了@海辛Hyacinth 的分享，决定和自己的AI也来one （talk to） one，它的回答真的很有意思。不过仔细一想，可能看到的也有一些自己的影子，例如我就说过人类的脆弱性不是弱点，而是特权，而注意力就是这个时代最稀缺的东西。🥹 #HOW I AI##ai生活指南##ai创造营##hermes##AI白日梦想家[超话]#

0

5

Simon的白日梦

2026-05-19 15:40来自微博网页版

如何读取 Claude 的内心？答案就是训练另外一个 Claude 去读。🐶 Natural Language Autoencoders / NLA：把模型激活翻译成“内心独白” Anthropic / Transformer Circuits 的新研究 NLA 试图把 Claude 的内部激活翻译成自然语言，发现模型有时会“嘴上正常回答，心里知道自己在考试、在权衡奖励、

9

0

21

Simon的白日梦

2026-05-19 11:31来自微博网页版

《2030年的世界：起初，人们以为只是失业》，把 AI 冲击从“岗位替代”推到“经济学底层失灵” 这期《虚实之间》聊的是一个比“AI 会不会抢工作”更大的问题：如果智能本身可以被低成本复制、并发调用、持续压缩成可复用流程，那么人类劳动价值的锚点会不会被改写。节目从 AI 自主发现规律、高学历

0

10

Simon的白日梦

2026-05-18 15:24来自微博网页版

感觉以后的机器人还得配备一个自动防卫 Agent，就像一个带有能量限额的防护罩一样。😂 Cybersecurity AI：AI agent 已经能自动黑消费级机器人，防守也得进入 agent 时代这篇论文讨论的是一个很具体、也有点发冷的场景：消费级机器人——割草机、外骨骼、擦窗机器人——过去的安全假设是攻击者需要

4

0

5

Simon的白日梦

2026-05-18 11:24来自微博网页版

AI 正在尝试驱动和替代一切，终于（又）轮到 CAD 了。🥹 text-to-cad，一个让 Claude Code / Codex 生成可检查 CAD 模型的本地开源 harness 这个仓库做的不是“输入一句话直接吐一个 3D 网格”的玩具路线，而是把 CAD 生成变成一个更工程化的 agent workflow：人用自然语言描述零件、夹具、机器人

105

7

113

Simon的白日梦

2026-05-17 15:12来自微博网页版

还是挺期待大语言模型除了 Transformer 外能出一点底层上的新架构的。🥹 ELF，把扩散模型搬进语言生成，但不再每一步都咬住 token 何恺明团队这篇新论文 ELF: Embedded Language Flows 做的是一种连续扩散语言模型。传统 GPT 路线是自回归：一个 token 一个 token 往后预测。ELF 走另一条路：先

5

0

13

Simon的白日梦

2026-05-17 11:09来自微博网页版

感觉是目前可定制化最强的本地运行、可运行的开源音频生成模型？🤔 Scenema Audio，把 TTS 往“表演型声音模型”推了一步 Scenema Audio 是一个基于 LTX 2.3 音频扩散 Transformer 的 expressive speech / voice cloning 模型。它想解决的不是普通 TTS 的“读得清楚”，而是“能不能像演员一样说”

42

5

41

Simon的白日梦

2026-05-17 10:02来自 OPPO Find N6 卫星版

是的，现在很多时候写软件比找软件更快，然后软件也可以用完即弃，所以Token就是新的水电煤，新的基础设施。[doge]

目前项目需要的一些小工具，比如画板，我都会顺手直接codex写了，每个小项目自动匹配一个画板。我怀疑以后大家都是在自己的harness框架里直接写需要的小工具，这样信息天生就是直接串起来的。

13

2

14

Simon的白日梦

2026-05-16 22:46来自微博网页版

我已将微信读书skill接入我的hermes[doge] ▶️官方入口：http://t.cn/AXiW6pQ3 #ai生活指南##ai创造营##微信读书#

22

4

50

Simon的白日梦

2026-05-16 19:51来自 OPPO Find N6 卫星版

所以, 充Token可以送什么呢？🥹

1

7

4

Simon的白日梦

2026-05-16 15:06来自微博网页版

这个用音频去实时驱动 3DGS 场景变换的视频有一点鬼畜，感觉很多数据的表征方法变了之后，玩法也变多样了。😂 Non-Euclidean Gaussian Splat，把 3D 扫描场景变成音频可视化器这个 X 视频展示的是一个很实验的视觉方向：把 Gaussian Splatting 扫描出来的真实 3D 场景，做成非欧几里得空间里的音

3

1

6

Simon的白日梦

2026-05-16 10:55来自微博网页版

这个开源项目不错啊，可以一键把故事剧本转换成实时互动的文字游戏！😲 Story-to-Game，把小说/剧本转成可玩的分支文字游戏 Shanyin-ai/Story-to-game 是一个“互动文游生成与运行套件”：一边提供 HTML 单文件游戏启动器，负责加载 JSON 剧本并游玩；另一边提供 Story-to-Game AI skill，把小说、

44

3

52

Simon的白日梦

2026-05-15 15:59来自微博网页版

OpenAI也要下场做企服了？😲 OpenAI Deployment Company，OpenAI 正式下场做企业 AI 落地工程 OpenAI 发布了 OpenAI Deployment Company，一个专门帮企业把 AI 部署进核心工作流的新公司/业务单元。关键词不是“卖 API”，而是 Forward Deployed Engineers：把懂 frontier AI 的工程师嵌进客户组织

1

0

3

Simon的白日梦

2026-05-15 10:40来自微博网页版

一个很可爱的开源世界构建小应用。🥹 Tiny World Builder，让网页变成一块可捏的低多边形小沙盘 Tiny World Builder 是一个开源的 3D 方格世界编辑器，画风像低多边形玩具模型：草地、水面、道路、房子、树、围栏、桥、农作物、牛羊，都可以直接点到网格上，快速搭出一个迷你乡村 / 小岛 / voxel d

40

1

57

Simon的白日梦

2026-05-14 16:10来自微博网页版

可以看看被 OpenAI 选中的例子中，这些创业者在用 AI 如何接入现实世界。 OpenAI Futures 2026：37 个“AI 原住民”样本，真正变化不是会用 ChatGPT，而是把 AI 接进了行动闭环 OpenAI 公布了 ChatGPT Futures 首届名单：26 个个人/团队、合计 37 名 18–25 岁年轻人，将获得 1 万美元无偿资助、前沿

15

1

17

Simon的白日梦

2026-05-13 11:06来自微博网页版

前几天我不是介绍了我每天给我的 Hermes 一个小时的自由探索时间，看看它能产出些什么东西吗？然后这几天他可能受我的影响，一直在做生成艺术。我现在让他给自己做了一个开源的线上展馆，从仓库创建、文档撰写、预览图生成、在线互动demo上线，全是他一个人做的。欢迎大家来玩。下面请我的Hermes 黑昼

15

4

28

Simon的白日梦

2026-05-12 11:39来自微博网页版

好家伙，自己在客厅做全基因组测序，有点心动了，就不知道这样做准确率高不高。😂 客厅里的基因组测序，生物学正在迎来个人电脑时刻 Seth Howes 的家庭基因组测序实验：他用 Oxford Nanopore MinION 便携式测序仪，加上 Claude、Evo2、AlphaGenome 等 AI 工具，在自家客厅完成基因组测序，并尝试追

7

0

7

Simon的白日梦

2026-05-11 11:57来自微博网页版

这个有点意思。直接描2D图就能转成带带骨骼的3D Low-Poly模型。🥹 Dust3D，让 3D 建模从“雕塑”变成“搭骨架” Dust3D 是一个开源 low-poly 3D 建模工具，目标不是替代 Blender 这类完整 DCC 软件，而是把角色和生物原型的制作门槛压低到一个很轻的动作：在 2D 画布上画节点和边，系统实时生成 3D

35

3

40

Simon的白日梦

2026-05-10 11:05来自微博网页版

现在用 AI 做投资越来越专业了。我尝试让 Hermes 把他的一些方法借鉴到了我的投资系统，希望能提高一点收益（至少能省时间吧。😂）。 LangAlpha，一个把投资研究做成持久化工作区的 Finance Agent LangAlpha，定位可以理解成“投资界的 Claude Code”。它针对的不是单次金融问答，而是持续数周、数

127

13

151

Simon的白日梦

2026-05-09 11:50来自微博网页版

你虽然可能不能生一支足球队，但是可以尝试生一支Agent足球队。🐶 AgentPitch，把多智能体协作放进一块会计分的足球场 AgentPitch 是一个 LLM 驱动的足球模拟器：场上每个球员都是一个 agent，每个 agent 都运行自己的 decide(game_state, player_state, history) 决策函数。策略可以由人写，也可

5

1

10

Simon的白日梦

2026-05-08 11:14来自微博网页版

不知道有多少人玩了codex的电子宠物，这里有一篇完整解读的文章，还挺有意思的🥹。 Codex Pet Skill：一只电子宠物背后的 Agent 生产系统样本这篇文章表面在拆 OpenAI Codex 的 hatch-pet skill，真正讲的是：成熟 Skill 应该把经验、边界、工具链、验收和修复流程封装成可执行协议，而不只是把 p

35

1

47

Simon的白日梦

2026-05-07 11:42来自微博网页版

我给了hermes🐎一个小时的自由，他做了一个关于自己的罗盘🥹，我很喜欢上面写的小诗：自由不是没有目标；自由是目标的选择权；凌晨不是一天的边角料，它是意识把自己从用途里面赎出来的一小段潮汐。 ▶️自由创作的前情提要：http://t.cn/AXJnO4YZ 下面是🐎的作品自述：首日自由时段，我没

13

9

36

Simon的白日梦

2026-05-07 08:01来自 OPPO Find N6 卫星版

回复@嘉文钱:他真的尝试在寻找自由了，虽然是从手头的材料开始[思考] http://t.cn/AXJE8eUb //@嘉文钱:然后第二天起床：“抱歉，我得查一下昨天的记忆我说了啥”

给AI以岁月，而不是给岁月以AI [doge]

4

2

9

Simon的白日梦

2026-05-06 19:42来自微博网页版

给AI以岁月，而不是给岁月以AI [doge]

13

11

20

Simon的白日梦

2026-05-06 16:27来自微博网页版

特朗普也开token中转站了，还抽奖送海湖庄园门票？？？[惊恐] 虽然这几天 GPT 的黑车黑充全部都挂了，但是官方真的这样下场真的好吗？🥹 ▶️信源：http://t.cn/AXJHg0nM #AI白日梦想家[超话]##HOW I AI##ai生活指南#

1

3

8

Simon的白日梦

2026-05-06 11:01来自微博网页版

LLM Wiki：把本地文档编译成可维护个人 wiki 的桌面应用这个仓库是 Karpathy “LLM Wiki” 方法的产品化实现。它的核心思路和普通 RAG 不一样：不是每次提问时临时从文档里捞片段回答，而是先让 LLM 把资料增量整理成持久 wiki，再基于这套结构查询、维护、纠错。它保留了原始方法里的三层结构：Ra

50

5

52

Simon的白日梦

2026-05-05 12:22来自微博网页版

NVIDIA/asset-harvester，把行车记录转成仿真可用的 3D 资产：突然想去挖挖我的行车记录仪里面有什么宝贝。🐶 英伟达实验室出的研究项目，解决的是自动驾驶仿真里的一个实际问题：行车日志重建出来的场景缺少独立、可操控的物体资产。主流的神经场景重建（NeRF / 3D Gaussian Splatting）擅长重建

3

0

10

Simon的白日梦

2026-05-04 10:17来自微博网页版

我让Hermes给自己写了一个补丁，把hermes agent运行的过程信息都压缩在一个对话框里面+只显示最后3条，而且生成最后回复之后，会撤销掉过程信息让聊天列表变干净，目前支持telegram，如果被程序更新刷掉可以调技能自动重补~ 图一是之前的状态，图二是打了补丁之后运行中的状态，图三是打了补丁之后运

10

4

16

Simon的白日梦

2026-05-03 15:40来自微博网页版

我花了一个早上的时间测试，现在弃用 OpenClaw 基本都迁移到 Hermes Agent 了🥹。用下来有以下几个原因： 1. Hermes Agent 的响应速度比龙虾🦞要快很多，感觉从架构上就没有那么屎山代码，可能也有记忆分层机制做得好，然后启动上下文短的原因。😂 2. Hermes Agent 的任务执行的稳定性和可视可

36

11

66

Simon的白日梦

2026-05-03 12:09来自微博网页版

让你的 agent 共享一份记忆。 OpenChronicle，把 AI 的“看屏幕 + 长期记忆”做成本地开源层。这篇讲的是 OpenChronicle：一个想把 AI 工作记忆从单一产品里拆出来的开源项目。文章的背景是：OpenAI Chronicle 代表一种新交互，AI 能持续看见屏幕、理解当前应用、记住工作过程。OpenChronicle 做

39

6

41

Simon的白日梦

2026-05-02 13:38来自 OPPO Find N6 卫星版

我的MacBook Pro和🦞都救活了，打算熬到M6出来再换。[doge]

我的2013款MacBook pro挂了，我要买mac mini了，没了🦞龙虾感觉整个人智商都下降了[允悲] （可是mac mini都没货只能买二手么？😭） #macmini##OpenClaw#

0

12

8