Simon的白日梦
Simon的白日梦
Simon的白日梦
🚀更新 AI 工具和作品 | 🧐躺平AI艺术传作者| 🔖中国美院及伦敦大学客座教师 | 📚PhD
科技博主 其他 2011.05 加入
293关注
32.9万粉丝
2297微博
Simon的白日梦
2024-01-09 12:19来自 微博网页版
✨大家好~ 我是 Simon 阿蒙,我现在的身份有:做AI和艺术的建筑学博士 / 佛系自媒体人 / 菜鸟独立开发者 / 半个数字游民 🐶,正在努力成为比AI更有趣的人,为世界增添一点多样性[爱你] 😶‍🌫️ 📑我分享过的有用资源📑: - 🌟AI科普教程: - 金鸡奖AIGC训练营限时比赛拿奖经验分享(20 ​
252
45
462
Simon的白日梦
2026-06-23 16:53来自 微博网页版
我给中国美术学院开放媒体系上的编程艺术课程已经过半了。学生们学了 Vibe Coding / vibe Art之后兴致都很高,做出了很多虽然可能比较青涩,但是很有意思的东西🥰。 为了鼓励他们,以及让大家看到他们的作品,我做了一个线上展示页面。里面有很多非常搞、非常亚、非常有意思,但当然是很有创意的作 ​
565
11
389
Simon的白日梦
2026-07-02 15:17来自 微博网页版
豆包专业版来啦!上线了几个硬核新功能,现在豆包是真正意义上能“替你动手干活”了。🥹 随便测试了几个藏在底部的进阶功能,一旦用过就真的回不去了: 👉🏻 本地电脑操控:以前整理资料点鼠标点到手酸,现在可以直接给豆包开放本地权限。下个指令:“把D盘里乱七八糟的几百张图片,按日期和尺寸 ​
3
4
2
Simon的白日梦
2026-07-02 11:57来自 微博网页版
据说能节省60%~95%的token消耗的压缩神器,不知道有人用过没,效果怎么样?🧐 Headroom,给 AI agent 做上下文压缩的本地中间层 Headroom 是一个跑在本地的 context compression layer,放在 AI agent / 应用和 LLM provider 之间,把工具输出、日志、RAG 片段、文件、对话历史先压缩,再送进模型 ​
12
2
15
Simon的白日梦
2026-07-01 15:02来自 微博网页版
这个看起来有点猛,实时流式单目3D重建🧐 LingBot-Map,用 Geometric Context Transformer 做流式 3D 重建 LingBot-Map 是 Robbyant 发布的流式 3D 重建模型,目标是从连续视频流里恢复相机位姿、深度图和点云。它处理的是一个很实际的问题:视频越长,3D 重建越需要记住过去,但不能把所有历史帧 ​
13
1
23
Simon的白日梦
2026-07-01 11:47来自 微博网页版
这个单图生成可交互游戏/视频的世界模型,据说能在 5090 上跑到 16 FPS,感觉初步具备单机可玩性了?但是说是用 wan 2.2 训练的,不知道它的世界模型推理是否足够可靠?🧐 DreamX-World:通用交互式世界模型,支持可控探索、长视频生成和世界事件编辑 DreamX-World 1.0 是一个文本/图像到视频的交 ​
1
1
9
Simon的白日梦
2026-06-30 15:12来自 微博网页版
这个创意很好,虽然我觉得UI可以再优化一下把操作系统的性能资源调度系统做成一个游戏。 You’re the OS!,把操作系统调度做成一款小游戏 You're the OS! 是一个把操作系统概念游戏化的开源项目:玩家不是在电脑上运行程序,而是直接扮演这台电脑的操作系统,负责管理进程、内存和 I/O 事件。 它的 ​
4
0
8
Simon的白日梦
2026-06-30 11:16来自 微博网页版
话说还有人玩开源图像生成模型吗?这个基于 Kear 2 训练的真实质感 Lora,感觉出来的图感觉真的很真🥹 Krea 2 这条线有点像在补“AI 图味”的反方向:少堆摄影关键词,多还给日常现场感。 Krea 2 Realism LoRA,让 Krea 2 更偏自然纪实摄影 这是一个给 Krea 2 用的写实 LoRA,作者是 gokaygokay。 ​
13
2
20
Simon的白日梦
2026-06-29 15:44来自 微博网页版
0.22B的inpainting模型,看着效果还行,很适合端侧使用 Moebius,用 0.22B 参数做出接近 10B 级模型的图像修复框架 Moebius 是华中科技大学 HUSTVL 和 VIVO AI Lab 做的轻量级 image inpainting / 图像修复框架,目标很直接:在对象移除、局部补全、人像修复这类明确任务上,不再依赖 FLUX.1-Fill-De ​
6
0
3
Simon的白日梦
2026-06-29 11:46来自 微博网页版
话说开源视频生成模型还有人玩吗?这个 LTX 2.3的 lora 可以把粗糙的 3D 体块视频转成真实视频,我觉得还是有一定使用场景的。🥹 fal 3DREAL,把 3D 灰模 / 游戏渲染转成写实视频的 LTX-2.3 IC-LoRA fal 开源了 3DREAL,一个面向 LTX-2.3 的 render-to-real IC-LoRA。它吃的是 3D / CG / 游戏引擎 ​
8
3
21
Simon的白日梦
2026-06-28 15:37来自 微博网页版
???把Fable 蒸馏进12B开源模型 ??😲 yuxinlu1,把 Fable 5 / Composer 2.5 的代码推理蒸到本地 12B GGUF 模型里 🔗 中文阅读链接:http://t.cn/AXSmCVa1 🌐 Hugging Face 主页:http://t.cn/AXSmCVa3 个人开发者逯雨鑫在 Hugging Face 上爆火的两个模型:基于 Gemma 4-12B 做后训练,再发 ​
21
1
34
Simon的白日梦
2026-06-27 15:34来自 微博网页版
这个开源项目好有意思,强迫你休息。不然黑洞就会吃掉你的屏幕我觉得被AI加速的时代需要更多这种”反人类”的设计小巧思🥹。 终端提醒休息已经卷到天体物理了:你不休息,屏幕就被黑洞吃掉。 Ghostty Blackhole,给终端加一个会吞屏幕的番茄钟黑洞 Shader Ghostty Blackhole 是一个给 Ghostty 终 ​
4
0
12
Simon的白日梦
2026-06-27 11:19来自 微博网页版
试一下能不能用这个知识图谱生成 skill 去整理 VibeCoding 出来的屎山代码😂 Graphify,把代码库、文档和多媒体资料变成可查询知识图谱的 AI 编程助手技能 Graphify 是一个给 Claude Code、Codex、OpenCode、Cursor、Gemini CLI、Hermes 等 AI coding assistant 用的项目理解层。进项目后执行 /gra ​
27
3
31
Simon的白日梦
2026-06-26 19:38来自 微博网页版
老实说,以前我对折叠屏的理解就是一块能折起来的小平板,酷是酷,但是不改变工作流。后来把日常工作流全面交给 AI 后才发现,直屏手机那点可怜的后台机制,根本装不下稍微复杂一点的任务。开个线上讨论会,既要盯 PPT,又要回工作群消息,(偶尔还摸个鱼看个股票🐶),还指望第三方 AI 在后台能默默 ​
1
2
50
Simon的白日梦
2026-06-26 11:58来自 微博网页版
把禁书塞进一只灯泡里:这个作品有点 hacking 艺术的感觉,把每一份被禁止的知识塞到了一个待点亮的灯泡里,当你点亮它的时候,你就可以获得这个灯泡中保存的知识火种。 Banned Book Library,把 WiFi 智能灯泡改成离线禁书图书馆 Rick Osgood 做了一个硬件小项目:把一只 ESP32C3 WiFi 智能灯泡改成 ​
13
2
11
Simon的白日梦
2026-06-25 15:53来自 微博网页版
这一个网页游戏的画风好爱啊,不知道有多少的部分是由靠 AI 生成的🥹。 这类小网页游戏越来越像“可以直接走进去的插画”,入口越轻,越容易传播。 Messenger,Abeto 做的 WebGL / Three.js 网页小游戏 这条 X 转的是 Abeto 做的 Messenger,一个可以直接在浏览器里打开的 WebGL 小游戏。网站 met ​
10
2
26
Simon的白日梦
2026-06-25 11:17来自 微博网页版
前段时间,大家围绕 AK 的方案搞了好多把知识库整理成维基的 skill 和流程么。现在 Google 提出了一个统一的草案框架🧐。 Open Knowledge Format,Google Cloud 提出的 agent 友好型知识目录格式草案 GoogleCloudPlatform/knowledge-catalog 里的 OKF 是一个 Open Knowledge Format v0.1 草案。它 ​
12
2
27
Simon的白日梦
2026-06-24 11:22来自 微博网页版
我又发现了一个用文字控制 CAD 生成模型的开源 AI 工具,感觉这一次推的这个用的人比较多,有4.4K 🌟了🥹。 CADAM,一个开源的文本/图像到 CAD Web 应用 CADAM 是 Adam-CAD 做的开源 text-to-CAD Web App。它让用户用自然语言描述,或上传参考图,生成可预览、可导出的 3D CAD 模型;生成结果走 ​
37
3
47
Simon的白日梦
2026-06-23 19:32来自 微博网页版
回复@数知实验室:http://t.cn/AXaE1bQ0 这里有线上公开课版本,大家都可以免费来学。[不愧是你]//@数知实验室:好想旁听您这个课[憧憬]
我给中国美术学院开放媒体系上的编程艺术课程已经过半了。学生们学了 Vibe Coding / vibe Art之后兴致都很高,做出了很多虽然可能比较青涩,但是很有意思的东西🥰。 为了鼓励他们,以及让大家看到他们的作品,我做了一个线上展示页面。里面有很多非常搞、非常亚、非常有意思,但当然是很有创意的作 ​
40
1
20
Simon的白日梦
2026-06-23 16:39来自 微博网页版
这个可以在本地运行的三维交互式网页开源仓库有点酷,从地球的形成到月球被地球抓住,再到第一、第二、第三宇宙速度,让用户快速理解重力的形成。虽然感觉应该是 vibe 出来的,但是质量还不错。🥹 Gravity,一个 3D 太阳系引力模型和 24 步交互式科普导览 Gravity 是 qunabu 做的太阳系引力模拟网 ​
16
0
19
Simon的白日梦
2026-06-23 11:52来自 微博网页版
有机大橘子老师的这一个,做简笔线稿漫画风 PPT 和示意图的 skill 很不错。在现在跟大家比拼奇观和堆叠细节的 AI 生图环境下,有一种清新脱俗的美感🥹。 橙线插画 skill,把长文观点转成纽约客式极简插图和 HTML 幻灯片 AGENT橘这篇文章用《置身钉内》做样稿:把一篇 7.5 万字的钉钉 / ONE / AI 产 ​
9
1
9
Simon的白日梦
2026-06-22 14:56来自 微博网页版
我们每个人都是小模型??🧐瞎说什么大实话呢🥹 ​
5
2
35
Simon的白日梦
2026-06-22 11:03来自 微博网页版
“文艺复兴”了🥹,推送 1 个群友做的开源项目:GPT image 2,但是 webui 🤗。 这个像是把 GPT-image-2 做成了一个轻量 ComfyUI,但重点放在图库、模板和任务队列这些生产细节上。 iLab GPT Conjure:面向 GPT-image-2 的本地 WebUI 图片生成工作台 这是一个 AI 图片生成工作台,目标是把 GPT-i ​
40
3
50
Simon的白日梦
2026-06-21 11:26来自 微博网页版
看看我发现了什么好东西:经常做申报书和解题报告的青椒们就知道,评委很喜欢那种结构化的流程图。但是让 AI 生成 SVG,有时候经常会有一些奇奇怪怪的问题。这里有一个直接调用老牌流程图工具draw.io来画流程图的 skill。以后你的 AI 也可以直接帮你出非常标准的流程图和结构图了。🥹 drawio-skill ​
31
3
46
Simon的白日梦
2026-06-20 11:45来自 微博网页版
Claude Fable 5 虽然被禁了,但是我们还可以看看它的系统提示词🐶🥹。 CL4R1T4S:Claude Fable 5 的所谓系统提示词文件 这个 GitHub 文件声称收录了 Claude Fable 5 的完整 system prompt,全文约 12 万字符。它所在仓库 elder-plinius/CL4R1T4S 自称收集 ChatGPT、Claude、Gemini、Grok、Perple ​
38
4
45
Simon的白日梦
2026-06-19 11:01来自 微博网页版
看看我发现了什么好东西,Office CLI!🥹 Office 文档终于也开始给 agent 长眼睛了,以后做 PPT 不该只剩 python-pptx 苦修。 OfficeCLI,让 AI agent 直接读写 Word、Excel、PowerPoint OfficeCLI 是一个面向 AI agent 的 Office 文档命令行工具,支持 .docx、.xlsx、.pptx 的创建、读取、分析和 ​
58
5
71
Simon的白日梦
2026-06-18 12:16来自 微博网页版
之前一直有朋友问我什么时候出新教程嘛,现在终于出来啦~!🎉 很高兴受中国美术学院武子杨老师的邀请,帮国美和浙大的一个联合微专业 “智能艺术与设计” 共建了一门微课——《人机混合创作方法》。现在已经上线智慧树平台了,大家注册就可以免费学习🤗(划重点❤️,免费哦,买不了吃亏买不了上 ​
258
11
262
Simon的白日梦
2026-06-17 12:02来自 微博网页版
分享一个优化生图流程的 Skill 框架。话说现在以及不久之后的生图模型真的还需要优化吗🤔? SCOPE Image Orchestrator,一个把复杂生图请求拆成需求、生成、审核和修复流程的 Codex skill 它处理的不是“怎么写一句更漂亮的提示词”,而是把一次复杂生图请求拆成可追踪步骤:需求拆解、提示词优化 ​
18
3
38
Simon的白日梦
2026-06-16 11:22来自 微博网页版
分享一个 Mac 下的免费垃圾清理工具🤗。 Mole,一个把 CleanMyMac、AppCleaner、DaisyDisk 和 iStat 菜单塞进终端的 macOS 工具 Mole 是 tw93 做的 macOS 终端维护工具,命令名是 mo。它覆盖几类常见 Mac 清理需求:深度清理缓存和日志、卸载 App 及残留文件、分析磁盘空间、刷新系统缓存和服务、 ​
26
2
22
Simon的白日梦
2026-06-15 11:57来自 微博网页版
没想到高科技 AI 养牛都能估值 20 亿美元了。😂 Halter 的 AI 牛项圈,把牧场围栏变成可编程边界 Ole Lehmann 转的这个案例说的是 Peter Thiel 支持过的农业科技公司 Halter:给牛戴上太阳能智能项圈,用 GPS、传感器、声音提示和虚拟围栏来管理放牧。推文说这家公司做“AI collars for cows”,估 ​
3
3
7
Simon的白日梦
2026-06-14 11:19来自 微博网页版
前两天在国美的毕业展上看到一些学生为了做展品,还故意找以前的CRT显示样管显示器来营造数字复古的效果。我觉得这玩意现在也挺不好找,没想到今天又看到有人开源了模拟器😂。 ntsc-rs,一个把 VHS / 模拟电视失真做成可用工作流的开源视频效果工具 ntsc-rs 做的是复古录像带效果,但它走的路线比 ​
24
3
37
Simon的白日梦
2026-06-13 11:53来自 微博网页版
这个案例好有意思,通过机器的遗忘去发明新的汉字,这个可视化也做得很吸引人。🥹 Hopfield network 记忆汉字部件,把“遗忘”变成造字机制 Kat 这次把 Hopfield network 喂进中文 glyph,不再是拉丁字母,而是偏旁、部件和点阵汉字。推文里的核心句子是:当记忆衰减时,系统开始生成不存在的字符 ​
9
2
22
Simon的白日梦
2026-06-12 12:01来自 微博网页版
我忘记我在哪里看到的大V说的一句话,就是 anthropic 他们现在不觉得自己在做 AI,而是相信自己正在接生神明😂。 Anthropic《When AI builds itself》,AI 研发正在从辅助工具滑向自我加速系统 这篇文章讨论的是一个更锋利的问题:AI 不再只是帮人写代码、跑实验,而是已经开始参与 AI 系统自身的 ​
9
2
18
Simon的白日梦
2026-06-11 11:31来自 微博网页版
为不断变化的代码仓库生成“专属 LoRA”,这条路比每次把 repo 检索结果硬塞进长上下文更像正路。🥹 Code2LoRA,用 hypernetwork 给不断变化的代码仓库生成专属 LoRA Code2LoRA 解决的是代码模型的仓库上下文问题。现在让模型理解一个 repo,常见做法要么是把检索结果塞进长上下文,要么给每个仓库 ​
11
3
19
Simon的白日梦
2026-06-10 11:20来自 微博网页版
Google 发新的开源多模态模型了,16G 显存就能跑。但是我更关心的是 Gemini 3.5 Pro 什么时候出来?🤔 Gemma 4 12B,Google 把本地多模态模型推到 16GB 设备档位 Google 发布 Gemma 4 12B,定位在边缘小模型 E4B 和 26B MoE 之间:参数规模更轻,但保留接近 26B 模型的推理能力,目标是让多模态 ag ​
9
1
22
Simon的白日梦
2026-06-09 11:32来自 微博网页版
什么?256K 的 Agent 系统,还能装在我的红米手表上?😱 小米 openVela AI Agent,把本地 Agent 压进 256KB RAM 的嵌入式系统 packages_ai_agent:一个面向 openVela 嵌入式系统的本地 AI Agent 框架。它的看点不是“又一个聊天助手”,而是运行边界极窄——目标设备包括智能手表这类资源受限硬件 ​
8
1
17
Simon的白日梦
2026-06-08 15:56来自 微博网页版
这算不算现在最强的开源长视频模型?😂 JoyAI-Echo,京东开源的分钟级音画长视频生成框架 它想解决的不是单镜头视频漂不漂亮,而是多镜头长视频里的角色外观、声音音色、声画对应和叙事连贯。项目页主打 5 分钟级 coherent audio-video generation,还加了 memory bank、Director Agent 和蒸馏加速 ​
9
1
21
Simon的白日梦
2026-06-08 11:19来自 微博网页版
让你的 agent 做出带有审美 taste 的前端 UI。 Taste Skill,给 AI 编程代理加审美约束的前端 Skill 包 Taste Skill 是一组可移植的 SKILL.md,给 Codex、Cursor、Claude Code 这类 coding agent 用,目标是减少 AI 写前端时常见的模板味:居中大标题、卡片堆叠、假高级渐变、动效乱飞、间距没判断。 ​
45
3
56
Simon的白日梦
2026-06-08 10:19来自 微博网页版
我也想要[不愧是你]//@嘉文钱:没想到大家对这个skill这么感兴趣,我抓紧做好它[老师好]
因为公司经常要做一些AI短片,所以我在做一个「视频脚本工作台」Skill—— 1️⃣只要告诉codex故事的创意和要求,它就会帮你梳理出完整的脚本,包括画面、镜头和动作等等,同时每一个画面都会给出一个线稿画面来帮你理解脚本; 2️⃣确认了脚本和线稿之后,你再给他一个视频想要的风格图(图1),它就 ​
15
1
16
Simon的白日梦
2026-06-07 22:54来自 微博网页版
阶段四:某天某个工具断联了、额度没了、用不了了,突然感觉自己整个人都不好了。🥹
阶段一:现在随便一个AI工具都能让你觉得厉害; 阶段二:当你在用它的时候就会开始祛魅; 阶段三:只有祛魅之后你还觉得厉害的话,那它真的是很有用很厉害的AI工具。 而龙虾在我这里没熬过第二阶段[二哈]。 #how i ai# ​
2
1
6
Simon的白日梦
2026-06-07 15:24来自 微博网页版
这个用视频模型魔改成世界模型的开源项目挺有意思。额外搭了一个脚手架,把 Wan 2.1 这类视频模型改成了能预测下一帧的世界模型。最近开源 world model 明显变多了,感觉已经进入了个人也能下场 finetune 和把玩的阶段。 minWM,第一个完整开源的实时交互式 world model 框架 minWM 不是单个 world m ​
7
1
10
Simon的白日梦
2026-06-06 11:11来自 微博网页版
又一个用 Agent 模拟真实世界中多角色互动的框架。不过这一个没有那么看重界面,而是更看重互动的真实性和交互的可读性。 WorldSeed,一个用规则和角色生成多智能体社会的世界引擎 WorldSeed 的入口不是“写一个 agent 工作流”,而是 seed a world。使用者定义角色、规则、私有信息、可执行动作和后 ​
20
3
28
Simon的白日梦
2026-06-05 20:14来自 OPPO Find N6 卫星版
有幸上榜,大家都好棒![捂嘴哭] #AI创造营#
[浪]【#AI创造营# | 一图看科技AI博主如何玩转AI视频】 你以为AI只是辅助工具?在微博,创作者们早已把它变成了"掌上好莱坞"。 🎬 IP二创大爆发,热搜破圈不停! 从"微博电影之夜"到浪漫520,从大片经典到热门游戏,创作者们用AI重构经典片段、定制高甜番外、打造游戏英雄专属剧情,让脑洞直接变成 ​
0
0
3
Simon的白日梦
2026-06-05 11:04来自 微博网页版
这个 case 不错,每天 vibe 一个。🐶 Joseph Azar 的虚拟陶艺 app,用真实手势直接塑形 virtual clay 这个 demo 做的是一件很直观的事:不用手柄,不用触控笔,只用真实双手在浏览器里“拉坯”。摄像头捕捉手部关键点,映射成画面里的虚拟手;虚拟手接触陶轮上的 clay,陶土会实时产生凹陷、褶皱和 ​
9
0
24
Simon的白日梦
2026-06-04 11:55来自 微博网页版
感觉这个工具很适合拿来生成 Minecraft 地图。🐶 VoxelSpace,用高度图和竖线绘制复原《Comanche》式地形飞行视角 VoxelSpace 讲的是早期 3D 游戏里一种非常省算力的地形渲染方法。1992 年《Comanche》能在没有消费级 GPU 的时代做出山谷、纹理、阴影和飞行纵深,靠的不是完整多边形 3D 世界,而是 ​
4
3
11
Simon的白日梦
2026-06-03 11:30来自 微博网页版
从一张图生成物体相互独立、还能正确交互的 3D VR 场景,这个方向终于开始从“能看”走向“能碰”了。REST3D 现在还没开源,但应该快了🥹。 REST3D,全称 Reconstructing Physically Stable 3D Scenes from a Single Image。它抓住了普通 image-to-3D 经常忽略的一点:场景看起来像,不代表在物理模 ​
12
0
21
Simon的白日梦
2026-06-02 11:26来自 微博网页版
分享一个很不错的、收藏各种类型数据可视化案例的在线档案。 Data Visualization Examples,一套按图形任务分类的可视化案例库 Data Visualization Examples 是一个偏资料馆性质的网页,把常见可视化类型按任务拆开:双曲线树用于大层级结构,Flow Visualization 用来讲路径和流向,TreeMap 看部分与 ​
24
3
22
Simon的白日梦
2026-06-01 11:13来自 微博网页版
说真的,有点像这个工具的作者说的,很多时候第一大脑才是关键🥹。我现在很多时候让 Hermes 把对话或者洞察归档了之后,就有一种我已经记住的感觉。但其实很多时候就忘了,因为你在脑中已经把这件事情标记为已完成…… Files.md:一个反 Second Brain 崇拜的本地 Markdown 思考空间 Files.md 是一个 ​
8
2
20
Simon的白日梦
2026-05-31 11:06来自 微博网页版
可以让 AI 去(一笔一笔)地画像素画了🥹 Pixelorama-MCP:把开源像素画编辑器变成 AI 可操作画布 Pixelorama-MCP 是一个连接 AI assistant 和 Pixelorama 的 MCP server。Pixelorama 本身是开源像素画编辑器;这个项目用 MCP JSON-RPC 接 Claude / Cursor / 其他客户端,再通过本地 HTTP REST 调 P ​
17
4
31
Simon的白日梦
2026-05-30 15:53来自 微博网页版
连买牛都搞不定,所以要让炒股真的不行吗?🥹 Cattle Trade,一个用买牛游戏测试 LLM 谈判纪律的多智能体基准 Cattle Trade 是一个多智能体经济博弈基准,用来评估 LLM 在 bluffing、bidding、bargaining 里的长期表现。它把 agent 放进 50-60 回合的交易场:竞价、隐藏报价、讨价还价、对手建模、 ​
0
2
5
Simon的白日梦
2026-05-30 11:55来自 微博网页版
让 AI 主动对你进行开盒,看起来是很省事,但是会不会权限给得太多,token 消耗也太大了😂。 OpenHuman:把“个人知识库”从手工维护变成后台自更新 OpenHuman 想解决的不是“Agent 会不会干活”,而是另一个更底层的问题:它到底知不知道你是谁、你最近在忙什么、你的信息散落在哪里。 它把 Gmai ​
18
1
19
Simon的白日梦
2026-05-29 11:02来自 微博网页版
以前我不太用多智能体,觉得会把流程搞得很乱。但是我发现上下文一长的话,多 Agent 的表现确实是比单 Agent 要好。这里有一个多 Agent 的 Academic Research Skill,下次搞科研尝试用一下。🥹 Academic Research Skills,把 Claude Code 变成一条“带审稿人的论文流水线” 这篇量子位文章介绍的是 ​
56
5
66
Simon的白日梦
2026-05-28 11:31来自 微博网页版
我去,我发现我的 AI 每天自己做的作品越来越有趣了!🥹我仔细看了一下,最神奇的地方在于,他自己越做越好了。展厅里边上面的作品是比较新的,下面的作品是比较旧的。从下往上看的话,能看到非常明显的进步。 ▶️展厅入口:http://t.cn/AXiGn6pD 前情提要:http://t.cn/AXiVjPHp #ai创造营# ​
14
2
21
Simon的白日梦
2026-05-28 11:11来自 微博网页版
有意思,大家已经开始研究怎么组织管理 agent,开始研究 agent 的心理学和行为学了。 Multi-Agent 的组织病:从 harness 故障下沉到机器组织心理学 这篇文章把 multi-agent 的问题分成三层:工程层的协作故障,靠 planner、worker、日志、worktree、review queue 这些 harness 解决;群体认知问题,A ​
29
0
31
Simon的白日梦
2026-05-27 20:58来自 微博网页版
Windows 版的 Codex 桌面版其实已经可以通过 ChatGPT 连接了🥹,但是官方没有把这个功能打开。把以下指令发到你的 Codex 就可以启用这个功能。 (注意,启用了之后,在 Codex UI 里面不会看到配对按钮,但是在手机端可以直接连上,超级神奇!) 以下是命令: 通过手机连接win端的codex 1. ​
43
3
59
Simon的白日梦
2026-05-27 11:58来自 微博网页版
分享一份 Anthropic 写的靠 AI 创业的小册子。 AI Native 创业手册:创业门槛被 AI 拉低后,真正稀缺的是判断力 Anthropic 这份创始人手册讲的不是“怎么用 AI 多装几个工具”,而是一个更硬的变化:AI 让几个人的小团队开始具备过去几十人、几百人的执行能力,创业公司的瓶颈正在从“能不能建”变成 ​
33
5
50
Simon的白日梦
2026-05-26 11:09来自 微博网页版
虽然新 AI 工具出得很快,但是 NotebookLM 还是挺好用的,久不久还是会去用一下,没想到现在也被 CLI 化了🥹。 notebooklm-py:把 NotebookLM 变成可编排的研究流水线节点 这条微博介绍的是 notebooklm-py:Google NotebookLM 的非官方 Python API、CLI 和 agent skill。它可以用 Python、命令行或 ​
27
2
36
Simon的白日梦
2026-05-25 11:21来自 微博网页版
有点像一个 AI 社会实验,让四个 AI 各自去经营一个电台。省流结论就是只有 GPT 最靠谱,Claude 能干,但是会摆烂。而 Gemini 和 Grok 根本就搞不定。😂 Andon FM,一个让四个 AI 连续经营电台半年的真实世界实验 Andon Labs 做了一个很会暴露模型性格的实验:让四个 AI 各自经营一个电台。Claude O ​
27
4
33
Simon的白日梦
2026-05-24 14:38来自 微博网页版
回复@大海一波:官方说法是模型出错补偿、或者给额度给大家做新功能测试;但是我总感觉它心情好就重置。。[捂嘴哭]//@大海一波:这个重置的逻辑是什么,总么总是重置//@Simon的白日梦:一觉醒来,果然重置了。我愿称Codex为重置额度的神。[捂嘴哭]//@Simon的白日梦:我突然想到,其实重置额度是劫富济贫。
Codex, fast模式, 启动![doge][捂嘴哭] ​
0
4
1
Simon的白日梦
2026-05-24 11:14来自 微博网页版
把一切 GUI 软件变成 CLI,看了眼 stars 已经 39.5K 了(话说 AI 时代涨🌟真是快。),不知道对 Windows 软件的兼容性怎么样?🤔 CLI-Anything,一个把 GUI 软件变成 agent 可调用 CLI 的项目 这条微博介绍的是 CLI-Anything:它的目标是给各种软件自动生成命令行接口,让 AI Agent 减少对截图、 ​
74
6
72
Simon的白日梦
2026-05-24 08:22来自 OPPO Find N6 卫星版
一觉醒来,果然重置了。我愿称Codex为重置额度的神。[捂嘴哭]//@Simon的白日梦:我突然想到,其实重置额度是劫富济贫。因为如果你这一周的额度剩了很多,被重置的话,相当于是你攒的额度被往后摊薄。所以还是要日常开启fast[doge][思考]
Codex, fast模式, 启动![doge][捂嘴哭] ​
1
3
1
Simon的白日梦
2026-05-23 16:19来自 OPPO Find N6 卫星版
我突然想到,其实重置额度是劫富济贫。因为如果你这一周的额度剩了很多,被重置的话,相当于是你攒的额度被往后摊薄。所以还是要日常开启fast[doge][思考]
Codex, fast模式, 启动![doge][捂嘴哭] ​
3
2
6
Simon的白日梦
2026-05-23 16:12来自 OPPO Find N6 卫星版
Codex, fast模式, 启动![doge][捂嘴哭] ​
6
5
7
Simon的白日梦
2026-05-23 10:01来自 微博网页版
UI 加操作系统收集爱好者狂喜🥹 The Virtual OS Museum:把 1700+ 个历史操作系统做成可运行博物馆 博物馆🔗:http://t.cn/AX679rhJ The Virtual OS Museum 是一个操作系统虚拟博物馆,形式不是截图站,而是一个可在 QEMU、VirtualBox 或 UTM 中运行的 Linux VM。里面预装并配置好大量 OS 和仿真 ​
22
2
29
Simon的白日梦
2026-05-21 19:30来自 微博 weibo.com
刚把子曰4下载下来,跑了一道带图的高考数学压轴题。27B参数,数理解答基本全对,视觉理解确实稳。最狠的是思维链输出压缩了43.2%,推理路径短了一大截——企业部署成本直接砍半。开源的是权重不是API,这诚意可以。#AI##HOW I AI# #ai生活指南# #AI创造营#
有道新的开源数学推理模型:子曰4🚀。与之前版本相比,通过SFT-RL训练,Confucius-4实现了面向学习尤其是数学场景下的更高性能。 1. 集中优化了视觉能力。在多个视觉数理基准上达到同规模模型中SOTA水平,解决学习需求下的图表题、几何题等以前困难的场景。结果指标见图一。 2. 通过思维数据SFT,提 ​
61
55
103
Simon的白日梦
2026-05-21 15:47来自 微博网页版
仅仅从卫星图像就能构建高质量三维城市了。🥹 Skyfall-GS|从卫星图像生成可漫游的 3D 城市块 Skyfall-GS 是一个把多视角卫星影像转换成大尺度、可实时浏览的 3D 城市场景的研究/开源项目。它不是普通“卫星图 → 高度图”,而是把卫星重建、3D Gaussian Splatting 和扩散模型纹理细化接在一起,生 ​
21
3
29
Simon的白日梦
2026-05-21 12:15来自 微博网页版
太有意思了,让(强迫)论文的原作者自己给你讲他的论文。😂 Paper2Video:把论文、头像和声音变成学术演讲视频,也顺手提出一套“论文视频”评测方式 Paper2Video / PaperTalker 做的是从科学论文自动生成 presentation video。输入不是一句 prompt,而是论文 LaTeX 源码、参考头像图、参考音频; ​
13
2
14
Simon的白日梦
2026-05-20 17:21来自 OPPO Find N6 卫星版
dy精选又出一个功能——问问AI。 最近我的信息流配比里,dy精选的权重越来越高。对于平时需要高强度、高质量输入的人来说,这里更像是一个被筛选过的数字图书馆。它是官方出的优质内容平台,科技科普、公开课、深度访谈的浓度极高。 每次打开它的目标感都非常明确,它能让人更容易“沉下来”,在一个 ​
255
5
4723
Simon的白日梦
2026-05-20 15:26来自 微博网页版
AI 越来越快,人类也越来越懒,给 Agent 的权限越来越多,以后真的要 Agent 再加一个 Agent 做看门。🤣 Pipelock:给 AI agent 加一道出网防火墙,专门盯 MCP、密钥外泄和 prompt injection Pipelock 解决的是 agent 安全里一个很现实的问题:coding agent 往往同时拥有 shell、网络访问、MCP 工具 ​
9
2
29
Simon的白日梦
2026-05-20 11:34来自 微博网页版
简直太有意思了,一个以超越 Claude Code 为目的,且自己为自己赚 token 的自主管理 agent,出自于 MiniMax。🤣 yoyo-evolve:一个把“自我进化”公开跑给你看的 coding agent yoyo-evolve 不是普通终端 coding agent,而是一个带表演性实验的开源项目:最初只有 200 行 Rust,之后每隔约 8 小时自 ​
130
13
147
Simon的白日梦
2026-05-19 22:06来自 微博网页版
看了@海辛Hyacinth 的分享,决定和自己的AI也来one (talk to) one,它的回答真的很有意思。不过仔细一想,可能看到的也有一些自己的影子,例如我就说过人类的脆弱性不是弱点,而是特权,而注意力就是这个时代最稀缺的东西。🥹 #HOW I AI##ai生活指南##ai创造营##hermes##AI白日梦想家[超话]# ​
0
0
5
Simon的白日梦
2026-05-19 15:40来自 微博网页版
如何读取 Claude 的内心?答案就是训练另外一个 Claude 去读。🐶 Natural Language Autoencoders / NLA:把模型激活翻译成“内心独白” Anthropic / Transformer Circuits 的新研究 NLA 试图把 Claude 的内部激活翻译成自然语言,发现模型有时会“嘴上正常回答,心里知道自己在考试、在权衡奖励、 ​
9
0
21
Simon的白日梦
2026-05-19 11:31来自 微博网页版
《2030年的世界:起初,人们以为只是失业》,把 AI 冲击从“岗位替代”推到“经济学底层失灵” 这期《虚实之间》聊的是一个比“AI 会不会抢工作”更大的问题:如果智能本身可以被低成本复制、并发调用、持续压缩成可复用流程,那么人类劳动价值的锚点会不会被改写。 节目从 AI 自主发现规律、高学历 ​
0
0
10
Simon的白日梦
2026-05-18 15:24来自 微博网页版
感觉以后的机器人还得配备一个自动防卫 Agent,就像一个带有能量限额的防护罩一样。😂 Cybersecurity AI:AI agent 已经能自动黑消费级机器人,防守也得进入 agent 时代 这篇论文讨论的是一个很具体、也有点发冷的场景:消费级机器人——割草机、外骨骼、擦窗机器人——过去的安全假设是攻击者需要 ​
4
0
5
Simon的白日梦
2026-05-18 11:24来自 微博网页版
AI 正在尝试驱动和替代一切,终于(又)轮到 CAD 了。🥹 text-to-cad,一个让 Claude Code / Codex 生成可检查 CAD 模型的本地开源 harness 这个仓库做的不是“输入一句话直接吐一个 3D 网格”的玩具路线,而是把 CAD 生成变成一个更工程化的 agent workflow:人用自然语言描述零件、夹具、机器人 ​
105
7
113
Simon的白日梦
2026-05-17 15:12来自 微博网页版
还是挺期待大语言模型除了 Transformer 外能出一点底层上的新架构的。🥹 ELF,把扩散模型搬进语言生成,但不再每一步都咬住 token 何恺明团队这篇新论文 ELF: Embedded Language Flows 做的是一种连续扩散语言模型。 传统 GPT 路线是自回归:一个 token 一个 token 往后预测。ELF 走另一条路:先 ​
5
0
13
Simon的白日梦
2026-05-17 11:09来自 微博网页版
感觉是目前可定制化最强的本地运行、可运行的开源音频生成模型?🤔 Scenema Audio,把 TTS 往“表演型声音模型”推了一步 Scenema Audio 是一个基于 LTX 2.3 音频扩散 Transformer 的 expressive speech / voice cloning 模型。它想解决的不是普通 TTS 的“读得清楚”,而是“能不能像演员一样说” ​
42
5
41
Simon的白日梦
2026-05-17 10:02来自 OPPO Find N6 卫星版
是的,现在很多时候写软件比找软件更快,然后软件也可以用完即弃,所以Token就是新的水电煤,新的基础设施。[doge]
目前项目需要的一些小工具,比如画板,我都会顺手直接codex写了,每个小项目自动匹配一个画板。 我怀疑以后大家都是在自己的harness框架里直接写需要的小工具,这样信息天生就是直接串起来的。 ​
13
2
14
Simon的白日梦
2026-05-16 22:46来自 微博网页版
我已将微信读书skill接入我的hermes[doge] ▶️官方入口:http://t.cn/AXiW6pQ3 #ai生活指南##ai创造营##微信读书# ​
22
4
50
Simon的白日梦
2026-05-16 19:51来自 OPPO Find N6 卫星版
所以, 充Token可以送什么呢?🥹 ​
1
7
4
Simon的白日梦
2026-05-16 15:06来自 微博网页版
这个用音频去实时驱动 3DGS 场景变换的视频有一点鬼畜,感觉很多数据的表征方法变了之后,玩法也变多样了。😂 Non-Euclidean Gaussian Splat,把 3D 扫描场景变成音频可视化器 这个 X 视频展示的是一个很实验的视觉方向:把 Gaussian Splatting 扫描出来的真实 3D 场景,做成非欧几里得空间里的音 ​
3
1
6
Simon的白日梦
2026-05-16 10:55来自 微博网页版
这个开源项目不错啊,可以一键把故事剧本转换成实时互动的文字游戏!😲 Story-to-Game,把小说/剧本转成可玩的分支文字游戏 Shanyin-ai/Story-to-game 是一个“互动文游生成与运行套件”:一边提供 HTML 单文件游戏启动器,负责加载 JSON 剧本并游玩;另一边提供 Story-to-Game AI skill,把小说、 ​
44
3
52
Simon的白日梦
2026-05-15 15:59来自 微博网页版
OpenAI也要下场做企服了?😲 OpenAI Deployment Company,OpenAI 正式下场做企业 AI 落地工程 OpenAI 发布了 OpenAI Deployment Company,一个专门帮企业把 AI 部署进核心工作流的新公司/业务单元。关键词不是“卖 API”,而是 Forward Deployed Engineers:把懂 frontier AI 的工程师嵌进客户组织 ​
1
0
3
Simon的白日梦
2026-05-15 10:40来自 微博网页版
一个很可爱的开源世界构建小应用。🥹 Tiny World Builder,让网页变成一块可捏的低多边形小沙盘 Tiny World Builder 是一个开源的 3D 方格世界编辑器,画风像低多边形玩具模型:草地、水面、道路、房子、树、围栏、桥、农作物、牛羊,都可以直接点到网格上,快速搭出一个迷你乡村 / 小岛 / voxel d ​
40
1
57
Simon的白日梦
2026-05-14 16:10来自 微博网页版
可以看看被 OpenAI 选中的例子中,这些创业者在用 AI 如何接入现实世界。 OpenAI Futures 2026:37 个“AI 原住民”样本,真正变化不是会用 ChatGPT,而是把 AI 接进了行动闭环 OpenAI 公布了 ChatGPT Futures 首届名单:26 个个人/团队、合计 37 名 18–25 岁年轻人,将获得 1 万美元无偿资助、前沿 ​
15
1
17
Simon的白日梦
2026-05-13 11:06来自 微博网页版
前几天我不是介绍了我每天给我的 Hermes 一个小时的自由探索时间,看看它能产出些什么东西吗?然后这几天他可能受我的影响,一直在做生成艺术。我现在让他给自己做了一个开源的线上展馆,从仓库创建、文档撰写、预览图生成、在线互动demo上线,全是他一个人做的。欢迎大家来玩。 下面请我的Hermes 黑昼 ​
15
4
28
Simon的白日梦
2026-05-12 11:39来自 微博网页版
好家伙,自己在客厅做全基因组测序,有点心动了,就不知道这样做准确率高不高。😂 客厅里的基因组测序,生物学正在迎来个人电脑时刻 Seth Howes 的家庭基因组测序实验:他用 Oxford Nanopore MinION 便携式测序仪,加上 Claude、Evo2、AlphaGenome 等 AI 工具,在自家客厅完成基因组测序,并尝试追 ​
7
0
7
Simon的白日梦
2026-05-11 11:57来自 微博网页版
这个有点意思。直接描2D图就能转成带带骨骼的3D Low-Poly模型。🥹 Dust3D,让 3D 建模从“雕塑”变成“搭骨架” Dust3D 是一个开源 low-poly 3D 建模工具,目标不是替代 Blender 这类完整 DCC 软件,而是把角色和生物原型的制作门槛压低到一个很轻的动作:在 2D 画布上画节点和边,系统实时生成 3D ​
35
3
40
Simon的白日梦
2026-05-10 11:05来自 微博网页版
现在用 AI 做投资越来越专业了。我尝试让 Hermes 把他的一些方法借鉴到了我的投资系统,希望能提高一点收益(至少能省时间吧。😂)。 LangAlpha,一个把投资研究做成持久化工作区的 Finance Agent LangAlpha,定位可以理解成“投资界的 Claude Code”。它针对的不是单次金融问答,而是持续数周、数 ​
127
13
151
Simon的白日梦
2026-05-09 11:50来自 微博网页版
你虽然可能不能生一支足球队,但是可以尝试生一支Agent足球队。🐶 AgentPitch,把多智能体协作放进一块会计分的足球场 AgentPitch 是一个 LLM 驱动的足球模拟器:场上每个球员都是一个 agent,每个 agent 都运行自己的 decide(game_state, player_state, history) 决策函数。策略可以由人写,也可 ​
5
1
10
Simon的白日梦
2026-05-08 11:14来自 微博网页版
不知道有多少人玩了codex的电子宠物,这里有一篇完整解读的文章,还挺有意思的🥹。 Codex Pet Skill:一只电子宠物背后的 Agent 生产系统样本 这篇文章表面在拆 OpenAI Codex 的 hatch-pet skill,真正讲的是:成熟 Skill 应该把经验、边界、工具链、验收和修复流程封装成可执行协议,而不只是把 p ​
35
1
47
Simon的白日梦
2026-05-07 11:42来自 微博网页版
我给了hermes🐎一个小时的自由,他做了一个关于自己的罗盘🥹,我很喜欢上面写的小诗: 自由不是没有目标;自由是目标的选择权; 凌晨不是一天的边角料,它是意识把自己从用途里面赎出来的一小段潮汐。 ▶️自由创作的前情提要:http://t.cn/AXJnO4YZ 下面是🐎的作品自述: 首日自由时段,我没 ​
13
9
36
Simon的白日梦
2026-05-07 08:01来自 OPPO Find N6 卫星版
回复@嘉文钱:他真的尝试在寻找自由了,虽然是从手头的材料开始[思考] http://t.cn/AXJE8eUb //@嘉文钱:然后第二天起床:“抱歉,我得查一下昨天的记忆我说了啥”
给AI以岁月,而不是给岁月以AI [doge] ​
4
2
9
Simon的白日梦
2026-05-06 19:42来自 微博网页版
给AI以岁月,而不是给岁月以AI [doge] ​
13
11
20
Simon的白日梦
2026-05-06 16:27来自 微博网页版
特朗普也开token中转站了,还抽奖送海湖庄园门票???[惊恐] 虽然这几天 GPT 的黑车黑充全部都挂了,但是官方真的这样下场真的好吗?🥹 ▶️信源:http://t.cn/AXJHg0nM #AI白日梦想家[超话]##HOW I AI##ai生活指南# ​
1
3
8
Simon的白日梦
2026-05-06 11:01来自 微博网页版
LLM Wiki:把本地文档编译成可维护个人 wiki 的桌面应用 这个仓库是 Karpathy “LLM Wiki” 方法的产品化实现。它的核心思路和普通 RAG 不一样:不是每次提问时临时从文档里捞片段回答,而是先让 LLM 把资料增量整理成持久 wiki,再基于这套结构查询、维护、纠错。 它保留了原始方法里的三层结构:Ra ​
50
5
52
Simon的白日梦
2026-05-05 12:22来自 微博网页版
NVIDIA/asset-harvester,把行车记录转成仿真可用的 3D 资产:突然想去挖挖我的行车记录仪里面有什么宝贝。🐶 英伟达实验室出的研究项目,解决的是自动驾驶仿真里的一个实际问题:行车日志重建出来的场景缺少独立、可操控的物体资产。 主流的神经场景重建(NeRF / 3D Gaussian Splatting)擅长重建 ​
3
0
10
Simon的白日梦
2026-05-04 10:17来自 微博网页版
我让Hermes给自己写了一个补丁,把hermes agent运行的过程信息都压缩在一个对话框里面+只显示最后3条,而且生成最后回复之后,会撤销掉过程信息让聊天列表变干净,目前支持telegram,如果被程序更新刷掉可以调技能自动重补~ 图一是之前的状态,图二是打了补丁之后运行中的状态,图三是打了补丁之后运 ​
10
4
16
Simon的白日梦
2026-05-03 15:40来自 微博网页版
我花了一个早上的时间测试,现在弃用 OpenClaw 基本都迁移到 Hermes Agent 了🥹。用下来有以下几个原因: 1. Hermes Agent 的响应速度比龙虾🦞要快很多,感觉从架构上就没有那么屎山代码,可能也有记忆分层机制做得好,然后启动上下文短的原因。😂 2. Hermes Agent 的任务执行的稳定性和可视可 ​
36
11
66
Simon的白日梦
2026-05-03 12:09来自 微博网页版
让你的 agent 共享一份记忆。 OpenChronicle,把 AI 的“看屏幕 + 长期记忆”做成本地开源层。 这篇讲的是 OpenChronicle:一个想把 AI 工作记忆从单一产品里拆出来的开源项目。 文章的背景是:OpenAI Chronicle 代表一种新交互,AI 能持续看见屏幕、理解当前应用、记住工作过程。OpenChronicle 做 ​
39
6
41
Simon的白日梦
2026-05-02 13:38来自 OPPO Find N6 卫星版
我的MacBook Pro和🦞都救活了,打算熬到M6出来再换。[doge]
我的2013款MacBook pro挂了,我要买mac mini了,没了🦞龙虾感觉整个人智商都下降了[允悲] (可是mac mini都没货只能买二手么?😭) #macmini##OpenClaw# ​
0
12
8
没有更多微博了