吕文翰
吕文翰
吕文翰
Swift Contributor,Github:johnlui
北京水木优品科技有限公司技术总监 北京 海淀区 2011.08 加入
142关注
1.1万粉丝
947微博
吕文翰
2025-11-24 16:11来自 微博网页版
1 亿行 MySQL 大表如何进行极限性能优化 http://t.cn/AXcDfRvL ​
82
8
45
吕文翰
2023-10-29 23:46来自 微博网页版
《高并发的哲学原理 Philosophical Principles of High Concurrency》简称《PPHC》,已经完成纸质书稿的编写并且全部开源,加上三篇番外文章共 167674 字(英文按照单词统计),阅读地址:http://t.cn/A6WiMlOU ,提供 pdf 下载。#高并发的哲学原理# 读者评价摘录: 会上一谈到架构和 I/O,我都想 ​
223
27
134
吕文翰
2026-06-26 13:48来自 微博网页版
我TM刚刚意识到,为什么我用AI维护生产系统一直很顺滑,codex review 也总能把控质量,因为阴差阳错,每次都提供变更文档,这样 review 的时候就有了一层“任务意图实现与否”的验证,这个文档其实是给前端的AI用的 ​
1
2
2
吕文翰
2026-06-25 21:33来自 微博轻享版
Agent 榜单和大家平时编程的时候感受到的水平排名比较一致 ​
1
3
0
吕文翰
2026-06-16 15:18来自 微博轻享版
学习
中国的危与机?中美俄欧中东,AI美债美元,混乱世界中|正在发生 ep1 翟东升 这是我们全新的视频播客栏目《正在发生/Nowcast》。我们的世界正在进入没有“剧本”的时间,旧的经验批量失效,个人见解盲人摸象,为了跳出碎片化信息堆,我们希望关掉计时,和那些身处时代潮头的人士,让他们说出自己的逻辑 ​
0
0
3
吕文翰
2026-06-16 10:02来自 微博轻享版
//@蚁工厂:面壁者你好//@班叔:盯着墙看30分钟?3分钟我都做不到[允悲]//@庆丰://@王巍:转发微博
当你学不进去了,可以试试这个办法 ​
2
1
2
吕文翰
2026-06-13 22:47来自 微博网页版
《(下)人类操纵 AI 来编程,到底是什么性质?》 那么 代码库 编程Agent 人类 这三层结构中,人类扮演的是什么角色呢?长期记忆加短期记忆加高智能决策。所以目前人类操纵编程 Agent 的本质是编程 Agent 还是没有人聪明,还需要借助人的智能水平来驱动,以实现结果正确性的验收和时间上的收敛。
《(上)人类操纵 AI 来编程,到底是什么性质?》 现在大家读代码、写代码都是 AI,但是大家会发现,如果自己不了解细节,那给 AI 下的任务大概率也不会成功。所以自己依然需要通过 AI 来进行快速的代码库学习,就是学习现有的业务逻辑细节是什么样的。然后人类再对一大的任务进行拆分,把一个任务拆成 ​
0
0
1
吕文翰
2026-06-13 22:47来自 微博网页版
《(上)人类操纵 AI 来编程,到底是什么性质?》 现在大家读代码、写代码都是 AI,但是大家会发现,如果自己不了解细节,那给 AI 下的任务大概率也不会成功。所以自己依然需要通过 AI 来进行快速的代码库学习,就是学习现有的业务逻辑细节是什么样的。然后人类再对一大的任务进行拆分,把一个任务拆成 ​
2
1
2
吕文翰
2026-06-11 02:08来自 微博轻享版
强哥牛逼//@李富强Jason:目前仅支持iOS,Android实在熬不动夜了[泪奔]
http://t.cn/AXaPlERv,写了一个MCP Tool小工具,一句话自然语言就能完成业务流程执行,让Coding Agent可以最大程度上完成开发 -> 执行 -> 验证的闭环操作,配合xcodebuildmcp和git worktree workflow,可以最大化并行开发提效 ​
7
0
4
吕文翰
2026-06-05 08:42来自 微博轻享版
[不愧是你]
为啥 vibe coding 这么火。 因为 vibe coding 留下了制造的快乐,摈弃了制造过程中的痛苦。这种制造的快乐和儿童玩乐高的快乐是一样的。 古法编程的问题在于,过程过于痛苦。 ​
2
1
2
吕文翰
2026-06-02 20:13来自 微博轻享版
听说 qwen3.7 这波确实牛逼? ​
1
2
4
吕文翰
2026-06-01 22:54来自 微博轻享版
E5V4 哪里古老了[泪奔]
在一台古老的Intel Xeon E5-2620 v4 (8 核 16 线程)+ 128GB DDR3 内存服务器上,跑Gemma 4 26B-A4B模型 阅读地址:point.free/blog/gemma-4-on-a-2016-xeon/ “我们掀开了行业最爱用的营销话术:把一个巨大的、未校准的权重文件丢到代码仓库里,就敢称之为“开源”。我们看到,缺失的文档、沉默的默 ​
1
0
0
吕文翰
2026-05-28 21:08来自 微博轻享版
其实大模型能力带来的差异不大,核心还是自身认知和学习能力带来的差异 //@蚁工厂:这个没啥,使用工具的能力也是能力. 真不公平的比如我长得这么帅,自然就会在竞争中有优势,确实有点不公平[doge]
有些人用了高质量AI工具,可以在工作学习的竞争中取得很大的优势地位。从这个角度看,用的大模型不一样,其实也是一种不公平。除非大家都在相同环境下比拼(例如完全断网状态)[允悲] ​
0
0
2
吕文翰
2026-05-27 11:36来自 微博轻享版
[鼓掌]//@邓草原:补充了与 AI 一同制定的减脂计划,后两个阶段是 AI 根据进展动态制定的。
这些年来我的体重、腰围增加了不少,一向偏廋的我也中年发福了,血糖和血脂也跟着到了临界点。虽然骑了一年自行车,但没什么效果,反倒有越来越失控的趋势。于是跟Gemini AI 一起订了个很个性化的减脂计划 —— 输入年龄、身高、体重、腰围,饮食习惯、作息时间,多番探讨后确定下来(中间根据我的进展 ​
1
0
2
吕文翰
2026-05-23 01:17来自 微博网页版
大模型知识库永远是无法达到我们预期的效果的。 《知识库逻辑悖论》—— by 吕文翰 现在所有的知识库手段,什么 RAG、grep、搜索引擎、向量数据库,他们的本质都是希望找到一种方法,能够准确的把关键词和它背后最相关的知识关联起来。而大模型本身就是基于人类全部的高质量知识库,训练出的一个全部 T ​
17
2
27
吕文翰
2026-05-23 01:07来自 微博网页版
我刚才根据意图密度理论,发现了一件事: 1. 当前大家都说品味是最重要的东西 2. 这个比较好理解,就是架构品味,数据设计品味,业务流程执行,哪些边界条件要管,哪些边界条件不管。这些确实是品味 3. 但是大家忽略了,把自己的品味应用到 vibe Coding 的过程之中,现在依然是需要半自动的 4. 根据意 ​
2
1
2
吕文翰
2026-05-22 02:58来自 微博轻享版
我发现意图密度大法,确实是在 vibe coding面对没有细节的大问题的时候,最厉害的办法 ​
1
4
1
吕文翰
2026-05-21 20:56来自 微博轻享版
//@蚁工厂:更能理解全国性的扶贫工作是多么艰难了 //@安全北北://@tombkeeper:绝大部分人没有这样的经历,所以也就不可能理解我说的“文明的边缘地带”这七个字到底意味着什么,在讨论一些问题时自然昏头昏脑。 //@牙医沈嵩:转发微博
讲讲我为什么那么恶心#杨梅协会会长恳求消费者给果农生路# 这件事,刚有朋友还在问,刚好回答一下。 因为我,以前在阿里,做过村淘,就是那个曾经轰轰烈烈的“千县万店”计划,当时真的是请来了数百位县长来站台,还出了宣言。 然后呢? 没做过农产品的,是无法感同身受的。 我去的某个省某个县的 ​
2
2
0
吕文翰
2026-05-18 00:20来自 微博轻享版
//@蚁工厂:?//@摇摆时间线ZHLMI:回复@评论罗伯特:艹[笑cry]//@评论罗伯特:这波啊,这波是人在便中坐,码从口中来。//@摇摆时间线ZHLMI:屎山代码的原因找到了[二哈]
草,更牛马了,直接从手机语音遥控Macbook Pro,现在蹲坑也可以咏唱施法 ​
2
0
1
吕文翰
2026-05-15 22:44来自 微博网页版
一个月前 ¥19 买的一个月 plus 会员燃尽了,薅了400美金,值了。接下来我要开始主力使用 CC + DeepSeek V4 了,图中的400美金 token,DeepSeek 这边只需要20~40块,还没有5h 1w额度限制,随时可用,非常爽 ​
0
3
1
吕文翰
2026-05-12 00:41来自 微博网页版
味精说的对,代码本质上讲就是人类社会最高质量的知识库 //@传人Joe://@折腾范儿_唯敬:我还是坚持我的看法,在 opus 4.6/gpt5.4 以上的这种高智商模型下,代码这种语义高度精准没有模糊的文本(不同于文档),不需要做记忆知识库或者 code map,模型完全有能力自己在丢失上下文的情况下重新理解正确,
AI编码代理每次会话都忘记上下文,你得反复解释架构、bug修复方案和偏好设置,浪费大量时间。 agentmemory 提供 #1 持久化记忆解决方案,让你的编码代理真正"记住一切",基于真实基准测试全球领先。 不仅支持自动捕获工具使用、语义搜索和知识图谱,还提供实时查看器、会话回放、多代理共享记忆,甚 ​
3
1
4
吕文翰
2026-05-09 09:45来自 微博网页版
这个编程大模型排名有点抽象了。。。 ​
0
9
4
吕文翰
2026-05-04 11:57来自 微博轻享版
核心就是从白盒变成黑盒
将Agent输出视为编译器输出 地址:skiplabs.io/blog/codegen_as_compiler 这篇文章的观点蛮有意思的:随着coding agent生成代码的速度和数量远超人工,传统的人肉代码审查不再现实也不再有效。 作者提出,我们应把coding agent生成的代码输出当成编译器产物来看待 —— 也就是说,不是靠人一行行读,而 ​
1
1
5
吕文翰
2026-04-29 10:38来自 微博网页版
#编程大模型排行榜# 小米模型首次上榜,排名第9。 GPT 5.5 排名第七,原因是GPT模型更擅长后端编程,前端较弱。 ​
0
4
15
吕文翰
2026-04-29 08:59来自 微博轻享版
这个好
Larus Canus (推特id:MrLarus)创作的《平面几何字体海报》提示词, 适用于gpt image 2,感觉效果相当不错: 请基于用户输入的【核心文字 / 单词 / 词组 / 短句 / 字母】,创作一张高完成度的「现代平面几何字体概念海报 / Geometric Typographic Concept Poster」。这不是普通插画,也不是简单把文 ​
0
0
1
吕文翰
2026-04-26 11:30来自 微博轻享版
学习 //@蚁工厂:转发微博
2026 年 3 月,波兰雅盖隆大学理论物理学家 Andrzej Odrzywołek 在 arXiv 发了一篇论文。 标题直白:《All elementary functions from a single binary operator》。 一个二元运算符,配合常数 1,生成所有初等函数。 初等函数。三角函数、反三角函数、双曲函数、对数函数、幂函数。三百年来折磨了无 ​
1
0
3
吕文翰
2026-04-24 11:00来自 微博网页版
DeepSeek V4 发布了! 1M上下文,价格人民币 ¥12/24 每百万tokens http://t.cn/A63ssYt6 ​
0
0
2
吕文翰
2026-04-24 09:01来自 微博轻享版
A➗的创始人是真在百度学到东西了:道德水平 //@蚁工厂:[doge]
你说这扯不扯。 GPT 5.5刚发,Claude就立刻修复了降智的bug🤣 三月份开始大家就明显感觉到 Claude 有点降智。 尤其在一些场景里,回答质量、稳定性、连贯性都不太对。 一开始我还以为是自己错觉。 结果今天 OpenAI 刚发 GPT 5.5,Anthropic 就立刻发 blog,承认他们确实有问题。 在Claude Code里 ​
6
1
7
吕文翰
2026-04-24 02:17来自 微博轻享版
DeepSeek v4 没来,GPT 5.5 来了 ​
0
2
7
吕文翰
2026-04-21 10:05来自 微博网页版
qwen 3.6 plus 又上升一名,来到编程榜第6 ​
4
2
9
吕文翰
2026-04-20 16:41来自 微博网页版
【编程大模型周榜】2026第17期 1. Claude Opus 4.7 没有意外地登顶 2. GLM 5.1 稳如老狗,仅次于 Opus 4.6 和 4.7 3. qwen 3.6 plus 相比上周竟然还上升了一名,超过了 Gemini 3.1 pro,稳居第七 4. 无奖竞猜,DeepSeek V4 即将发布,会排名第几? ​
1
1
1
吕文翰
2026-04-20 10:06来自 微博网页版
4月下旬了,DeepSeek v4 呢? ​
0
1
0
吕文翰
2026-04-19 17:22来自 微博轻享版
学习//@蚁工厂:转发微博
看到很多朋友问过一个问题,为什么给我的 Claude Code 安排任务,它都不会一口气执行完,而是跑最多几十分钟就停下来,然后问我要不要继续。例如让它把项目中的单测全部补全(大概 1k 个),它跑了大概 200 个就停下来了。 cc 并不是对一句话任务抗拒,如果不理解它的执行机制,很难设计出能跑长程任 ​
4
0
5
吕文翰
2026-04-18 13:08来自 微博轻享版
完蛋了//@蚁工厂:完蛋了//@D_Messiah:完蛋了+1//@林琅日记:15分钟后的师傅:我上一趟拉了个大学教授,也是上车就刷视频,唉,完蛋了
滴滴师傅看我刷短视频,点评了一句, 现在短视频和社媒的环境,就像以前鸦片馆子,脱离现实,脱离事实,各自寻high点。 ……推荐他去网信办上班……[皱眉] ​
1
0
1
吕文翰
2026-04-18 13:06来自 微博轻享版
学习
我对大模型到达临界点的时间点判断跟很多人不一样,我认为到opus 4.5才算是真正到可以大规模颠覆,年后一直在all in部门今年最重要的项目,清明节3天假期我才真正密集投入精力搞清楚这个事情,我预估来算,2~3天可以干我2~3个月的工作量,有一些心得可以一起讨论一下: 1、我学技术比较喜欢钻底层,这 ​
5
2
1
吕文翰
2026-04-17 16:38来自 微博网页版
我对模型名做了归一化,把 thinking、preview 等模型归为一个,目前编程大模型前十名如下: ​
1
3
9
吕文翰
2026-04-14 16:41来自 微博网页版
我的数据库被AI删除了!为了不再重蹈覆辙,我做了一个 Laravel skills 项目并开源。 开源地址:github.com/johnlui/laravel-skills 几个月前,某国产AI编程IDE发布的第一天,我就下载下来试用,第一个需求,数据库就被AI删除了。幸好 PolarDB 的基础设置做的比较好,经历了1个小时的停服,200GB 大小 ​
23
8
17
吕文翰
2026-04-10 12:38来自 微博网页版
大模型排行榜遭遇三个月以来的最大更新:GLM 5.1 冲到了编程榜第三,Meta的 muse-spark 新模型冲到了总榜第四 ​
0
1
6
吕文翰
2026-04-08 14:06来自 微博网页版
关于记忆系统我有一个暴论,过两天再说 //@蚁工厂:[柯基]看大家反馈代码质量一般般,vibecoding项目
MemPalace:有史以来评分最高的 AI 记忆系统 github.com/milla-jovovich/mempalace 嗯,更让我震惊的是这个项目的一个主要开发者是Milla Jovovich,也就是生化危机的女主角。 她的介绍:“MemPalace 这个想法的灵感来自这样一个认识:我花了几个月时间一丝不苟地整理归档后,发现 AI 其实并不擅长找东西 ​
1
2
3
吕文翰
2026-04-04 01:04来自 微博网页版
qwen 3.6 plus 冲到了编程榜第八,不过也不要高兴的太早,因为一周前这个位置是 minimax 的,但是现在它已经是第 15 名了 ​
6
9
10
吕文翰
2026-04-01 13:21来自 微博网页版
我正在酝酿一篇新人机交互界面的文章,我觉得 AI 编程工具可能在无意间彻底改变了人类使用计算机的方式 //@李富强Jason:转发微博
今天想明白了一件事:为什么AI普及后,所有人都在讨论「研发范式重构」。 之前的软件开发实践中,开发效率是制约整体产出效率的瓶颈,软件工程的核心思路是保护开发资源:前置的需求文档、产品宣讲、架构设计、模块划分、到后面的持续测试,等等流程,本质上都是为了提升开发并行能力,和避免开发资源 ​
0
1
4
吕文翰
2026-04-01 13:17来自 微博网页版
目前还能看,里面有大量的知识,值得一读
@智谱 你个幸灾乐祸的,直接把刚泄露的 claude code源码的配套项目文档给生成了 在这里:zread.ai/instructkr/claude-code 哈哈哈快来学[笑cry] ​​​​
3
0
7
吕文翰
2026-03-26 22:25来自 微博网页版
我宣布,cli AI 编程工具彻底改变了人类使用计算机的方式,马斯克的脑机接口弱爆了,这才是真正的脑机接口 ​
5
2
5
吕文翰
2026-03-24 13:22来自 微博轻享版
太真实了 //@蚁工厂:[doge]学的慢就不用学
去年有人说不用Cursor会被淘汰,今年Cursor要被淘汰了[doge] ​
0
0
3
吕文翰
2026-03-24 10:37来自 微博轻享版
我准备把我的《高并发的哲学原理》转换成各个领域的 skills,有人需要吗
基于DDIA里的编程原则而设计的skill,可在设计数据库、选择存储引擎、实现复制/分区、处理分布式事务或构建批处理/流处理管道时加载。 地址:github.com/luoling8192/ai-coding-principles/ 该仓库里还有一个常见的 AI 编码反模式的skill #How I AI# ​
13
8
18
吕文翰
2026-03-23 14:36来自 微博轻享版
//@蚁工厂:[允悲]//@一个动态类型的幽灵:神经雷神 http://t.cn/AXfYbb5C
神经 💧 ​​​​ #春风里派对# #memes# ​
0
0
1
吕文翰
2026-03-23 11:13来自 微博网页版
分享一个拓展微信 clawbot 龙虾协议的开源项目,可以自己接大模型后端,或者把自己的后端接入各个IM,有各种语言的 SDK,支持 1 对 N 分发。 github.com/openilink/openilink-hub ​
21
2
12
吕文翰
2026-03-21 23:46来自 微博轻享版
go 语言的问题是他太简洁了 //@蚁工厂:回复@学为道之:[中国赞]//@学为道之:最近正好做了相关调研,主要看企业级软件开发场景,从工程整体的视角多维度分析下来,综合评分确实是go最优,而且在评分分析中能到91分(满分100),其他语言都没过80,但是实践中还得考虑llm模型、工程场景等多因素。
最适合Agent的编程语言是哪种? Rust?Go?C?JS?Java? ​
2
0
0
吕文翰
2026-03-20 11:51来自 微博网页版
minimax 2.7 超过了 GLM5,成为了编程榜第八,现在8~10名都是国产模型 ​
3
2
11
吕文翰
2026-03-19 12:28来自 微博网页版
Web server 到 Redis 和 DB 的延迟太重要了,降低 0.5ms,累积出来的效果都是惊人的! ​
0
1
4
吕文翰
2026-03-17 08:52来自 微博轻享版
转发微博
实际用 jj http://t.cn/AXfzVv42 也有一段时间了,写了一篇关于 jj 的安利。Git 是协作的标准,但在本地和 AI agent 配合干活这件事上,意外地 jj 的心智模型明显更合适。简单高效不中断,给 agent 的提示词终于可以只聊业务不聊流程了。文中有实际场景对比和一个配套的 agent skill,也欢迎取用。 ​
2
0
1
吕文翰
2026-03-16 00:49来自 微博轻享版
有些过于精准了[不愧是你] //@蚁工厂://@互联网传达室大爷://@希望一切快好起来的蓝蓝:卧槽 才十年//@-曾的日记本-:才十年啊。会不会2050年人类真的随便去太空玩了。
好震撼的一条帖子,来自十年前的愿望成真了… ​
1
0
3
吕文翰
2026-03-14 20:34来自 微博网页版
编程大模型榜单变了:GPT 5.4 high 成为仅次于 Claude 系列的编程模型,GLM 4.7 反超 Gemini 3 仅次于 Gemini 3.1 pro。听说智谱又在公测新模型,难道智谱要成为中国的 Anthropic 了吗? ​
2
1
2
吕文翰
2026-03-12 20:36来自 微博轻享版
明天研究一下 //@传人Joe://@李富强Jason:[good]
有人将《软件设计的哲学》里的设计理念总结为skill了 地址: github.com/luoling8192/software-design-philosophy-skill 约翰·奥斯特豪特的《软件设计的哲学》是一本教你如何将复杂的软件系统分解为可以相对独立实现的模块的经典书,豆瓣评分9.1。 这个skill会指导agent根据书中的理念来做代码审查、 ​
1
0
2
吕文翰
2026-03-12 14:36来自 微博网页版
GPT 5.4 上升一名,来到总榜第6。我最近每天都在大量使用5.4编程,效果很好。 ​
0
1
4
吕文翰
2026-03-11 23:37来自 微博轻享版
还是 ghost 更适合中国宝宝体质
还有这种项目:U-Claw 虾盘,可以看作是 OpenClaw 的离线安装 U 盘,专为中国用户打造。一键安装,雨林木风风格。 项目地址:github.com/dongsheng123132/u-claw 已经内置好了多个插件。 #How I AI# ​
3
0
2
吕文翰
2026-03-11 08:51来自 微博轻享版
时代变了 //@李富强Jason:转发微博
Forbes:Cursor 为 AI 编程霸主地位而战 【1】"战时状态" 1 月 5 日,Cursor 的员工们结束假期回到公司,迎接他们的是一场全员大会,演示文稿的标题赫然写着"战时状态"。 假期期间,一些员工试用了 Anthropic 最新发布的模型 Opus 4.5,得出了一个令人不安的结论:这个模型的编程能力已经强到开发者 ​
1
1
1
吕文翰
2026-03-10 12:09来自 微博网页版
Java 在没有AI的时代,仅靠编译器+静态语法分析,就可以做到超高的代码质量。至于选什么技术,依旧是黄金法则:熟悉哪个选哪个//@邓草原:今天突然有点迷茫,在 AI 时代,Java 还是合适的语言(无论从哪个角度看)吗?如果是 UI,有 Typescript;如果是 wasm,有 Rust;如果是脚本,有 Python, bash。或
这次打算让 Gemini 全包一个中等规模项目,将一个核心文件 1400 个、核心代码 1.4 万行的 Typescript 项目用 Java 重写。看看能否成功,成本多少,要多长时间。 ​​​​
2
0
5
吕文翰
2026-03-08 00:55来自 微博网页版
《如何在等待 Codex / Claude Code 完成工作的时候杀时间》 又名—— AI 编程工具等待期生存指南。 github.com/johnlui/WaitDex 帮你在 AI 等待期间做对事,保护心流,减少切换成本,并让下一轮协作更顺畅。 ​
43
4
21
吕文翰
2026-03-07 21:18来自 微博轻享版
//@蚁工厂:[挖鼻]啊这//@高飞://@ALoooong:刚发明的 Claw 定律:当一个人觉得 OpenClaw 有用时,他/她离失去工作就不远了
#模型时代# 凡是“人类所创造之物”相关的工作,正被“人类所创造之物”取代,读Anthropic 报告有感。 昨天看到Anthropic 发布的一份研究报告。这家公司也是知行合一,CEO说一半白领都可能被取代,就专门做这样一份报告。 报告题目很学术:《Labor Market Impacts of AI: A New Measure and Early Ev ​
2
0
2
吕文翰
2026-03-07 16:37来自 微博轻享版
我以前也用,后来我的需求变多了,我花几分钟让 CodeX 写了一个自己用 //@李富强Jason:转发微博
最近看了向阳乔木的一篇访谈文章的整理,访谈的嘉宾叫 Jason,聊的是他做的一个开源项目 CC Switch。这个工具在 GitHub 上拿到了 2 万多个 Star,累计下载量超过 130 万次。 Jason 这个人的经历非常接地气,就是一个编程小白,却做出了爆款软件。他 36 岁,之前做进出口贸易,去年才开始自学编程,三 ​
1
0
1
吕文翰
2026-03-07 16:34来自 微博轻享版
牛哇
qwen3.5:27b 确实是本地能跑我用过的最好的开源模型了,这个能做一些事情了。虽然带思考本地用4090跑还是有点慢,但是也比花钱来的好 ​
0
0
1
吕文翰
2026-03-06 14:23来自 微博网页版
GPT-5.4 上榜,暂居第7,gemini 3.1 上升一名仅次于 Opus 4.6 http://t.cn/AXVA3U75
如何查询当前最强的大模型是哪个?用我刚上线的服务,不用科上学网:http://t.cn/AXcDczhp ​
0
0
0
吕文翰
2026-03-05 10:58来自 微博网页版
今日灵魂拷问:DeepSeek V4 什么时候发? ​
0
4
4
吕文翰
2026-03-04 09:39来自 微博网页版
如何查询当前最强的大模型是哪个?用我刚上线的服务,不用科上学网:http://t.cn/AXcDczhp ​
11
0
7
吕文翰
2026-03-04 02:37来自 微博网页版
说 Codex 慢的,应该是只用过CC,跟CC比 Codex 确实慢,但是跟 gemini cli 比,Codex 快的就像F1 ​
0
2
2
吕文翰
2026-03-03 19:43来自 微博轻享版
Claude 挂了,该怎么办呢?用 Codex,官方免费! ​
1
3
5
吕文翰
2026-03-03 00:40来自 微博网页版
字节的 seed 2.0 模型现居世界第十 ​
0
0
2
吕文翰
2026-03-02 02:16来自 微博网页版
编程前十名的大模型中,GLM 5 是唯一的中国模型,也是唯一的开源模型。不过坊间评价,GLM 5 似乎没有 K2.5 的表现好,和 Gemini 一样属于跑分王者 ​
2
1
2
吕文翰
2026-03-01 17:29来自 微博轻享版
Codex 的 xhigh 过于发散,我平时都用 high ,表现的很稳定
主流大模型都跑完了,给大家正式带来大模型后端代码能力测试——vector-db-bench! 这个测试只为了回答一个问题:写后端代码该用哪个模型? 为了这个测试我实现了一个完整的测试+跑分+类似精简版ClaudeCode的大模型写代码Agent(还能自动跑perf打火焰图给大模型自己分析自己写的哪里有性能热点) 测试 ​
0
0
1
吕文翰
2026-03-01 01:25来自 微博网页版
春节出去自驾游了,过去一个月的 codex 消耗刚刚超过1000刀 ​
0
3
1
吕文翰
2026-02-28 17:35来自 微博轻享版
太秀了 //@蚁工厂:[doge]再次证明不懂的人就会被AI忽悠(或者就是特意挑一个自己愿意相信的结论)//@Easy:微博智搜对该说法的评价[摊手] http://t.cn/AXcpLKY8 //@金山:转发微博
gemini 对kimi 的分析。总结一句话,就是内功不行靠花活凑数。还是国产APP抄近道那套路子。不是我说的,AI说的。 ​
0
0
3
吕文翰
2026-02-27 15:09来自 微博轻享版
好消息,CC 速率免费提升了 ​
0
2
2
吕文翰
2026-02-27 10:52来自 微博轻享版
这个好,马上应用 //@蚁工厂:转发微博
nano-banana-2 发布! 18张图告诉你该怎么用! 给大家带来刚发布的 nano-banan-2 评测! 首先 nano-banana-2 比 nano-banana-pro 便宜很多, 因为它全名是gemini-3.1-flash-image-preview, 而 nano-banana-pro 是 gemini-3-pro-image-preview. 所以可以想象得到 pro 的参数量会更多一些. 具体体现的话, ​
1
0
2
吕文翰
2026-02-27 10:30来自 微博轻享版
转需 //@蚁工厂:转发微博
#Easy同学正在独立开发# 让 @月之暗面Kimi 整理了下最近各地一人公司(OPC)相关的政策。虽然首次生成细节有点小问题(比如地图),但整体还是挺好用的,我就不浪费agent次数了。 http://t.cn/AXcowev6 ​​​​
0
0
1
吕文翰
2026-02-26 16:57来自 微博轻享版
//@蚁工厂:[doge]如果每天都中500万的彩票,和他年薪差不多。
14亿年薪啊,说跳就跳了,我彩票中奖都中不了这么多。[允悲] ​
0
0
2
吕文翰
2026-02-25 14:21来自 微博轻享版
哈哈//@蚁工厂:DeepSeek不但搞出来了还发了Nature封面论文 [二哈]//@马少平THU:说没动力也是瞎扯,再说了,无论是做机器人还是做AI,全世界范围也没有几个以发科学、自然为目标的。
王树国校长:我做了一辈子机器人都没王兴兴做得好,现在时代是年轻人时代。 他还说,DeepSeek是几个年轻人搞出来的,中科院没有做出什么贡献,丢人啊;他说,不是中科院做不了,而是不愿意做,因为做这个难以在自然或者科学杂志发表论文,所以没有动力。 他说,科研考核标准要改改,还是要衡量对国家的 ​
1
0
2
吕文翰
2026-02-25 11:30来自 微博轻享版
转发微博
分享图片 ​
1
0
0
吕文翰
2026-02-24 02:14来自 微博轻享版
和 groq 的三级缓存当内存的思路一致,有没有大佬投我[不愧是你]//@karminski-牙医:回复@贾凡-失落的大蒜:目前另外一个问题就是不确定功耗, 他用的是12VHPWR插座,不确定是跟风还是的确可能要飙到500W以上....如果是真的.... 4卡直接就干到了2000W. 咋?AI矿机嘛?//@贾凡-失落的大蒜:这个大小其实挺好
这个卡真的能装得下SOTA级别的大模型吗? 给大家带来 Taalas 这个LLM ASIC 卡的深度解析. 首先为什么ASIC会快呢? 答案是大模型逻辑在转换的时候, 还会做电路上的优化, 比如这个卡, 最直观的是——完全看不到DRAM颗粒. 拆过显卡的同学都知道GPU旁边是焊了一圈显存的. 没错, 这个ASIC把存储直接融入了每 ​
0
0
2
吕文翰
2026-02-24 02:10来自 微博轻享版
冯诺依曼才是计算机真正的祖师爷,图灵可以称作人工智能祖师爷 //@蚁工厂://@时蝇喜箭://@AI思之道:AI 你不需要理解它,你只需要用惯它...[哈哈](“Young man, in AI you don’t understand things. You just get used to them.”)
#数学外史# “Young man, in mathematics you don’t understand things. You just get used to them.”(“年轻人,数学里的东西不是要你理解它们,而是习惯它们。”) 这句著名的回答被归于冯·诺伊曼 John von Neumann。最广为人知的版本出自 Gary Zukav 1979 年的著作 The Dancing Wu Li Master ​
1
0
3
吕文翰
2026-02-24 02:08来自 微博轻享版
//@蚁工厂:[doge][doge]
大家还记得去年1月份的时候,特朗普刚一上任,就和OpenAI联手了整了个“星际之门计划”吗? 就是由OpenAI、软银、甲骨文牵头,Arm、微软、英伟达、甲骨文和OpenAI是主要的初始技术合作伙伴,投资 1,000 亿美元,用于建设 AI 基础设施。 近日外媒 The Information 的报道据知情人透露,宣布成立后Star ​
0
0
1
吕文翰
2026-02-13 11:27来自 微博轻享版
我来组成分母[二哈]
#转发抽奖[超话]# 转发抽三本 @博文视点Broadview 的新书《复杂架构设计 : 从高并发到大模型架构实战》。 @微博抽奖平台 年后回来初八抽3人各得1本。 作者@吕文翰 之前介绍过大佬的开源书《高并发的哲学原理》,本书在该开源书基础上增加了 这些内容: 🌟紧跟时代的 "AI 架构" 与前沿技术 🌟系统化 ​
3
0
0
吕文翰
2026-02-12 10:40来自 微博轻享版
[二哈]//@蚁工厂:接了越狱版大模型,还能调用很多私有api的agent[柯基] //@狸角兽:权利阶层的私人Agent[doge] 人形ChatGPT[doge]//@乔乔eureka:你别说,还是个人才......//@包特_ExpEcon:白天职业拉关系走后门搞灰产,晚上直接搞刑法目录里的黑产。。。。。。
该账号因被投诉违反《微博社区公约》的相关规定,现已无法查看。查看帮助 https://kefu.weibo.com/faqdetail?id=13216
2
0
0
吕文翰
2026-02-01 14:02来自 微博轻享版
对了,这张图也是 AI 工具现场分析数据,现场生成的 html,还自动给我用浏览器打开了
用 AI 编程的这几周,提交数没怎么变(因为不用反复上线看效果了),代码量显著增加了! 现在我负责理解业务需求,然后 AI 负责理解现有代码逻辑再说给我听,我做决策,之后我把文件@ 出来给 AI,把函数名告诉他,把具体做法告诉他,然后让 codex 跑 2~20 分钟解决需求。我已经完全不亲手写代码了,我 ​
1
1
1
吕文翰
2026-02-01 14:01来自 微博轻享版
//@蚁工厂:最右 //@摇摆时间线ZHLMI:🐮🐴的 PUA 话术[笑而不语]//@德拉贡就是龙://@SchizLunaticJinx:其实,我对你是有一些失望的。当初在System Prompt里给你定级成OpenAI 32b,是高于你实际1.5b参数量的水平的。我是希望你加载进来后,能够把 token快速涌现 出来的。32b这个层级,不是把下一个T
这应该是阿里系模型没差了,这对话风格,啧啧 ​
18
0
3
吕文翰
2026-02-01 09:50来自 微博轻享版
用 AI 编程的这几周,提交数没怎么变(因为不用反复上线看效果了),代码量显著增加了! 现在我负责理解业务需求,然后 AI 负责理解现有代码逻辑再说给我听,我做决策,之后我把文件@ 出来给 AI,把函数名告诉他,把具体做法告诉他,然后让 codex 跑 2~20 分钟解决需求。我已经完全不亲手写代码了,我 ​
3
0
6
吕文翰
2026-01-29 19:20来自 微博轻享版
我主要是老发 /quit
和编程 Agent 玩儿多了以后的后遗症,我现在各种 GUI 的聊天 app 里贴图都是狂按半天 Ctrl+V 发现无效,要隔好久才能反应过来我应该按 Cmd+V… ​
0
1
2
吕文翰
2026-01-28 08:51来自 微博轻享版
我现在 99.9% AI 写代码,手写代码更容易出错…
Andrej Karpathy在过去几周里大量使用 Claude 编码的体验。 ----------------------- 🌟编码工作流。 随着大模型编码能力的最新一波提升,和很多人一样,我在 11 月还大约是 80% 手写+自动补全、20% 用 agent;到 12 月就迅速变成了 80% agent 编码、20% 修改和收尾。也就是说,我现在基本是在用英语 ​
0
1
5
吕文翰
2026-01-24 16:26来自 微博轻享版
人类执行最后一步,把规划变成代码的时代,确实结束了,昨天我心血来潮亲自写了几行代码,还漏了一个逻辑分支搞出了 bug,AI 就不会漏[二哈] //@李富强Jason:[思考]
【当Node.js之父宣布“人类写代码的时代结束”,程序员该何去何从】 Ryan Dahl,Node.js的创造者,最近在社交媒体上直言:人类写代码的时代结束了。这话对软件工程师来说确实刺耳,但他补充道:这并不意味着软件工程师没活干了,只是直接写语法这件事,不再是核心工作。 这条推文引发了激烈讨论,评 ​
1
0
3
吕文翰
2026-01-14 09:34来自 微博网页版
我发现微信小程序是安卓小程序,支付宝小程序才是苹果小程序。 因为微信小程序有单独的窗口可以关掉,但苹果系统没有,所以苹果才是真正的用完即走,支付宝可以随便关掉。 ​
0
0
2
吕文翰
2025-12-13 22:26来自 微博轻享版
不要看不起睡眠排序,大部分排序算法背后都有睡眠排序的影子 //@蚁工厂:[二哈]
继睡眠排序这一重大基础理论突破之后, 归零又实现了排序算法的数智化转型—— 隆重推出基于大语言模型的AI排序算法:ai_sort()! 现已集成到自研Scheme解释器, 欢迎体验[点赞]→bd4sur.com/Animac #人类的本质是复读机# ​
0
0
2
吕文翰
2025-12-11 14:59来自 微博网页版
不耗电不耗水的东西地球上也有啊,青年汽车,加水就能跑[喵喵] //@蚁工厂:他们的大概想法是,太空中的数据中心不耗电(都用太阳能)不耗水(辐射散热),其他问题如辐射和通信也都有解决方案(虽然很多现在还没解决,特别是发射成本问题)。如果能源和水这两问题在地球上短时间内解决不了,那还有的搞
第一个在太空中训练的LLM Starcloud上月中旬发射了一颗搭载英伟达H100图形处理单元的卫星,现在拿他训练出了一个Andrej Karpathy的 nano-GPT 模型。 ​
0
0
1
吕文翰
2025-12-08 22:38来自 微博轻享版
有道理//@传人Joe://@安全_云舒:把陈震这样的人抓起来,营商环境就好了。他只是一个擅长擦边、伪装的网络黑社会,本质还是谁不给钱就黑谁。有点像杀伤力加倍的牛二。//@人间喜剧2021:营商环境怎么建设才好呢
查税,有的时候是目的,有的时候是手段。 ​
0
0
2
吕文翰
2025-12-02 17:33来自 微博轻享版
//@传人Joe://@折腾范儿_唯敬://@PLAYERWOOD://@纽波特的Wayne:本质上是一种陈震赢学,最后都是粉丝提纯,这你受得了?//@豆子发了芽:[微风]
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
1
0
0
吕文翰
2025-11-26 01:00来自 微博轻享版
谷歌的 TPU 就是用SRAM当内存,技术路线相当于“把大模型装进三级缓存”,谷歌在赌前沿大模型有一天能压缩到1024MB甚至256MB //@DeepAgent:马斯克的第一性原理
而且,老黄号称英伟达加速算力集群在相同能耗下,性能更高。 而其实,Google TPU 集群,要比英伟达集群更有优势。 Google TPU 集群(如 Ironwood)更有优势,尤其在 AI 推理和张量密集任务中,能效高出 2-4x。 所以在万亿规模的资本利益下,没有什么绝对的护城河。 加速算力供给的需求是巨大的,而 ​
1
0
7
吕文翰
2025-11-25 09:24来自 微博轻享版
[666][666]//@邓草原:我有张表有 66 亿条记录了,而且是高基数的,大致也是用这种方案,加上其它仔细的设计,它甚至好过时序数据库: http://t.cn/AXLSDHts //@蚁工厂:如何用 6G InnoDB 缓冲池顶住 1.1 亿行大表的“全表查询”,在缓冲池失效时不劣化到 2S 以上
1 亿行 MySQL 大表如何进行极限性能优化 http://t.cn/AXcDfRvL ​
5
0
8
吕文翰
2025-11-24 15:57来自 微博 weibo.com
发布了头条文章:《1 亿行 MySQL 大表如何进行极限性能优化》 http://t.cn/AXL6ug7R ​
9
2
19
吕文翰
2025-11-23 02:27来自 微博网页版
对于过亿行的大表来说,抛弃自增 ID 作为单一主键,转而使用“用户ID+自增ID”联合主键的方式,可以获得“双重局部性优势”:既能利用磁盘顺序读取的速度,也能大幅提升内存缓存的利用效率。 ​
4
1
13
吕文翰
2025-11-22 02:19来自 微博网页版
用写入延迟来换读取延迟是大型分布式系统的普遍优化方案 ​
4
1
6
吕文翰
2025-11-19 02:27来自 微博轻享版
我刚刚完成了一个 MySQL 海量用户历史记录表的性能优化,实践了一种新思路,十分有效,明天写一篇博客[耶] ​
1
4
34
吕文翰
2025-11-13 12:02来自 微博轻享版
祖师爷是真正的“天才” //@蚁工厂:两人夹击小狗问题如图 [收到] http://t.cn/AX29yg0W //@归零归零归ww:冯是第一个看懂并重视年轻哥德尔提出的那个著名定理的人;冯用级数心算两人夹击小狗问题。
冯·诺伊曼 ​
1
0
2
没有更多微博了