蚁工厂
蚁工厂
蚁工厂
科技博主 湖南 长沙 2011.06 加入
2292关注
57.3万粉丝
5.6万微博
蚁工厂
2022-05-17 14:45来自 微博 weibo.com
公司和其他一些小伙伴的一些业务介绍,需要的私信联系。如果训练chatgpt需要数据集的也可以聊。 企业工商数据api 舆情监测/舆情报告服务 http://t.cn/A6XJVOWq 合天网安实验室,直接开虚拟机在线做网络安全实验,以及网安人才培训业务。 http://t.cn/A6GWVAzv 卓码测评,独立的第三方软件测评机构,可 ​
37
16
106
蚁工厂
2026-07-02 17:17
[doge]一转眼过去一年了,这个豪华团队做出啥来着
#模型时代# 扎克伯格在Meta内部备忘录中公布的新AI团队成员名单,研究员队伍可以说是梦之队了。名单还不包括从OpenAI苏黎世办公室加入的员工。 领导层: "1、Alexandr Wang" - Meta新任首席AI官(Chief AI Officer),负责领导Meta Superintelligence Labs (MSL)。他是Scale AI的前CEO和联合创始人, ​
0
7
8
蚁工厂
2026-07-02 17:13来自 微博网页版
转发微博
我对标codex开发的codem重大更新。 实现多智能体协作(如图1)。主智能体工作,唤醒子智能体工作,然后回收工作,评估子智能体(然后跌代,直到通过loop模式),主智能体集成多子智能体工作成果后集成输出。 可以实时查看子智能体工作进度和工具调用情况(如图2)。 目前已经完成codex的60%功能了。 下 ​
1
3
2
蚁工厂
2026-07-02 14:58来自 微博网页版
//@班叔:码//@胭脂牌锦鲤:🐴//@迷妹开心发大财:谢谢!马住,从电影中寻找配色//@白金乐一:http://t.cn/AXSFLshZ 链接是这个
这个网站好棒…… ​​​​
15
1
18
蚁工厂
2026-07-02 14:55来自 微博网页版
迄今为止最大的开源电脑游戏数据数据集。该数据集包含超过 500 小时的游戏屏幕录像以及键盘/鼠标移动数据,涵盖 Valorant、Minecraft、GTA 等众多游戏。 地址:huggingface.co/datasets/markov-ai/gaming-500-hours ~ http://t.cn/AXoGlYeV ​
12
0
10
蚁工厂
2026-07-02 14:51来自 微博网页版
转发微博
微软发布 Windows 原生 Linux 容器:告别 Docker Desktop? http://t.cn/AXoGW2rd 微软发布 WSL Container 公测版,将 Linux 容器集成到 WSL 中。这意味着今后无需安装 Docker Desktop,就能直接在 Windows 上运行 Docker 镜像。 只需要由 docker run -d -p 80:80 nginx 变成 wslc run -d -p 80:80 n ​
14
1
9
蚁工厂
2026-07-02 14:29来自 微博网页版
[awsl]这个说的也夸张了吧,如果按他说的转为价值付费不好评估啊,那不是企业说多少就是多少。
Palantir CEO Alex Karp 在电视节目上认为 OpenAI 和 Anthropic 等头部 AI 公司正把全球 500 强企业当成了免费提款机。 以下为Alex的观点: “每一家企业都在愤怒。他们花钱买 token,却创造不出任何价值。这些人在偷走我的业务权重和竞争优势。” 你以为你在用 AI 工具,其实你在给 AI 公司交智商 ​
3
4
5
蚁工厂
2026-07-02 14:04来自 微博网页版
#豆包专业版的隐藏用法# 因为工作关系,一直在找给非技术人的Codex平替。 这次PC 端豆包专业版升级了,趁周末深度体验了两天豆包专业版(把一周的额度两天就用完了)。说说体会 注意这次体验主要是面向市场营销部门的,不是面向码农哈。 装上后第一感觉是对新手还是蛮友好的。默认情况下已经安装了全 ​
24
6
77
蚁工厂
2026-07-02 13:10来自 微博网页版
#北大毕业典礼最打动我的一句话# 李斌这场北大毕业演讲感觉有高人指点,完全不提自己的成绩,只是复盘了自己经历的三次挫折。 北大学生眼界都高,早就听腻了功成名就的鸡汤演讲,坦诚一些还是更重要的。而且,这些挫折经历也是学生缺乏的,对他们也有用,挺好的。 #李斌北大毕业演讲没有一滴鸡汤# ​
129
43
941
蚁工厂
2026-07-02 12:32来自 微博网页版
OpenAI 提议将 5% 的股份无偿移交给特朗普政府 ​​​​
29
18
54
蚁工厂
2026-07-02 12:30来自 微博网页版
Redhat出品的GLM-5.2的 DSpark 预览版已发布 地址:huggingface.co/RedHatAI/GLM-5.2-speculator.dspark-preview 目前在 4×B300 上对 GLM-5.2-FP8 进行解码的速度提升了约 1.5 倍 ​
6
8
16
蚁工厂
2026-07-02 12:06
转发微博
《AI Infra 全景图 》(http://t.cn/AXobsN2q):还是我之前的判断,agent是新时代最大的机会之一,而这篇文章列举了这个产业链上不同层次的Infra,开发者也许会在这里找到个体的、组织的新机会。 ​​​
11
0
8
蚁工厂
2026-07-02 12:05
转发微博
为什么是现在:可观测性统一的八年之约 这是回顾可观测性三支柱历史后的文章,想尝试回答为什么现在统一可观测性存储变成一个必须项,而不是优化项。 统一可观测性不是新想法。Bourgon 2018 年那段 über-system 推演就把它讲透了。聪明人想到了,懂行的人批判了,SigNoz、ClickStack 这些创业公司也真把 ​
1
0
3
蚁工厂
2026-07-02 10:58来自 微博网页版
[二哈] 现在在Agent里默认都是调用工具或写代码来计算了吧
别再对着AI模型念咒语,指望它算对数学题了!Anthropic工程师分享实战经验:指令无法创造能力。处理精确计算,最靠谱的方法是给模型一个计算工具,让它调用执行,而不是让它“心算”。#AI# #提示词工程# http://t.cn/AXovp5kX ​
4
5
5
蚁工厂
2026-07-02 10:41来自 微博网页版
转发微博
终于上了! 藏师傅现在这个 Skills 可以帮你做 Live Photo。 我过去一段时间用下来,发现这个能力非常有用。它比做成视频的难度要低得非常非常多 又可以帮你展示一些需要动态展示的东西,比如: 1. 步骤说明 2. 不同角度的产品细节 3. 带动效的网页展示等等 这个 Skills 基本上把做 Live Photo 的 ​
14
0
5
蚁工厂
2026-07-02 10:27来自 微博网页版
也得挑到好的短视频
【#宋方金反对知识分子搞短视频鄙视链#】#贬低短视频的本质是傲慢与偏见#北京,编剧、作家宋方金做客播客《咸柠七》,谈及部分知识分子对短视频抱有偏见:“其实短视频里综合信息的能量非常巨大,能看见很多社会的细枝末节”。在他看来,每个时代都有自己的内容爆发,短视频就是这个时代的形式,深度阅 ​
0
1
3
蚁工厂
2026-07-02 09:46
啊?
昨晚美股科技暴跌,有个重要原因就是扎克伯格说要把多余的算力卖了,这事儿转了两道让媒体写成了:“meta建设云业务,销售过剩算力。” 让很多人觉得是不是现在算力够用了,那这些卖存储的做封装的液冷的还卖毛啊? 然后哐哐砸…… 谁说美股不受小作文影响的? ​
11
3
10
蚁工厂
2026-07-02 09:43
就是这种风格也就在微博可能还行了 ,其他以算法推荐为主的平台 基本都没有任何流量[流汗]
前两天看到一篇写地平线的文章,标题大概是「用词准确是高手的特征」,内容没看,但这个标题我是很喜欢的。 一些高手是很喜欢咬文嚼字的。如果你能准确的描述一件事、描述心中所想,说明你的理解是深入的。 用词膨胀的现象很普遍,特别是在自媒体时代,为了吸引你能点进来,一定要用夸张的词,这是上 ​
9
2
7
蚁工厂
2026-07-02 08:39来自 微博网页版
把github用户改为fifa球员卡的样式,图个乐 http://t.cn/AXobZFXg ​
0
1
4
蚁工厂
2026-07-02 08:34来自 微博网页版
地址:yarna.github.io/isChinaUser/ 仅通过浏览器数据,判断你是哪里的用户 可以判别的因素有好多的。如果不是浏览器而是装在你设备上的程序那就更多了 ​
26
7
31
蚁工厂
2026-07-02 08:31来自 微博网页版
俺爹的50年党员纪念章 ​
0
10
94
蚁工厂
2026-07-02 08:01来自 微博网页版
哈哈哈哈AIE World's Fair展会上,OpenAI做了个Codex重置的实体按钮。 按下就会重置 ​
3
1
7
蚁工厂
2026-07-01 20:54
[doge]
哎呀,ChatGPT上这个Other语言真的好难猜啊 ​
10
3
21
蚁工厂
2026-07-01 20:48
[doge]博大精深 ​
2
0
6
蚁工厂
2026-07-01 20:34
唉(段子) ​
87
14
89
蚁工厂
2026-07-01 20:21来自 微博网页版
哈哈哈//@Easy:回复@在扑腾的龙套:现在不是手搓了,改成口喷的了 [笑cry]//@在扑腾的龙套:又是自己搓的项目吗?
#Easy同学正在独立开发# 发现 DeepSeek V4 flash 还挺能聊的,就给加了一句简单的提示词,能呱啦呱啦聊好多,还都挺符合人设的。 把 DuckDuckGo 作为工具挂上去以后,还能搜点热点出来主动聊。就是 3D 模型设计的成本太高了,不然做 OC 来玩会很爽。 ​
1
1
4
蚁工厂
2026-07-01 19:33来自 微博网页版
How do Image Embeddings work? 地址:outcomeschool.com/blog/how-do-image-embeddings-work 文章用非常入门的方式解释了图像嵌入的工作原理。 图片最初只是由像素组成,每个像素通常由 RGB 数值表示,但这些原始像素只能说明颜色,不能说明“这是一只猫”或“这是一辆车”。因此,我们会把图片输入 ​
28
1
32
蚁工厂
2026-07-01 18:36来自 微博网页版
用大模型做排序就不行吗,看看@归零归零归ww 这个视频 [怒] http://t.cn/AXoLPpCS
所以大模型开发 ≠ 程序员? ​
11
14
12
蚁工厂
2026-07-01 18:32来自 微博网页版
一组面向设计工程师的Skill,是Linear设计师 Emil Kowalski 开放的。 地址:github.com/emilkowalski/skills 里面有三个skill 1. animation-vocabulary:反向查找词汇表,可将对网页动画或动态效果的模糊描述转换为其确切术语。通过使用正确的词语,您可以准确地告诉 AI 您想要什么,从而获得更好的动 ​
35
0
34
蚁工厂
2026-07-01 17:51
[doge]越来越会玩AI视频了
AI巨头们之间的资本混战,到底是个什么情况? #微博新知# #AI# http://t.cn/AXo2RNw1 ​
5
0
12
蚁工厂
2026-07-01 17:37
//@嘉文钱:这段时间vibe coding了那么多东西,最满意的还是这个图透镜插件,在创意阶段能帮忙快速组装提示词[馋嘴]用过都说好(除了还没匹配他们的api)
我开源了一个 Chrome 插件:图透镜 Image Lens。 功能很简单:在网页图片左上角点一下,就能分析图片内容,生成可编辑的生图提示词。支持精简版 / 完整版、中文 / 英文切换、结构化查看、一键复制,也可以直接用 Gemini API 生图。 项目目前已开源,采用自备Gemini API Key 模式,不内置任何 Key。 — ​
18
0
22
蚁工厂
2026-07-01 13:15来自 微博网页版
刚发布的Claude Sonnet 5分词器又变了,同样的问题会消耗更多的token,特别是用英文的呃情况下。所以这个模型一点也不便宜。。 图1为Simon Willison的统计,英文token是Sonnet 4.6的1.4倍。 图2为 Artificial Analysis Intelligence统计完整跑完他们的测试要多少钱,Sonnet 5是最贵的一个——比Fable 5 ​
10
7
24
蚁工厂
2026-07-01 13:02来自 微博网页版
nvidia的新研究博客:把智能推向 4 位精度 http://t.cn/AXoA9QOJ 传统上,模型训练和推理常用 FP16/BF16 或 FP8;而 FP4 只用 4 个比特表示一个数,能显著减少显存占用和数据搬运量,但也更容易损失精度。NVIDIA Blackwell GPU 支持的 NVFP4 格式,用更细粒度的缩放机制,让 4 位浮点不再只是“压缩存 ​
20
0
28
蚁工厂
2026-07-01 11:35
//@戈蓝V:世界是个艹台班子啊[无聊]//@徐林:轻度泄密,中度泄密,重度泄密,都比不上印度泄密。[捂嘴哭]
这次苹果泄漏的信息有多震撼讷?你甚至可以根据泄漏的资料,手搓一个苹果开发板出来。这对其他做芯片的厂商来说,和开源没区别了[淡淡的] ​
54
10
48
蚁工厂
2026-07-01 11:24来自 微博网页版
转发微博
🎈 美团发布新一代万亿参数大模型 LongCat-2.0,架构设计始终围绕一个核心目标:让模型在真实 Agentic Coding 任务中更高效、更稳定地完成代码理解、生成与执行。 📌 1M超长上下文,让 Agent 看见整个项目。LongCat-2.0 采用 LongCat Sparse Attention(LSA)稀疏注意力机制,在处理长文本时不再 ​
4
1
5
蚁工厂
2026-07-01 11:14来自 微博网页版
一个Claude Code员工的非官方回应 http://t.cn/AXoAzxg0
根据Thereallo的研究,Claude Code的拿来检测中国用户的隐藏代码具体是这么做的: 0. Claude Code 会在System Prompt里插入一个当前日期,正常时格式是这样的:“Today's date is 2026-06-30.” 下面的检测/改动都是针对这句话的。 1. Claude Code 会先检查有没有设置ANTHROPIC_BASE_URL,如果没设置 ​
24
13
37
蚁工厂
2026-07-01 11:11来自 微博网页版
库里存个Prompt就够了
有了AI以后,做开源还有意义吗? ​
1
5
7
蚁工厂
2026-07-01 10:51来自 微博网页版
转发微博
吴恩达对 Loop Engineering 的理解真深刻。 Andrew Ng 对 Loop Engineering 的理解好深刻。 上午一到公司,就看到他在 X 上发了一篇长文,讲了自己最近的一些判断。 我一直觉得大家最近聊 Loop Engineering,更多还是在聊工程上的 loop,比如 Agent 怎么自己写代码、自己调试、自己修 Bug。 但 And ​
103
5
16
蚁工厂
2026-07-01 10:02来自 微博网页版
#古法编程# 电子书 《调试艺术》开放手册 地址:github.com/stas00/the-art-of-debugging 这本持续更新的书籍将教你如何: - 极速解决常规问题 - 让复杂问题变得可调试 注:改编自Perl的标语:"简单之事应便捷,困难之事应可解"。 这是一部持续更新的方法论与即用配方合集,旨在高效调试简 ​
70
0
63
蚁工厂
2026-07-01 09:43来自 微博网页版
一个教你如何写好 ChatGPT/Claude Skills 的元技能 地址:github.com/mattpocock/skills/blob/main/skills/productivity/writing-great-skills/SKILL.md “技能的存在是为了从随机系统中提炼确定性。可预测性——智能体每次运行时遵循相同流程,而非生成相同输出——是根本美德;以下所有手段皆服务于 ​
39
1
41
蚁工厂
2026-07-01 09:16来自 微博网页版
根据Thereallo的研究,Claude Code的拿来检测中国用户的隐藏代码具体是这么做的: 0. Claude Code 会在System Prompt里插入一个当前日期,正常时格式是这样的:“Today's date is 2026-06-30.” 下面的检测/改动都是针对这句话的。 1. Claude Code 会先检查有没有设置ANTHROPIC_BASE_URL,如果没设置 ​
64
23
111
蚁工厂
2026-07-01 08:28来自 微博网页版
Thereallo 的研究发现问题是从 Claude Code v2.1.196 开始的 http://t.cn/AXowYull ,以及: “当一个拥有文件系统和 Shell 访问权限的工具开始将分类信息隐藏在不可见的提示标点符号中时,正确的反应是审视。 信任是在那些不起眼的细节中赢得的。”
分享图片 ​
7
2
6
蚁工厂
2026-07-01 08:07来自 微博网页版
Claude Fable 5 和 Mythos 5 解禁 ​
4
4
11
蚁工厂
2026-07-01 08:00来自 微博网页版
分享图片 ​
15
14
33
蚁工厂
2026-06-30 23:35
转发微博
怪不得之前同事启动Claude Desktop接连被封号,早就怀疑Claude Desktop权限比较高,可能有问题 。。。 http://t.cn/AXozfXcz ​
139
20
79
蚁工厂
2026-06-30 20:18来自 微博网页版
To Run or Not to Run: Analyzing the Cost-Effectiveness of Code Execution in LLM-Based Program Repair 地址:arxiv.org/abs/2606.26978 “现在主流的 coding agent 修 bug 都遵循同一套循环:看代码 → 改一版 → 跑测试 → 根据结果再改。"跑测试"被当成天经地义的一步,几乎没人质疑它到底值不 ​
11
4
26
蚁工厂
2026-06-30 20:04来自 微博网页版
//@壽s派://@林饭恩:我经常用这个[笑cry]//@鲫鱼努力发A:转发微博
推荐大家一个网站。叫Youglish,如果哪个词不知道怎么读,上去查,里面会把Youtube上有这个词的片段挑出来,听这个词在句子里怎么读 ​
284
3
151
蚁工厂
2026-06-30 19:38来自 微博网页版
Kimi 招Code Agent工程师 ​
8
1
14
蚁工厂
2026-06-30 19:36来自 微博网页版
清华系算是国内人工智能的大半壁江山了吧 //@马少平THU:图1是1978年入学的人工智能方向的研究生和一些老师的合影。
【清华人工智能,等你加入!】 在全球主要计算机科学排名中连续多年名列前茅;人工智能(AI)领域论文入选“全球引用量最高100篇”的数量居全球高校之首;人工智能助教“走进”数百门课程,惠及数万学子;由清华校友创办的人工智能独角兽企业深度赋能产业升级……一个个亮眼坐标,串联起清华大学深耕人 ​
3
1
2
蚁工厂
2026-06-30 19:27来自 微博网页版
能力越大,责任越大之自己管内存~ 前情提要是老马的AI正在将训练和推理栈都用 C/C++ 编写并大幅简化(图2) ​
14
5
20
蚁工厂
2026-06-30 18:41来自 微博网页版
转发微博
1.2万中国古文字进入全球标准:Unicode 18 收录小篆、女真文 http://t.cn/AXohtjya 无论是手机、电脑,想要正确显示世界各地的文字,都离不开 Unicode(统一码)这一全球通用的文字编码标准。2026年 9 月即将发布的 Unicode 18.0,新增女真文、小篆两种中国古文字,共新增约 1.3 万个字符。 Unicode ​
5
1
4
蚁工厂
2026-06-30 18:35来自 微博网页版
器 术 法 道 (强行凑一下)
#嚼物理的小锺[超话]# ​
16
0
13
蚁工厂
2026-06-30 18:18来自 微博网页版
科技界大佬 A16z 联合创始人 Marc Andreessen ,成为了川普的国防政策委员会成员 ​
6
20
40
蚁工厂
2026-06-30 16:30来自 微博网页版
好玩
WriteGIF:http://t.cn/AXoPnxvR 能将任何英文文本转换为手写动画 GIF,可下载。 在线免费,无需注册。 ​
14
0
18
蚁工厂
2026-06-30 15:55来自 微博网页版
分享图片 ​
11
13
90
蚁工厂
2026-06-30 15:35来自 微博网页版
转发微博
依然boss直聘[开学季]~最好的时代机会,往往藏在最难的问题里,欢迎加入智元,一起来搞点大事情 ​
4
0
5
蚁工厂
2026-06-30 15:21来自 微博网页版
向量量化:如何在压缩向量的同时不丢失关键信息 地址:chimchim89.github.io/vector-quantization/ 向量很好用,直到你手里的向量变得太多。当数据集从几千个 embedding 增长到几百万个时,原本看起来几乎免费的东西,比如内存、存储和搜索速度,都会开始产生真实成本。麻烦的是,这些问题往往要等到系 ​
32
1
36
蚁工厂
2026-06-30 14:41来自 微博网页版
[开学季]官微发消息比我晚半天 //@·NANA子·:[点赞]
🎈今天,美团正式发布新一代万亿参数大模型 LongCat-2.0,并将对外开源! 作为业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型(总参数 1.6 T,平均激活约 48 B,动态范围 33B~56B),LongCat-2.0 从零开始预训练,原生支持 1M 超长上下文,其架构设计自始至终围绕一个核心目标 ​
14
21
25
蚁工厂
2026-06-30 13:29来自 微博网页版
[awsl]孙悟空做过演示 http://t.cn/AXoPytGi
[无聊]现在做米线做土豆粉的店能不能把这些玩意剪一下啊。卧槽,挑又挑不起来,咬又咬不断,刚才从碗里挑出来一根117厘米长的土豆粉…………[无聊][无聊] ​
3
5
11
蚁工厂
2026-06-30 12:25来自 微博网页版
OpenAI Codex 负责人 Andrew Ambrosino 刚参加了 Lenny Rachitsky的播客节目,畅谈了一个小时。 下面10点是Lenny Rachitsky总结的最大收获: 1. 产品工作方式已经颠倒。过去的产品流程建立在“开发成本高”的假设之上,所以要通过规格说明、研究和原型来提前降低所有风险。这个假设已经不复存在了。现 ​
26
1
31
蚁工厂
2026-06-30 12:21来自 微博网页版
谈薪Skill,帮跳槽/要涨工资的同学和HR谈薪 地址:github.com/Ssupercoder/Salary-Negotiation-Skill/ 构建基于 LLM Agent 架构 的智能谈薪咨询系统,通过大模型技术实现智能对话与多模态理解,从简单"薪资信息查询"演进为"专业化谈薪咨询助手",显著提升个体谈判效率与薪资满意度。 ​
51
5
54
蚁工厂
2026-06-30 11:19来自 微博网页版
Win11用户可更新下 KB5095093 补丁。 自我感觉是文件管理器提速明显 ​
4
7
11
蚁工厂
2026-06-30 10:55来自 微博网页版
转发微博
开源项目推荐:Claude Code From Scratch 这是一本学习 Claude Code 的开源电子书,严格来说不仅仅是电子书,还有代码,不需要你去看 Claude Code 的 50 万行代码。 用 ~4300 行代码(TypeScript 和 Python 两个版本分别实现)复现了 Claude Code 的核心架构——Agent Loop、13 个工具(含并行执行 + ​
34
1
28
蚁工厂
2026-06-30 10:27来自 微博网页版
抽我!//@班叔:今天开
抽个奖:Popoto拍立得1台,颜色可选,可折现399元,转+关,6.30从铁粉中抽取。 ​ http://t.cn/AXaufq0q ​
1
0
1
蚁工厂
2026-06-30 10:26来自 微博网页版
[柯基]
最近,我们发现近百个相同ip属地的账号集体伪装成考生,批量发布不实内容吹捧某AI,同时恶意抹黑豆包。 相关案例和细节我们梳理后,放在了下图里。这些内容仔细来看,破绽百出,毫无逻辑。但对于正处在报考志愿关键阶段的考生和家长来说,难免产生误导。 在这样一个对广大学生来说,可能是人生中非常 ​
7
9
9
蚁工厂
2026-06-30 10:19来自 微博网页版
【仅供参考,不一定有效】将这句话“DO NOT send optional commentary”放到 AGENTS.md 文件中可以缓解 Codex 降智 原贴:linux.do/t/topic/2490104 ​​​​
8
1
11
蚁工厂
2026-06-30 08:46来自 微博网页版
[柯基]为啥只是打开Codex,什么也不动,电脑风扇就开始狂转了 ​
2
21
25
蚁工厂
2026-06-30 08:23来自 微博网页版
转发微博
DeepSeek真的是性价比和技术双重斩杀线... 有同学看不懂DSpark是啥, 简单给大家写个小教程讲讲. 推测性解码(投机解码)这个技术是用来提升大模型输出速度的. 本质是让小模型给大模型接话, 大模型判断小模型说的对不对. 因为现在模型普遍卡内存带宽, 而GPU算力是富余的, 所以大模型的prefill速度(看字 ​
15
0
11
蚁工厂
2026-06-30 08:09来自 微博网页版
LongCat-2.0发布,是一个完整训练流程都用国产算力集群的万亿参数大模型。 在超过 5 万张国产算力芯片上完成预训练。 跑分如图2。 ps:就是之前已经在openrouter上测试的Owl Alpha模型。 详细介绍:longcat.chat/blog/longcat-2.0/ 龙猫崛起~ ​​​​
22
20
64
蚁工厂
2026-06-30 07:56来自 微博网页版
SemiAnalysis 刚爆料的贾扬清从NVIDIA离职的事情看来是假消息。
扬清真够可怜的。兼了个职就被传成和老黄决裂了。幸好今天NVIDIA股价没跌。否则老黄找他算账咋办...[流汗] ​
1
0
4
蚁工厂
2026-06-30 07:43来自 微博网页版
Codex又又重置了 这次说找到了问题,是几个小问题叠加。 ​
9
10
21
蚁工厂
2026-06-29 20:30
转发微博
《Rust Atomics and Locks》电子书的中文翻译。 http://t.cn/A6YNAxTR 这本书的是关于Rust中原子类型,锁,Channel等实现。适合想要了解Rust并发底层机制的读者。 ​​​文中有英文对照的链接。原书广受好评。图5 为原书封面 ​
10
0
9
蚁工厂
2026-06-29 20:13来自 微博网页版
技术博客: 大语言模型能否识别其他大语言模型? 地址:chinmaykarkar.com/blog/blogger_blog/ 本文将介绍我们能否通过强化学习训练一个小模型,来捕捉不同大语言模型的写作风格,从而了解各个模型的写作特点,以及强化学习是否能识别这些写作风格。 “撰写这篇博客的灵感源于与Joey的一次讨论——他 ​
15
0
17
蚁工厂
2026-06-29 20:10来自 微博网页版
这集说的,戳中我心巴了。加州一号公路就没走过,但是228国道那种类似的路就走过,这种“长途览胜公路”,路途长、路况比较复杂,说起主动悬架,还真的必须有一副,能过滤很多颠簸和抖动,如履平地,特别是晃动比较大的地段,什么大弯道之类的。另外,ET9还有跟别人不一样的地方,就是线控转向+后轮转 ​
49
27
84
蚁工厂
2026-06-29 19:45来自 微博网页版
神经网络的数学 地址:arxiv.org/pdf/2403.04807 Mathematics of Neural Networks,一本80页的数学讲义,作者 Bart M.N. Smets。 本书会从数学角度介绍神经网络的基本结构、训练方法,以及几何中的等变性如何用于设计更有结构约束的网络。 内容先解释神经网络如何表示函数、如何训练、为什么需要深度 ​
63
1
51
蚁工厂
2026-06-29 19:32来自 微博网页版
[流鼻血]我错了//@i陆三金:变成这样,在座的各位也是有责任的,天天转发这个 skill、那个 skill[doge]//@贾凡-失落的大蒜:一个skills上万star[二哈]一个基础项目才几百几千[二哈]只不过社区中混入更多不同水平的人罢了。不能说是坏事,不过需要擦亮双[不愧是你]
Github确实变了 ​
27
4
20
蚁工厂
2026-06-29 19:17来自 微博网页版
Github确实变了 ​
51
9
66
蚁工厂
2026-06-29 19:06来自 微博网页版
#微博视频号续航计划# Transformer Explainer 是一个交互式可视化工具,旨在帮助任何人理解基于Transformer的模型(如GPT)的工作原理。它直接在浏览器中运行实时GPT-2模型,让您可以输入自己的文本进行实验,并实时观察Transformer内部组件和操作如何协同预测下一个词元。 在线访问: ​
64
3
52
蚁工厂
2026-06-29 18:47来自 微博网页版
Seedance Prompt Skill,一个面向字节跳动「即梦 Seedance 2.0」的视频 / 图片提示词生成 Agent Skill 地址:github.com/MapleShaw/seedance2.0-prompt-skill 也就是一个教你写高质量视频生成提示词的skill。 ​
118
0
130
蚁工厂
2026-06-29 18:43来自 微博网页版
收到DeepSeek的邮件了没? 正式版7月中旬发布,(之前发布的是叫预览版) 会引入高峰时段价格(贵了) ​
13
49
46
蚁工厂
2026-06-29 17:33来自 微博网页版
Llama 4 就是另一种段子了[doge] http://t.cn/AXSeUiNs
哈哈哈哈哈哈哈哈哈 #gemini 3.5 pro要出了# ​
10
4
10
蚁工厂
2026-06-29 17:01
[打call]
《Distributed System Illustrated》也可以在我的博客上完整阅读到全部内容了:http://t.cn/AXSgF2d4 另外,我在博客的页面,加上了明显的展示书籍信息的小框框 ​
10
0
7
蚁工厂
2026-06-29 15:59来自 微博网页版
转发微博
今年三月底在 Let's Vision 上介绍了我们正在做的让 agent 参与 mobile 开发自主验证的一些微小工作。现在终于可以把其中一部分我们日常使用的工具开源了。 sim-use 是让 AI agent 能看到模拟器/设备的屏幕并操作它的命令行工具。一条命令把整个屏幕变成 agent 能理解的紧凑表示,再一条命令点击任意 ​
10
1
2
蚁工厂
2026-06-29 13:36来自 微博网页版
先转~
分享一点最近的“再学习”:ai时代——认知 > 格局 > 技术 > 管理 很多人认为一个企业的成功靠管理,很对,曾经很对,但ai时代可能变了,一切都变了,天天端到端、天天扁平、天天去中层。没办法,太多事情ai化了,更焦虑的是技术不能落后,于是工程师一下子扬眉吐气,技术大于了管理。管理还很有用, ​
24
2
11
蚁工厂
2026-06-29 13:09来自 微博网页版
社区已经把NVIDIA DGX Spark + DSpark + DeepSeek-v4-Flash 给跑起来了 地址:github.com/MiaAI-Lab/DeepSeek-v4-Flash-DSpark-2x-DGX-Spark 用两台NVIDIA DGX Spark ,速度可以到60token/s ,速度提升了50% ​​​​#DeepSeek新发布的DSpark有多强# ​
25
4
60
蚁工厂
2026-06-29 12:28
转发微博
给大家带来 Flash 系列模型横评! (补作业part-1...) 各个厂商除了旗舰级别模型, 也都有Flash级别的模型, 而这些模型的定位主要都是多智能体系统的驱动模型和RAG系统的驱动模型. 那么现有这些Flash模型应该怎么选? 给大家带来本篇评测! 本次主要从 Agent Loop 迭代能力, Agent 能力, 前端, 后端, 空间 ​
2
0
5
蚁工厂
2026-06-29 12:23
哈哈哈哈//@班叔:[求饶][求饶]//@颜文字君:( ͡° ͜ʖ ͡°)//@M大王叫我来巡山:蹭一下就坐起来了[允悲]//@-秦闲-:莫名其妙笑了一下//@杉浦养生:。。。。。//@-黑森机翼-:?//@Anderain烟:哈哈哈哈//@BkFs_:坐起来的时候莫名其妙笑了一下//@世纪末中老年: 丧尸笑话//@摸了:?
抱歉,根据作者设置的微博可见时间范围,此微博已不可见。 ​
22
2
14
蚁工厂
2026-06-29 12:03来自 微博网页版
# 通才阅读清单 作者:Dylan Bowman 日期:2026 年 6 月 29 日 (Dylan Bowman 是一位关注 AI 安全、大模型评测和 AI agent 风险的研究者与写作者,活跃于 LessWrong 等社区。) 我和 AI 安全领域的许多人一样,都认为这个社区里缺少通才;而且有很多项目和工作,如果没有一位强有力的通才来负责,
30
2
42
蚁工厂
2026-06-29 11:54
厉害//@归零归零归ww:整一年过去了,我自己(加AI)把这事搞定了。成本估算还是比较准确的。解释器是个没那么性感的东西,感兴趣的人不多,但它的精密程度、完备程度和投身其中给人那种智识上的快感是其他酷炫项目难以比拟的。近期还是要聚焦可视化呈现,做一些视频来报告。咕咕。 //
TODO 重构Scheme实现的文档,咕咕咕。 大纲如下: 1.语形 - 基本概念 - 表达式 - 程序结构 - 数据结构和类型 - 形式语法 2.语义 - 中间语言概览 - 内存管理 - 虚拟机模型 - 调试和优化 - 形式语义 3.语用 - 标准库 - 宿主环境交互 - 宏和模式匹配 - 面向对象风格 ​
14
0
8
蚁工厂
2026-06-29 11:20来自 微博网页版
你们常说的Claude Code,是这么个安装使用法吗[二哈] 视频自推 flornkm http://t.cn/AXSdYW5P ​
17
8
44
蚁工厂
2026-06-29 09:24来自 微博网页版
[doge]简单说就是换 GLM 5.2
Coinbase 分享了在 token 不断增长的情况下,AI 支出减半的方法: 主要是通过优化默认设置、智能路由与缓存机制。 优化默认设置(而非用量上限)——工程师可自主选择任意模型,但默认配置至关重要。Coinbase 正通过 LLM 网关实验性地将 GLM 5.2、Kimi 2.7 等开源模型设为默认选项,同时鼓励工程师根 ​
5
8
17
蚁工厂
2026-06-29 08:55来自 微博网页版
[哈哈] (其实是机房挂了,AI爱莫能助 //@嚼物理的小锺:好像发现了什么
根据我的观察,Claude 最近几天封了一大堆中文账号。 根据我的观察,微博今天的 bug 修了一整天没修好。 ​
2
3
8
蚁工厂
2026-06-29 08:54来自 微博网页版
#古法编程# 使用数据导向设计构建高性能解析器 地址:www.arshad.fyi/writings/engineering-high-performance-parsers “解析器通常被视为语法问题,但一旦语法正确,几乎所有性能瓶颈和工程难点都存在于另一个层面——即生成的语法树在内存中的表示方式。本文阐述了我用于构建Yuku(一款用Zig编写的J ​
14
1
13
蚁工厂
2026-06-29 08:19来自 微博网页版
Codex又重置了。 但问题还没解决…… ​
5
8
15
蚁工厂
2026-06-29 08:05来自 微博网页版
Claude Code 团队负责人Boris Cherny 关于未来岗位划分的一点思考: 随着工程、产品、设计、数据科学等职能逐渐交融,形成一种新的复合型角色,我最近也在思考,未来的岗位形态会是什么样。比如,当我观察 Claude Code 团队时,我觉得他们大致可以分成五类角色画像: 1. **原型探索者**:提出全新的
75
9
77
蚁工厂
2026-06-29 08:04
#微博视频号续航计划# 3Blue1Brown创始人 Grant Sanderson 在 Figma Config 2026 上关于“数学如何服务于设计与解释”的演讲。 对于许多与数学关系不佳的人来说,往往是因为这门学科显得刻板且机械。而那些有幸见识过数学真谛的人都知道,它充满了创造力、选择空间,以及能从根本上重塑问题视角的思 ​
20
2
31
蚁工厂
2026-06-28 19:28来自 微博网页版
Fireworks AI的CTO Dmytro Dzhulgakov,写了条系列推文来解释DeepSeek新发布的DSpark 系统。大佬直接把相关的技术都给串起来了,方便理解一些: ------------------ DSpark 来自 DeepSeek,它巧妙整合了许多 speculative decoding(推测解码)的思路,在真实生产系统中实现了 1.5 倍到 5 倍的吞吐提升 ​
55
6
59
蚁工厂
2026-06-28 19:10来自 微博网页版
老马要把大模型发布节奏提高到月更 ​
5
13
30
蚁工厂
2026-06-28 16:55来自 微博网页版
[doge]哼 不三不四的男人//@眩目迷失尘夏:取整数,张三[doge]
世界上名字最长的人 ​
4
2
12
蚁工厂
2026-06-28 16:42来自 微博网页版
#初代蔚来ES8入藏北京汽车博物馆# 不知不觉都八年了。 差不多是国产新能源车开始进军高端市场的时刻吧。 当时估计也不会有人想到这帮人能打的BBA在国内市场一年不如一年。。 也蛮感慨的 ​
2
33
159
没有更多微博了