谷歌工程师开源AI推理笔记

#模型时代# 谷歌一位杰出工程师整理的现代AI推理引擎笔记。

一位推特网友评价说，这是“有史以来关于大型语言模型的最权威文献”：
docs.google.com/document/d/1WUk_A3LDvRJ8ZNvRG--vhI287nDMR-VNM4YOV8mctbI/edit?tab=t.u5rxkidg8s5c

作者自述：
你是否曾想过超越浅层的 Transformers 教程，真正理解现代推理引擎是如何工作的？🚀 ⭐
我有过这样的想法，这也是我开始整理自己详细笔记的原因。今天，我将它们开源，让所有人都能受益。这不仅仅是一份文档；而是一次以代码为核心的深度探索。🧠 🔎
以下是你将在最新版本中看到的内容：
✅ 从零开始看 Transformers：我们在社区反馈的基础上，从头重构了第一部分，使其更加清晰明了。
✅ 推理全景图：一份扩展指南，涵盖了其他资源中常被忽视的技术。
✅ 实战代码：
一个简洁且带有注释的 JAX Transformer。
一个全新的、带有注释的 Qwen 风格 PyTorch 实现——同类中的首批之一。
✅ “为什么”：现在已包含附录，附有基础数学内容。
这是一项正在进行的工作（图片即将上线！），您的观点非常宝贵。我正在寻找反馈、建议和合作伙伴，将其提升到新的水平。

发布于美国