#模型时代# 谷歌一位杰出工程师整理的现代AI推理引擎笔记。
一位推特网友评价说,这是“有史以来关于大型语言模型的最权威文献”:
docs.google.com/document/d/1WUk_A3LDvRJ8ZNvRG--vhI287nDMR-VNM4YOV8mctbI/edit?tab=t.u5rxkidg8s5c
作者自述:
你是否曾想过超越浅层的 Transformers 教程,真正理解现代推理引擎是如何工作的?🚀 ⭐
我有过这样的想法,这也是我开始整理自己详细笔记的原因。今天,我将它们开源,让所有人都能受益。这不仅仅是一份文档;而是一次以代码为核心的深度探索。🧠 🔎
以下是你将在最新版本中看到的内容:
✅ 从零开始看 Transformers:我们在社区反馈的基础上,从头重构了第一部分,使其更加清晰明了。
✅ 推理全景图:一份扩展指南,涵盖了其他资源中常被忽视的技术。
✅ 实战代码:
一个简洁且带有注释的 JAX Transformer。
一个全新的、带有注释的 Qwen 风格 PyTorch 实现——同类中的首批之一。
✅ “为什么”:现在已包含附录,附有基础数学内容。
这是一项正在进行的工作(图片即将上线!),您的观点非常宝贵。我正在寻找反馈、建议和合作伙伴,将其提升到新的水平。
发布于 美国
