Barret李靖 25-10-01 14:56
微博认证:阿里巴巴职员 科技博主 头条文章作者

Attention is all you need,顺着历史脉络去看 Transformer 自注意力机制的发展,还经历了Bag-of-Words、Word2vec、RNN、Attention 等概念的演进。《图解大模型》把 LLM 的内部原理,包括预训练、微调、语言模型的应用和优化等,一步步做了图解分析,写得挺不错👍 ​

发布于 浙江