最近经常看到Token,不知道具体的含义!详细看了一下,感觉又掌握了不同的知识点[哈哈][哈哈]果然是活到老,学到老,才能不被淘汰[哈哈][哈哈][哈哈]#词元Token是什么#
词元(Token)是人工智能处理信息的最小单位,相当于AI世界的“基础粒子”,也是中国日均调用量突破140万亿次的AI经济核心计量单位!
词元是大模型处理文本、图像、语音等信息的最小单元,需将内容拆分后才能运算。例如中文句子“我爱中国!”被拆解为“我/爱/中国/!”4个词元,英文单词“unhappy”拆为“un”和“happy”2个词元。
中英文差异:1个中文汉字≈1–2词元(如“饕餮”拆4词元),1个英文单词≈0.75–1词元。相同语义下,中文消耗词元量比英文高30%–50%。http://t.cn/AXfe4atd
发布于 山东
