LM Studio 0.3.10 推测性解码支持,推测性解码(Speculative Decoding)是一种LLM推断技术,在某些情况下可以将token生成速度提高多达1.5倍-3倍。此版本为GGUF和MLX模型以及聊天界面和API都引入了推测性解码。
发布于 上海
LM Studio 0.3.10 推测性解码支持,推测性解码(Speculative Decoding)是一种LLM推断技术,在某些情况下可以将token生成速度提高多达1.5倍-3倍。此版本为GGUF和MLX模型以及聊天界面和API都引入了推测性解码。