摇摆时间线ZHLMI 25-02-20 00:55
微博认证:上海慧龙计算机系统有限公司多媒体经理

LM Studio 0.3.10 推测性解码支持,推测性解码(Speculative Decoding)是一种LLM推断技术,在某些情况下可以将token生成速度提高多达1.5倍-3倍。此版本为GGUF和MLX模型以及聊天界面和API都引入了推测性解码。 ​

发布于 上海