【智谱发布GLM-5.1高速版API,刷新全球大模型API速度纪录】 5月22日,智谱推出GLM-5.1高速版API“GLM-5.1-highspeed”,模型输出速度达400 tokens/s,刷新全球大模型厂商API速度上限。该版本打破行业惯例,首次在国产大模型中把旗舰级能力与极致低延迟带入生产环境,用户无需牺牲模型质量换速度。实测显示,AI编程场景生成代码速度快;3D游戏可瞬时建模使场景实时改变;交互界面能即时生成匹配需求的工具与交互。核心是TileRT高性能推理引擎,由智谱GLM团队与TileRT团队联合打造,通过推理引擎、调度系统、底层基础设施系统级优化,编译期将计算图静态编排为常驻GPU的persistent Engine Kernel。该版本适用于AI编程、实时交互等速度敏感场景,目前通过智谱MaaS平台向部分企业客户开放。
详情:http://t.cn/AX6yeQA4
