智谱发布高速API

【智谱发布GLM-5.1高速版API，刷新全球大模型API速度纪录】 5月22日，智谱推出GLM-5.1高速版API“GLM-5.1-highspeed”，模型输出速度达400 tokens/s，刷新全球大模型厂商API速度上限。该版本打破行业惯例，首次在国产大模型中把旗舰级能力与极致低延迟带入生产环境，用户无需牺牲模型质量换速度。实测显示，AI编程场景生成代码速度快；3D游戏可瞬时建模使场景实时改变；交互界面能即时生成匹配需求的工具与交互。核心是TileRT高性能推理引擎，由智谱GLM团队与TileRT团队联合打造，通过推理引擎、调度系统、底层基础设施系统级优化，编译期将计算图静态编排为常驻GPU的persistent Engine Kernel。该版本适用于AI编程、实时交互等速度敏感场景，目前通过智谱MaaS平台向部分企业客户开放。
详情：http://t.cn/AX6yeQA4