karminski-牙医 26-01-20 06:47
微博认证:AI博主

智谱赶紧加卡啊!

智谱刚刚发布了GLM-4.7-Flash, 我正想测一下长上下文性能和召回水平, 结果发现特别爆火, 用量太大导致官方接口输出特别慢, 而且貌似支支持单并发. 我看了下OpenRouter提供的官方API更惨, 输出只有每秒12 token....

这个模型官方提供了免费的接口, 我用的还是付费的接口也快不了多少... 建议赶紧加卡, 我先睡了, 让任务先跑, 睡醒了给大家带来长上下文测试结果.

#ai生活指南##ai创造营#

发布于 日本