梁赛 25-09-02 11:44
微博认证:AI博主

再介绍一次苹果的FastVLM,可能带来AI应用的增长,以及给端侧AI玩具的玩法带来更大的想象空间。
模型变体在性能上超越了LLaVA-OneVision-0.5B,首个token生成时间(TTFT)快85倍(这个对于做一些AI应用,AI玩具及时响应非常重要 ),且视觉编码器体积小3.4倍。
还提供了iOS应用支持(这是肯定的)。 ​​​​
演示Gif图有点大,稍等一下就能看到效果(反应速度非常的快)

发布于 广东