微软发布Maia 200:推理性能3倍领先谷歌TPU!
昨夜,微软正式发布新一代人工智能加速器芯——Maia 200,并称其性能达到竞争对手谷歌TPU与亚马逊Trainium处理器的三倍,标志着AI推理领域迎来重大突破。
该芯片被定位为专业的“推理引擎”,旨在使AI模型能够更迅速、高效地将所学知识应用于实际场景,为各类预测系统、问答服务及数据生成任务提供强大动力。
目前,微软已在美国中部数据中心地区部署Maia 200芯片,计划将其用于生成合成数据、优化下一代大语言模型的强化训练,并驱动微软Foundry、365 Copilot等核心AI服务。该芯片也将作为微软Azure云平台基础设施的重要组成部分,未来有望通过云服务向更广泛的客户开放,预示着企业级AI应用将进入更高性能、更高效能的新阶段。
据微软云与人工智能执行副总裁斯科特·格思里透露,Maia 200在4位精度(FP4)下可实现超过每秒10千万亿次浮点运算的强劲性能,同时在8位精度(FP8)模式下亦能保持每秒5千万亿次运算能力。FP4模式在显著提升能效的同时,以适度精度换取更高处理效率,特别适合大规模、高并发的AI推理任务。格思里强调:“一个Maia 200节点即可轻松运行当前最大规模的AI模型,并为未来更复杂的模型预留充足空间。”
业界人士分析指出,这一突破不仅大幅提升了AI推理任务的速度与能效,也为企业降低AI运营成本、加速AI应用落地提供了新的硬件选择。尽管目前Maia 200芯片主要服务于微软自身的Azure云与AI生态,但公司已释放出扩大客户使用范围的信号,预示着该芯片未来可能进一步拓展至更广泛的云端与数据中心场景,持续推动人工智能基础设施的演进与革新。
#热门微博##科技快讯##ai芯片##人工智能#
