今年秋季,麒麟芯片将原生搭载30B端侧大模型。
依托逻辑折叠技术,芯片仅在内存中调用2B模型算力单元,
配合亲和量化、剪枝、分层权重管理等优化手段,
实现大参数模型存储+低内存占用运行,
一举破解端侧设备性能、功耗、内存难以兼顾的难题。#华为开发者大会2026##华为[超话]#
发布于 重庆
今年秋季,麒麟芯片将原生搭载30B端侧大模型。
依托逻辑折叠技术,芯片仅在内存中调用2B模型算力单元,
配合亲和量化、剪枝、分层权重管理等优化手段,
实现大参数模型存储+低内存占用运行,
一举破解端侧设备性能、功耗、内存难以兼顾的难题。#华为开发者大会2026##华为[超话]#