深圳特区报 26-03-18 12:26
微博认证:深圳特区报官方微博

【#马斯克点赞深圳小孩哥#破解AI底层难题】#深圳小孩哥破解AI底层难题#3月16日晚,埃隆·马斯克在社交平台发文称,Kimi这项工作“令人印象深刻”(Impressive work from Kimi),将中国人工智能公司月之暗面(Moonshot AI)Kimi团队一项新近公开的技术成果带入更多公众视野。

随后,这篇同日发布的技术论文中,排在作者名单第一位的“Guangyu Chen”,因其“17岁高中生”身份引发社交平台关注。记者独家联系并核实得知,这位作者即陈广宇,来自深圳,目前仍是一名在读高中生。陈广宇在接受记者采访时表示,希望外界少写个人、多写技术和团队,不要为了热点突出个人,这项工作是团队共同完成的成果。

公开论文附录显示,Guangyu Chen、Yu Zhang、Jianlin Su前三位作者均被标注为“同等贡献”(Equal contribution),其余34位作者姓名后均未见这一标注。与陈广宇并列共同一作的另外两人,分别是张宇和苏剑林。前者是Kimi高效模型架构的重要研究者,后者则是大模型领域知名研究者,其提出的旋转位置编码(RoPE)已成为主流大模型广泛采用的位置编码方法之一。

这项成果受到关注,不仅因为作者名单中出现了一名高中生,且位列共同一作,也因为它触及了大模型一块长期沿用、却较少进入公众视野的底层结构。详情→http://t.cn/AXf4p5Go