子夜梦廊
26-05-03 00:52 微博认证:科技博主 微博原创视频博主

号称“从零开始”的韩国“国产AI”,被曝疯狂抄袭中国AI代码,竟称“不影响技术自主性”。

在AI领域,韩国远远落后于中美。为了确保数据与 AI 主权,对抗 ChatGPT 等海外巨头,韩国科学技术信息通信部,推出了“独立 AI 基础模型”项目。该项目要求参赛企业必须“从零开始”,以完全自主的形式研发百分百韩国产的AI大模型。参赛的五大主力包括 Naver Cloud、SK电讯、LG AI 研究院、NC AI 以及 Upstage。

然而就在今年1月初,韩国开发者社区和 AI 专家在审查世界最大的开源平台 GitHub 上的验证报告时发现:参赛的科企巨头Naver,最新公开的“HyperCLOVA X SEED 32B”大模型,其充当 AI “眼睛和耳朵”的核心模块——视觉编码器,实际上直接使用了中国阿里巴巴开源的“千问 2.5 ViT”模型。

​专家实测指出,Naver的模型在处理图像和声音核心模块上的权重(即已经训练完成的智能参数)与中国千问模型有着 99.5% 以上的重合。业内批评称,这已经不仅仅是“参考设计架构”,而是直接“连包带料”地将中国训练好的模块复制粘贴过去了。

讽刺的是。在HyperCLOVA X SEED 32B刚刚诞生时,Naver方面却洋洋得意地宣称,这个模型是自家“从零开始研发的”,“为了实现AI主权,我们从自主基础设施做起”,最后成功制造出了唯一一个拥有图像处理功能的作品。

然而,恰恰是这个“独特优势”,给了Naver的致命一击。多家AI企业在经过验证后,毫不客气地指出,Naver模型用于理解照片和语音的核心模块,其权重与中国的阿里千问模型高度重合,而且重合率高达99%。验证报告的结论是:“这绝不仅仅是参考了设计图的程度了,而是把中国方面已经训练好的AI智能原封不动地复制粘贴了过来!”

报告一出,舆论炸裂,指责声一片,而Naver Cloud方面却毫无歉意,甚至依旧嘴硬,狡辩什么“我们并没有直接照搬中国技术,只是进行了额外的训练和优化,为的是让模型准确识别韩国文化”,“大脑部分是100%自主研发的,
因此技术上的独立性不存在问题。”

但如此滑稽的诡辩,连韩国人自己都无法接受,他们指出:哪怕只使用了一部分中国模块,这种做法也违背了为了捍卫国家数据主权而研发自主AI的“国家代表AI”项目的初衷。

事情闹得满城风雨,韩国科学技术信息通信部同样觉得大丢脸面,直接宣布剥夺了Naver的晋级资格,但保留了他们参加复活赛的资格。

只是Naver Cloud方面表示:出于尊重政府的裁决,我们决定不再竞争参赛名额。看来他们自己也觉得再死撑下去,从面子到里子都要丢尽了。。。#三分钟视频助燃计划##海外新鲜事[超话]##科技先锋官# http://t.cn/AXJxnFhg

发布于 上海