围绕韩国推动原生AI模型的争议:中国代码
韩国的努力显示出开发本土AI模型、摆脱对美中科技巨头依赖的艰难
去年6月,韩国政府启动了一项竞赛,旨在打造一个由韩国技术自主研发、独立可控的全新人工智能模型。面对一个已被美国和中国人工智能主导的世界,这样一款本土工具被认为对确保韩国的技术自主至关重要。
但事实证明,说起来容易,做起来难。
在这项为期三年的竞赛中,进入决赛的五家公司里,有三家被发现至少在部分环节中使用了来自外国人工智能模型的开源代码,其中包括中国的模型。
这些公司和部分AI专家认为,刻意回避现有AI模型、试图从零开始构建一切并不合理。但反对者则表示,任何使用外国工具的行为都可能带来潜在的安全风险,并削弱培育一个“毫无争议属于本国”的AI模型的努力。
熟悉这项韩国竞赛、但并未直接参与任何参赛公司的哈佛大学电气工程教授魏古然(Gu-Yeon Wei)表示,在推进AI模型开发时,要求每一行代码都完全由内部编写并不现实。
“如果放弃开源软件,”魏说,“你等于把巨大的潜在收益白白丢在桌上。”
全球各国正越来越多地试图减少对外国技术的依赖,在这一可能深刻影响经济竞争力和国家安全的关键技术领域强化自身能力。
拥有众多芯片巨头、软件公司以及政治层面支持的韩国,被视为“主权AI”最为积极的倡导者之一。
这场竞赛的目标,是在2027年前选出两家本土赢家,其模型性能达到或超过OpenAI、谷歌等领先AI模型的95%。获胜者将获得国家资金支持,用于数据获取和人才招聘,并可使用政府采购、对AI算力至关重要的芯片。
近日,围绕决赛入围公司之一Upstage的争议骤然升温。当地竞争对手Sionic AI的首席执行官称,Upstage的AI模型部分组件与中国智谱AI(Zhipu AI)的一款开源模型存在相似之处;此外,他还声称在Upstage的部分代码中保留了智谱AI的版权标记。
“Sionic CEO高锡铉在LinkedIn上写道:‘一个被怀疑是对中国模型进行微调复制的模型,竟然提交到了由纳税人资金支持的项目中,这令人深感遗憾。’”Sionic也曾参加此次韩国竞赛,但未能进入决赛名单。
对此,Upstage随后举行了一场直播验证会,公开其开发日志,以证明其模型是从空白状态出发、采用自有方法开发和训练的。不过,用于运行模型的推理代码确实使用了源自智谱AI的开源组件,而这些组件在全球范围内被广泛使用。随后,Sionic的CEO为此表示了道歉。
这场风波也促使外界对其他入围者进行更深入的审视。Naver的AI模型被指其将图像和声音转化为机器可理解格式的视觉和音频编码器,与中国阿里巴巴以及OpenAI的相关产品存在相似之处。
SK电讯也遭到批评,其用于运行AI模型的推理代码被认为与中国DeepSeek的代码存在相似性。
Naver承认使用了外部编码器,但表示这是采用标准化技术的战略性选择,并强调模型的核心引擎——即决定模型如何学习和训练的部分——完全由公司自主开发。SK电讯也提出了类似的辩护,强调其模型核心的独立性。
竞赛规则并未明确规定是否允许使用来自外国公司的开源代码。负责监管该竞赛的韩国科学部在争议爆发后也尚未发布新的指导方针。韩国科学部长裴景勋则对这场激烈讨论表示欢迎。
==============================
[奶牛猫]韩国也要独立自主啊?
