二〇二六年一月一六日

F/OSS 史唯(史唯): 우리는 LLM을 拒否(거부)할 게 아니라 되찾아 와야 한다

며칠 前(전) 自由(자유)·오픈 소스 소프트웨어와 LLM 學習(학습)에 關(관)해(On FLOSS and training LLMs)라는 글을 읽었다。自由(자유)/오픈 소스 소프트웨어 커뮤니티에서 느끼는 挫折感(좌절감)을 잘 담아낸 글이었다。AI 企業(기업)들은 F/OSS 開發者(개발자)들을 全(전)혀 尊重(존중)하지 않는다。오픈 소스 라이선싱의 理想主義的(이상주의적) 原則(원칙)을 惡用(악용)하고 있다。法(법)은 우리의 作業物(작업물)이 獨佔(독점) 言語(언어) 모델의 訓練(훈련) 材料(재료)로 쓰이는 걸 막아주지 못한다。글을 읽으며 여러 次例(차례) 고개를 끄덕였다。

하지만 나는 이 글의 結論(결론)에는 同意(동의)하지 않는다。

著者(저자)가 提案(제안)하는 解法(해법)은 拒否(거부)와 孤立(고립)이다。크롤러를 遮斷(차단)하고、GitHub 같은 中央化(중앙화)된 포지에서 떠나고、AI 스크래퍼가 우리 코드에 接近(접근)하지 못하게 막자는 것이다。그리고 이런 非倫理的(비윤리적) 道具(도구)를 쓰는 사람들을 커뮤니티에서 排斥(배척)하자고 한다。斷折(단절)과 孤立(고립)의 戰略(전략)이다。憤怒(분노)는 理解(이해)된다。하지만 이 接近(접근)은 重要(중요)한 機會(기회)를 놓치고 있고、F/OSS를 만들어온 歷史的(역사적) 패턴을 誤讀(오독)하고 있다。

우리가 同意(동의)하는 地點(지점)

갈라지는 地點(지점)을 論(논)하기 전에、著者(저자)가 옳은 部分(부분)부터 짚고 넘어가자。現在(현재)의 狀況(상황)은 정말로 深刻(심각)하다。AI 企業(기업)들은 訓練(훈련) 데이터 出處(출처)를 完全(완전)히 無視(무시)하고 있다。法的(법적)으로 可能(가능)하니까 하겠다는 말이 그들이 個別(개별) 開發者(개발자)와 커뮤니티를 대하는 態度(태도)를 正確(정확)하게 보여준다。攻擊的(공격적)인 크롤링은 事實上(사실상) 分散(분산) 서비스 拒否(거부)(DDoS) 攻擊(공격)이나 다름없다。콘텐츠 製作者(제작자)의 明示的(명시적) 意思(의사)는 無視(무시)된다。제대로 作動(작동)하는 옵트아웃(opt-out) 메커니즘조차 提供(제공)하지 않는다。

法的(법적) 싸움도 이기기 어렵다는 點(점)에서 著者(저자)의 말이 맞다。F/OSS 라이선스는 本質的(본질적)으로 用處(용처)를 差別(차별)하지 않는다。오픈 소스 定義(정의)의 여섯 番(번)째 原則(원칙)은 特定(특정) 分野(분야)에 對(대)한 制限(제한)을 明示的(명시적)으로 禁止(금지)한다。GPL 같은 主要(주요) 라이선스들은 著作者(저작자) 表示(표시)를 要求(요구)하고 派生(파생) 著作物(저작물)에 對(대)한 條項(조항)을 두고 있지만、著者(저자) 말대로 能力(능력) 있는 辯護士(변호사)라면 LLM 訓練(훈련)이 從來(종래) 意味(의미)의 派生(파생) 著作物(저작물) 生成(생성)이 아니라고 主張(주장)할 수 있다。統計的(통계적) 패턴 抽出(추출)이 코드 再使用(재사용)처럼 著作者(저작자) 表示(표시)를 要求(요구)하지 않는다고 말이다。

現在(현재)의 法(법)은 不足(부족)하다。이 法(법)은 옛 時代(시대)를 爲(위)해 만들어졌다。그 시대에 使用(사용)이란 소프트웨어를 實行(실행)하거나 修正(수정)하거나 再配布(재배포)하는 것이었지、神經網(신경망)에 넣어 패턴을 抽出(추출)하는 게 아니었다。法(법)은 權力(권력)을 爲(위)해 奉仕(봉사)한다。이 境遇(경우) 權力(권력)은 法務(법무)팀을 動員(동원)해 이런 模糊(모호)함을 探索(탐색)하고 惡用(악용)할 수 있는 企業(기업)들에게 있다。

우리가 갈라지는 지점

그러나 여기서 길이 갈라진다。答(답)은 拒否(거부)가 아니라 再專有(재전유)다。

著者(저자)는 現在(현재)의 狀況(상황)을 開發者(개발자) 尊重(존중)과 AI 訓練(훈련) 許容(허용) 사이의 싸움으로 프레이밍한다。하지만 第三(제3)의 길이 있다。F/OSS 歷史(역사)와 더 一貫(일관)되고、우리가 實際(실제)로 바라는 未來(미래)를 만들 可能性(가능성)이 높은 길이다。우리는 우리의 코드로 LLM을 訓練(훈련)하지 못하게 막으려 하기보다、모델 自體(자체)를 解放(해방)시키라고 要求(요구)해야 한다。

내 立場(입장)은 이렇다。나는 내 코드가 LLM 訓練(훈련)에 쓰이길 바란다。바라지 않는 건 그 訓練(훈련)으로 AI 私企業(사기업)의 私有(사유) 財産(재산)이 되는 獨佔(독점) 모델이 만들어지는 것이다。問題(문제)는 技術(기술) 自體(자체)나 訓練(훈련) 過程(과정)이 아니다。公有地(공유지)의 私有化(사유화)、集團(집단) 知識(지식)의 獨佔(독점)、價値(가치)가 多數(다수)에서 少數(소수)로만 흐르는 것이 問題(문제)다。

이건 아주 새로운 問題(문제)는 아니다。F/OSS가 여태 싸워온 그 問題(문제)다。옷만 바꿔 입었을 뿐이다。

現實(현실) 認識(인식)에 關(관)하여

더 나아가기 전에 根本的(근본적)인 이야기를 하나 해보자。LLM을 둘러싼 여러 觀點(관점)들은 大槪(대개) 現實(현실) 自體(자체)를 어떻게 認識(인식)하느냐에서 갈린다。

얼마 前(전) Redis 製作者(제작자) Salvatore Sanfilippo、一名(일명) antirez가 AI 코딩 道具(도구) 經驗談(경험담)을 썼다。그는 우리 中(중) 많은 이들처럼 손으로 빚은 코드와 소프트웨어의 人間的(인간적) 손길을 깊이 重視(중시)하는 사람이다。하지만 이렇게 말한다。只今(지금) 일어나고 있는 現實(현실)을 外面(외면)하는 건 不可能(불가능)하다。코드 作成(작성)은 더 以上(이상) 大部分(대부분) 必要(필요) 없다… 프로그래밍은 永遠(영원)히 바뀌었다。

그의 結論(결론)은 이렇다: 適應(적응)하라。새 道具(도구)들을 배우라。反(반)AI 하이프(hype)에 빠지지 말라。그는 LLM을 九十年代(90년대) 오픈 소스처럼 民主化(민주화) 技術(기술)로 본다。작은 팀이 큰 會社(회사)와 競爭(경쟁)할 수 있게 해준다고 말이다。

나도 antirez의 現實(현실) 認識(인식)에 大體(대체)로 同意(동의)한다。LLM은 프로그래밍을 根本的(근본적)으로 바꿨고、되돌릴 수 없다。反面(반면) 自由(자유)·오픈 소스 소프트웨어와 LLM 學習(학습)에 關(관)해의 著者(저자)는 現實(현실)을 다르게 認識(인식)하는 것으로 보인다。抵抗(저항)이 如前(여전)히 意味(의미) 있고、撤收(철수)가 效果的(효과적)일 수 있으며、LLM의 訓練(훈련) 데이터 接近(접근)을 意味(의미) 있게 줄일 수 있다는 認識(인식)이다。나는 懷疑的(회의적)이다。OpenAI와 Anthropic은 이미 必要(필요)한 걸 다 긁어갔다。GitHub도 모든 코드를 갖고 있다。訓練(훈련) 데이터는 이미 存在(존재)한다。

하지만 여기서 나는 antirez의 樂觀論(낙관론)과 갈라선다。그는 中央化(중앙화)를 걱정하면서도 中國產(중국산) 오픈 모델 等(등)을 通(통)해 市場(시장) 競爭(경쟁)이 解決(해결)해줄 거라고 믿는 듯하다。그리고 開發者(개발자)들이 어떻게 適應(적응)하고 이 道具(도구)를 活用(활용)할 수 있는지에 集中(집중)한다。重要(중요)한 얘기지만、더 깊은 質問(질문)을 비껴간다。이 變革(변혁)은 어떤 條件(조건)에서 일어나는가？

質問(질문)은 LLM을 쓸 것이냐 適應(적응)할 것이냐가 아니다。그 배는 이미 떠났다。質問(질문)은 누가 모델을 所有(소유)하느냐다。모델을 訓練(훈련)시킨 公有地(공유지)로부터 누가 利得(이득)을 보느냐다。數百萬(수백만) F/OSS 開發者(개발자)가 自己(자기) 코드를 公共(공공)에 寄與(기여)했다면、結果(결과)로 나온 모델이 獨佔(독점)이어야 하나？이건 單純(단순)히 中央化(중앙화)나 市場(시장) 力學(역학) 問題(문제)가 아니다。集團(집단) 勞働(노동)의 열매가 集團(집단)에게 남느냐、私有(사유) 財産(재산)이 되느냐의 問題(문제)다。

唯物論的(유물론적) 讀解(독해)

自由(자유)·오픈 소스 소프트웨어 歷史(역사)를 唯物論的(유물론적) 렌즈로 보면 明確(명확)한 패턴이 보인다。技術(기술) 變化(변화)가 새로운 形態(형태)의 搾取(착취)를 만들고、그 搾取(착취)는 公有地(공유지)를 保護(보호)하기 爲(위)한 새로운 形態(형태)의 라이선싱을 요구한다。

軌跡(궤적)을 살펴보자。

GPLv2(一九九一(1991))는 바이너리 配布(배포) 問題(문제)를 다뤘다。企業(기업)들이 GPL 코드를 가져다 컴파일해서 바이너리만 配布(배포)했다。自由(자유) 코드로 事實上(사실상) 獨佔(독점) 소프트웨어를 만든 것이다。解法(해법)은 카피레프트(copyleft)였다。소프트웨어를 配布(배포)하면 소스 코드도 提供(제공)해야 한다。

GPLv3(二〇〇七(2007))는 티보이제이션을 다뤘다。TiVo 같은 企業(기업)들은 技術的(기술적)으로는 소스 코드를 提供(제공)했지만 하드웨어 락으로 修正版(수정판) 實行(실행)을 막았다。解法(해법)은 소스 코드뿐 아니라 設置(설치) 情報(정보)까지 要求(요구)하는 것이었다。使用者(사용자)가 修正(수정)할 自由(자유)를 維持(유지)하도록 말이다。

AGPL(二〇〇七(2007))은 SaaS 虛點(허점)을 다뤘다。企業(기업)들은 소프트웨어를 配布(배포)할 必要(필요)가 없다는 걸 깨달았다。서비스로만 돌리면 GPL 配布(배포) 要求事項(요구사항)이 作動(작동)하지 않았다。解法(해법)은 네트워크 相互作用(상호 작용)을 配布(배포)와 同等(동등)하게 取扱(취급)하는 것이었다。

每番(매번) 같은 패턴이 反復(반복)됐다。새 技術(기술)이 旣存(기존) 라이선스의 間隙(간극)을 드러내면、企業(기업)들이 그 間隙(간극)을 惡用(악용)했다。그러면 커뮤니티가 間隙(간극)을 메우는 進化(진화)한 라이선싱으로 對應(대응)했다。이건 理想主義(이상주의)가 現實(현실)을 만나 失敗(실패)한 게 아니다。辨證法的(변증법적) 發展(발전)이다。變化(변화)하는 物質的(물질적) 條件(조건)에 맞춰 우리 道具(도구)를 精製(정제)하는 持續的(지속적) 過程(과정)이다。

이제 또 새로운 間隙(간극)이 보인다。바로 訓練(훈련) 虛點(허점)이다。企業(기업)들은 F/OSS 코드를 獨佔(독점) 모델의 訓練(훈련) 데이터로 쓸 수 있다。모델을 公開(공개)하거나 訓練(훈련) 出處(출처)를 밝힐 義務(의무)도 없다。典型的(전형적)인 搾取(착취)다。互惠性(호혜성) 없는 價値(가치) 抽出(추출)이다。

唯物論的(유물론적) 對應(대응)은 새 技術(기술)을 拒否(거부)하는 게 아니다。라이선스를 進化(진화)시켜 包括(포괄)하는 것이다。

訓練(훈련) 카피레프트가 어떤 모습일 수 있을까

나는 GPLv4나 TGPL (Training GPL) 같은 것을 꿈꾼다。이런 條項(조항)들을 包含(포함)해야 할 것이다。

訓練(훈련)은 明示的(명시적)으로 許容(허용)한다。코드는 機械(기계) 學習(학습) 모델의 訓練(훈련) 데이터로 쓰일 수 있다。F/OSS 自由(자유) 原則(원칙)과 一致(일치)하고 分野(분야) 差別(차별)을 피한다。

하지만 그 結果物(결과물)인 모델은 解放(해방)되어야 한다。該當(해당) 코드로 訓練(훈련)한 모든 모델은 互換(호환) 可能(가능)한 카피레프트 라이선스로 加重値(가중치)(weights)를 公開(공개)해야 한다。GPLv3가 바이너리에 소스 코드를 要求(요구)하듯、訓練(훈련) 카피레프트는 訓練(훈련)된 시스템에 모델 加重値(가중치)를 要求(요구)한다。

訓練(훈련) 데이터는 文書化(문서화)해야 한다。依存性(의존성)을 文書化(문서화)하길 期待(기대)하듯、어떤 데이터로 訓練(훈련)했는지 明確(명확)히 밝혀야 한다。

파인튜닝(fine-tuning)된 모델도 義務(의무)를 물려받는다。카피레프트 모델을 파인튜닝하면 派生(파생) 모델도 公開(공개)해야 한다。조금만 修正(수정)해서 새 것이라 主張(주장)하기 回避(회피)를 막는다。

네트워크 使用(사용)도 義務(의무)를 賦課(부과)한다。AGPL처럼 API로 모델을 提供(제공)하는 것도 配布(배포)로 看做(간주)해 加重値(가중치) 公開(공개)를 要求(요구)한다。

技術的(기술적) 挑戰(도전)과 先例(선례)

이게 技術的(기술적)으로 可能(가능)할까？執行(집행)할 수 있을까？妥當(타당)한 質問(질문)이지만 새로운 質問(질문)은 아니다。以前(이전) 모든 GPL 進化(진화)에서 똑같이 提起(제기)된 質問(질문)이다。

바이너리가 當身(당신) 소스 코드로 컴파일됐다는 걸 어떻게 證明(증명)하나？하드웨어 락이 修正(수정)을 막는다는 걸 어떻게 證明(증명)하나？서비스가 當身(당신) 코드를 돌리고 있다는 걸 어떻게 證明(증명)하나？每番(매번) 答(답)은 技術的(기술적) 證據(증거)、커뮤니티의 監視(감시)、때로는 法的(법적) 措置(조치)의 組合(조합)이었다。完璧(완벽)한 執行(집행)은 不可能(불가능)하다。하지만 라이선스가 無價値(무가치)하단 뜻은 아니다。GPL 違反(위반)은 일어나지만 GPL은 作動(작동)한다。巨大(거대)한 公有地(공유지)를 만들고 保護(보호)해왔다。

特定(특정) 코드가 訓練(훈련)에 쓰였다는 證明(증명)은 소스 코드가 바이너리에 쓰였다는 證明(증명)보다 確實(확실)히 더 어려울 것이다。하지만 넘을 수 없는 건 아니다。訓練(훈련) 데이터셋은 文書化(문서화)할 수 있다。모델 系譜(계보)는 追跡(추적)할 수 있다。統計(통계) 分析(분석)이 訓練(훈련) 出處(출처)를 識別(식별)할 수도 있다。더 重要(중요)한 건、라이선스 存在(존재) 自體(자체)가 遵守(준수)를 向(향)한 社會的(사회적)·法的(법적) 壓力(압력)을 만든다는 것이다。

混合(혼합) 訓練(훈련) 세트 問題(문제)도 있다。TGPL과 非(비)TGPL 코드로 함께 訓練(훈련)하면？이것도 GPL과 非(비)GPL 코드를 링크하는 問題(문제)와 類似(유사)하다。數年間(수년간)의 커뮤니티 實踐(실천)과 이따금의 法庭(법정) 事例(사례)로 解決(해결)돼왔다。細部事項(세부사항)은 따로 풀어야 할 問題(문제)지만、큰 方向(방향)은 맞다。

이게 왜 撤收(철수)보다 重要(중요)한가

著者(저자)의 撤收(철수) 戰略(전략)은 感情的(감정적) 呼訴力(호소력)이 있다。接近(접근)을 拒否(거부)하고 當身(당신)은 우리를 尊重(존중) 안 하니 우리 作業(작업)을 가질 수 없다고 말하는 것은 이른바 사이다처럼 痛快(통쾌)하다。하지만 여러 面(면)에서 더 큰 그림을 놓친다。

一旦(일단) 이 戰略(전략)은 戰場(전장)을 크게 讓步(양보)한다。F/OSS 開發者(개발자)들이 코드를 公開(공개) 接近性(접근성)에서 撤收(철수)하면、그저 AI 訓練(훈련)을 막는 게 아니라 오픈 소스 AI 訓練(훈련)만 막는다。OpenAI와 Anthropic은 이미 필요한 건 다 긁어갔고、巨大(거대)한 데이터셋을 갖고 있다。撤收(철수)가 막는 건 Llama나 Mistral 같은 프로젝트와 더 넓은 오픈 소스 LLM 生態系(생태계)가 良質(양질)의 訓練(훈련) 데이터에 接近(접근)하는 것이다。

더 根本的(근본적)으로는、問題(문제)를 잘못 짚고 있다。技術(기술) 自體(자체)가 아니라 그것을 누가 어떻게 쓰느냐가 問題(문제)인데 말이다。LLM은 컴파일러나 웹 서버가 本質的(본질적)으로 搾取的(착취적)이지 않은 것처럼 本質的(본질적)으로 搾取的(착취적)이지 않다。道具(도구)일 따름이다。資本主義(자본주의) 下(하)의 모든 道具(도구)처럼 權力(권력)을 集中(집중)시키거나 分散(분산)시키는 데 쓰일 수 있다。使用(사용) 條件(조건)이 아니라 拒否(거부)에 集中(집중)하면 疾病(질병)이 아니라 症狀(증상)만 治療(치료)할 危險(위험)이 있다。

커뮤니티 分裂(분열) 危險(위험)도 있다。著者(저자)는 非倫理的(비윤리적) 道具(도구)의 使用者(사용자)들을 排斥(배척)하고 歡迎(환영) 받지 못하게 만들고 孤立(고립)시키자고 한다。하지만 어디까지가 使用(사용)인가？누가 F/OSS 프로젝트 패치를 作成(작성)하는 데 GitHub Copilot을 쓴다면？디버깅에 ChatGPT를 쓴다면？正確(정확)히 어디가 線(선)이고 그걸 누가 결정할까？이런 純粹性(순수성) 테스트는 歷史的(역사적)으로 目標(목표) 達成(달성)보다 運動(운동) 分裂(분열)에 더 效果的(효과적)이었다。

하지만 가장 致命的(치명적)인 건、實際(실제)로 作動(작동)해 왔던 F/OSS 戰略(전략)을 抛棄(포기)한다는 것이다。接近(접근)을 막는 게 아니라 라이선스로 自由(자유)를 지키는 戰略(전략)을。GPL의 天才性(천재성)은 누구에게도 코드 使用(사용)을 막지 않았다는 것이다。代身(대신)、받은 自由(자유)를 다른 이에게도 주도록 要求(요구)해서 모두의 自由(자유)를 保障(보장)했다。撤收(철수)는 正反對(정반대) 哲學(철학)이다。

우리가 만들어야 할 未來(미래)

나는 強力(강력)한 AI 모델이 存在(존재)하고、訓練(훈련)할 餘力(여력)이 있는 私企業(사기업)들만이 아니라 모두가 그러한 모델에 接近(접근)할 수 있는 未來(미래)에 살고 싶다。數百萬(수백만) F/OSS 프로젝트에 인코딩된 知識(지식)이 獨佔(독점) 모델로 私有化(사유화)되는 代身(대신) 公有地(공유지)의 一部(일부)가 되는 世上(세상)를 바란다。내 코드가 모델 訓練(훈련)을 돕는다면 그 모델을 나와 다른 모두가 使用(사용)하고 硏究(연구)하고 修正(수정)하고 共有(공유)할 수 있는 世上(세상)를 바란다。

이 未來(미래)는 撤收(철수)에서 오지 않는다。參與(참여)에서、우리의 라이선싱 道具(도구)의 進化(진화)에서、우리가 보고 싶은 오픈 소스 AI 生態系(생태계)를 構築(구축)하는 것에서 온다。GNU/Linux를 만들고、우리가 아는 웹을 만들고、우리가 每日(매일) 쓰는 道具(도구)를 준 것과 같은 戰略(전략)에서 온다。

著者(저자)는 尊重(존중)은 주어지는 게 아니라 얻어지는 것이고、우리를 無視(무시)하는 사람들은 똑같이 對(대)해야 한다고 쓴다。나도 이 原則(원칙)에는 同意(동의)하지만 다르게 適用(적용)하고자 한다。無禮(무례)한 것은 訓練(훈련) 行爲(행위) 自體(자체)가 아니라、그 結果物(결과물)을 私有化(사유화)하고 共同體(공동체)에 되돌려 주지 않는 데에 있다。適切(적절)한 對應(대응)은 우리도 共有(공유)를 拒否(거부)하는 게 아니다。그건 바닥으로의 競走(경주)다。互惠性(호혜성)을 要求(요구)하고 우리가 恒常(항상) 主張(주장)해온 바로 그 自由(자유)를 主張(주장)하는 것이다。

Linus Torvalds가 Linux를 獨佔(독점)으로 維持(유지)하는 代身(대신) GPL로 公開(공개)했을 때、企業(기업)은 이걸 쓸 수 없다고 말하지 않았다。누구든 쓸 수 있지만 改善(개선)하면 共有(공유)해야 한다고 말했다。그 條件(조건)、그 互惠性(호혜성) 要求(요구)가 自願奉仕(자원봉사) 開發者(개발자)와 巨大(거대) 企業(기업)을 모두 包含(포함)하는 生態系(생태계)를 만들었다。스마트폰에서 슈퍼컴퓨터까지 모든 걸 돌리고、함께 만드는 方式(방식)이 實際(실제)로 作動(작동)한다는 걸 證明(증명)한 生態系(생태계)를。

AI 時代(시대)에도 같은 原則(원칙)을 適用(적용)해야 한다。우리 코드로 訓練(훈련) 禁止(금지)가 아니라 우리 코드로 訓練(훈련)하면 모델을 解放(해방)해야 한다로。撤收(철수)가 아니라 參與(참여) 條件(조건)이다。拒否(거부)가 아니라 再專有(재전유)다。

歷史的(역사적) 機會(기회)

唯物史觀(유물 사관)은 必然性(필연성)에 關(관)한 게 아니라고 생각한다。패턴을 認識(인식)하고 그에 따라 行動(행동)하는 것이다。F/OSS 라이선싱의 모든 主要(주요) 轉換(전환)은 問題(문제) 認識(인식)、커뮤니티 論議(논의)、法的(법적) 革新(혁신)、漸進的(점진적) 採擇(채택) 패턴을 따랐다。LLM과 關聯(관련)해선 現在(현재) 그 사이클의 始作點(시작점)에 있는 듯하다。

機會(기회)이다。現在(현재) AI 訓練(훈련)과 모델 公開(공개)를 支配(지배)할 規範(규범)에 對(대)한 對話(대화)가 일어나고 있다。커뮤니티에서 이 問題(문제)들에 對(대)한 論議(논의)가 뜨겁다。오픈 소스 AI 모델이 늘어나는 只今(지금)、어떤 라이선스가 適用(적용)될지는 아직 定(정)해지지 않았다。

F/OSS 開發者(개발자)들이 이 對話(대화)에서 撤收(철수)하고、戰場(전장)을 讓步(양보)하고、拒否(거부)에만 集中(집중)하면、五年(5년) 뒤엔 企業(기업)과 企業(기업) 親和的(친화적) 法院(법원)에 依(의)해 모든 規範(규범)들이 設定(설정)된 걸 보게 될 것이다。訓練(훈련) 虛點(허점)이 確固(확고)하게 確立(확립)되고、오픈 소스 AI는 獨佔(독점) 모델 對比(대비) 永久的(영구적)으로 不利(불리)해질 것이다。

하지만 우리가 參與(참여)하고、訓練(훈련) 카피레프트를 밀어붙이고、모델 解放(해방)을 要求(요구)하는 라이선스로 코드를 公開(공개)하기 始作(시작)하면、우리가 그 未來(미래)를 만들 수 있다。쉽지는 않을 것이다。法的(법적) 作業(작업)、커뮤니티 組織化(조직화)、아마 法庭(법정) 事例(사례)도 必要(필요)할 것이다。GPL이 테스트되고 檢證(검증)되는 데 數年(수년)이 걸렸다。하지만 結局(결국) 作動(작동)했고、訓練(훈련) 카피레프트라고 作動(작동)하지 못할 이유는 없다。

결론

自由(자유)·오픈 소스 소프트웨어와 LLM 學習(학습)에 關(관)해에 表現(표현)된 憤怒(분노)와 挫折(좌절)을 尊重(존중)한다。現在(현재) AI 企業(기업)들이 나쁘게 行動(행동)하고 있고、우리의 作業物(작업물)을 搾取(착취)하고 있으며、法(법)이 不足(부족)하다는 點(점)에서、著者(저자)가 옳다。내 異見(이견)은 우리의 對應(대응)이 拒否(거부)가 아니라 進化(진화)여야 하고、撤收(철수)가 아니라 參與(참여)여야 하며、接近(접근) 禁止(금지)가 아니라 라이선싱 革新(혁신)이어야 한다고 믿는다는 점이다。

質問(질문)은 F/OSS 코드에 對(대)한 LLM 訓練(훈련)이 어떤 抽象的(추상적) 意味(의미)에서 倫理的(윤리적)인가가 아니다。어떤 條件(조건)에서 倫理的(윤리적)인가다。答(답)은 F/OSS가 여태까지 보여 준 答(답)과 같다고 믿는다。우리가 附與(부여)하는 自由(자유)가 保存(보존)되고 傳達(전달)될 때、改善(개선)이 公有地(공유지)로 돌아올 때、知識(지식)이 自由(자유)롭게 남을 때 倫理的(윤리적)이다。

크롤러를 遮斷(차단)하기보다는 그들이 크롤하는 規則(규칙)을 바꿔야 한다。GitHub에서 撤收(철수)하기보다는 GitHub 訓練(훈련)이 카피레프트를 尊重(존중)하도록 要求(요구)해야 한다。AI 道具(도구) 使用者(사용자)를 排斥(배척)하기보다는 우리의 自由(자유)를 尊重(존중)하는 더 나은 AI 道具(도구)를 만들어야 한다。

唯物史觀(유물 사관)은 가르친다。새로운 生產力(생산력)은 새로운 生產關係(생산관계)를 要求(요구)한다고。LLM은 새로운 生產力(생산력)이다。訓練(훈련) 카피레프트는 LLM을 F/OSS 價値(가치)와 整列(정렬)시킬 새로운 生產關係(생산관계)가 될 것이다。

내가 쓰는 코드는 自由(자유)롭기 爲(위)해 쓴다。神經網(신경망)을 通過(통과)해 모델 加重値(가중치)로 나타나더라도 自由(자유)롭게 남길 바란다。純眞(순진)한 理想主義(이상주의)가 아니다。數十(수십) 年間(연간) F/OSS를 이끌어온 바로 그 原則(원칙)이다。우리는 여러 技術(기술) 轉換(전환)을 거쳐 소프트웨어 自由(자유)를 保護(보호)해왔고、이番(번)에도 할 수 있다。

LLM을 拒否(거부)하는 게 아니라 되찾아 와야 한다。우리의 公有地(공유지)가 그들의 私的(사적) 庭園(정원)이 되는 걸 傍觀(방관)할 것인가？나는 코드가 모두의 것이듯、그걸로 訓練(훈련)한 AI 모델도 모두의 것이 되는 未來(미래)를 爲(위)해 싸우고 싶다。

이 글은 聯合宇宙(fediverse)에서 https://writings.hongminhee.org/ap/articles/2026/01/histomat-foss-llm로 檢索해서 찾을 수 있습니다.