不完全한 世上에서 唯物論的으로 行動하기: 生產 手段으로서의 LLM과 社會的 關係
이 글은 지난 달에 쓴 F/OSS 史唯: 우리는 LLM을 拒否할 게 아니라 되찾아 와야 한다의 後續이다。
Cory Doctorow가 Pluralistic 六週年 紀念 글에서 自身의 作業 흐름을 公開했다。그는 每日 發行하는 記事를 올리기 前에、Ollama라는 오픈 소스 LLM을 誤脫字 校閱 用途로 돌린다고 밝혔다。豫想할 수 있었던 反應이 따라왔다。그리고 獨逸의 技術 批評家 tante는 이틀 뒤 不完全한 世上에서 倫理的으로 行動하기(Acting ethically in an imperfect world)라는 글로 應答했다。
tante의 題目을 빌려오는 것이 이 글의 始作으로 어울린다고 봤다。不完全한 世上에서 倫理的으로 行動한다는 것이 그의 물음이라면、나는 같은 물음에 다른 틀로 答하고 싶다。倫理가 아니라 唯物論으로。
以前 글에서 나는 라이선싱을 奪還의 手段으로 너무 前面에 내세웠다。나이브하다는 批判을 받았고、그 批判에 어느 程度 首肯도 한다。다만 내가 말하고 싶었던 것은 奪還이라는 方向이었지、奪還의 處方이 아니었다。이 글에서는 그 方向을 좀 더 正確하게 다듬어 보고자 한다。
두 個의 허수아비
tante의 글에는 妥當한 指摘들이 있다。Doctorow는 LLM 批判者들을 技術의
創始者가 나쁜 사람이어서 쓰면 안 된다는 純粹主義者들
로 그렸는데、이건
허수아비다。實際 批判은 全혀 다른 데에 있다。莫大한 電力과 물 消費、同意 없는
데이터 蒐集、글로벌 사우스에서 이루어지는 搾取的 레이블링 勞働、오픈 소스
生態系를 包含한 知識 公有財에 加해지는 被害… Doctorow는 이 批判들을 Sam
Altman이 마음에 안 든다
는 感情的 反應으로 還元해버렸고、tante는 그 還元이
잘못됐다고 指摘한다。맞는 말이다。
Bluesky 指摘도 有效하다。Doctorow는 中央集權化에 對한 理念的 理由로 Bluesky
加入을 拒否했다。그는 自身의 價値에 根據해서 技術을 拒否하는 것이 可能하다고
믿고 實踐한다。그런데 他人이 LLM을 같은 方式으로 拒否하면 純粹主義
라고
부른다。이러한 二重 잣대도 tante가 正確히 짚었다。
그런데 tante도 같은 陷穽에 빠진다。
그는 奪還이라는 方向을 批判하면서、奪還의 手段을 事實上 하나로 限定한다。GPT에 準하는 프런티어 모델을 처음부터 다시 만드는 것。數十億 弗이 必要하고、그 過程에서 同一한 環境的 費用이 發生하므로、奪還은 現實的이지 않다는 것이다。하지만 Doctorow가 LLM 批判을 單純化했던 것처럼、tante도 奪還의 經路를 單純化했다。라이선스를 通한 法的 抵抗이 있다。規制를 通해 國家로 하여금 私有 모델의 公開를 強制할 수 있을 지도 모른다。公共 基盤 모델을 共同으로 構築하는 方向도 있다。어떤 手段이 實際로 作動할지는 政治的·社會的 條件에 달려 있고、아직은 열려 있다。내가 以前 글에서 라이선싱을 言及한 것은 그 中 가장 먼저 떠오른 하나였을 뿐이다。
機械와 그 資本主義的 適用 形態
Marx는 資本論 第一卷에서 英國의 러다이트 運動을 이렇게 評했다。
勞働者들이 機械 自體와 機械의 資本主義的 適用을 區分하고、따라서 物質的 生產 手段 그 自體가 아니라 그것의 社會的 搾取 形態를 攻擊하는 法을 배우기까지는 時間과 經驗이 必要했다。
紡織機를 부순 勞働者들의 憤怒는 正當했다。方向이 잘못됐을 뿐이다。問題는 機械가 아니라 機械를 둘러싼 資本主義的 社會 關係였다。機械가 勞働 時間을 短縮시키기는 커녕 延長시키고、勞働者를 解放시키는 代身 機械의 部品으로 만드는 것은 機械의 本性이 아니라 그것을 配置하는 方式의 問題였다。Marx는 그들을 嘲弄한 게 아니라、鬪爭이 成熟해지는 過程을 敍述한 것이다。
이 틀이 오늘날 LLM 論爭에서도 有效하다고 생각한다。tante의 接近은 本質的으로 倫理的이다。LLM이라는 技術 自體를 道德的으로 評價하고、그 評價에 따라 使用 與否를 決定한다。Doctorow의 接近도 크게 다르지 않다。다만 評價의 方向이 反對일 뿐이다。둘 다 技術을 道德의 對象으로 놓는다。
唯物論的 接近은 다른 質問을 한다。이 技術이 어떤 社會的 關係 속에 놓여 있는가。누가 所有하고、누구의 勞働으로 維持되며、그 剩餘는 어디로 흘러가는가。그리고 그 關係를 바꿀 수 있는가。
AI 贊反
이라는 構圖 自體가 이 質問을 가린다。巨大 AI 벤더들에
批判的이면서도 LLM이라는 技術의 可能性을 열어두는 것이 一貫性 없어 보이는 것은、技術과 그 資本主義的 適用 形態가 같은 것이라고 前提하기 때문이다。하지만 그
前提는 틀렸다。
圖書館과 사람
LLM은 圖書館이 아니다。圖書館이 原本으로 사람을 連結한다면、LLM은 原本 없이 答을 내놓는다는 批判은 一面 맞다。그런데 LLM은 사람에 더 가깝다고 생각한다。
人間도 平生에 걸쳐 厖大한 量의 텍스트와 코드와 이미지를 吸收한다。著作權者에게 一一이 許諾을 받지 않는다。그것을 自身의 것으로 녹여내고、때로는 그냥 짜집기에 不過한 것을 내놓고、때로는 아무도 생각하지 못했던 連結을 만들어낸다。
Anthropic의 Nicholas Carlini는 最近 Claude Opus 4.6을 利用해 Rust로 C 컴파일러를 처음부터 作成하는 實驗을 進行했다。 인터넷 接續 없이、클린 룸으로。結果는 Linux 6.9 커널을 x86、ARM、RISC-V 세 아키텍처에서 빌드하고、PostgreSQL、FFmpeg、SQLite、Redis를 컴파일하며、GCC 토처 테스트 스위트를 99% 通過하는 十萬 줄짜리 컴파일러였다。내가 알기로는 Rust로 作成된 C 컴파일러 中 그에 匹敵하는 成果를 거둔 先例는 없다。누군가의 作業을 그대로 再生產했다고 볼 수 없다。
勿論 LLM이 恒常 創造的인 것도 아니고、사람이 恒常 創造的인 것도 아니다。이
譬喩는 LLM을 美化하기 爲한 것이 아니다。LLM은 本質的으로 再生產만 한다
는
前提 위에 세워진 批判의 根據가 흔들린다는 것이다。
모든 生成型 AI가 같지 않다는 것도 이 틀에서 더 잘 드러난다。LLM과 이미지 生成 모델의 差異는 그저 技術의 差異가 아니라、어떤 勞働을 어떤 方式으로 代替하느냐의 差異다。이미지 生成 모델이 特定 作家의 스타일로 이미지를 뽑아낼 때、그것은 原作者의 市場을 直接 蠶食한다。機能의 代替가 아니라 存在의 代替다。그 剩餘가 어디로 가는지를 보면、Marx가 말한 勞働의 窮乏化(Verelendung)가 이미지 生成 分野에서 더 直接的으로 進行되고 있다。같은 잣대를 LLM에 그대로 適用할 수 있는지는 훨씬 複雜한 質問이다。
디폴트 視點
마지막으로 個人的인 이야기를 하나 꺼내고 싶다。
tante의 글은 웹에 올라가 있지만、主要 LLM 벤더의 스크래핑을 막도록 設定되어 있는 듯하다。朝鮮語가 母語인 내게 英語는 第二言語다。tante의 글처럼 論證의 뉘앙스와 暗示된 前提가 重要한 텍스트를、從來의 機械 飜譯으로는 제대로 옮기기 어렵다。LLM 程度는 되어야 論證이 살아있는 채로 傳達된다。나는 結局 글을 手動으로 複寫해서 LLM에게 넘겨 읽었다。
tante는 LLM이 著者와의 連結을 끊는다고 했다。檢索 엔진은 原本으로 사람을 案內하지만、LLM은 原本을 抽出해서 使用者를 自身의 루프 안에 가둔다는 것이다。틀린 말은 아니다。하지만 내 經驗은 그 圖式이 누구의 視點에서 그려졌는지를 보여준다。英語가 流暢한 讀者에게 LLM은 마냥 連結을 끊기만 하는 技術일 수 있다。하지만 英語가 서툰 讀者에게 LLM은 連結을 可能하게 하는 技術이기도 하다。tante가 LLM을 막은 行爲는 그 自身의 論理로는 一貫性이 있지만、結果的으로는 英語가 流暢한 讀者와 그렇지 않은 讀者 사이의 非對稱을 強化했다。
이것이 單純한 아이러니가 아닌 이유는、이 非對稱이 技術 談論 全般에서 作用하기 때문이다。누구의 視點이 디폴트로 設定되어 있는가。어떤 社會的 關係 속에서 그 디폴트가 만들어졌는가。
唯物論的으로 行動한다는 것은、그 디폴트를 當然하게 받아들이지 않는 것에서 始作한다。技術이 좋은가 나쁜가를 묻기 前에、이 技術이 누구를 爲해、누구의 勞働으로、누구의 利益을 爲해 作動하는가를 묻는 것이다。그리고 그 물음이 技術을 拒否할 이유가 아니라 奪還할 理由가 된다고 나는 如前히 생각한다。