二〇二六年二月二一日

不完全(불완전)한 世上(세상)에서 唯物論的(유물론적)으로 行動(행동)하기: 生產(생산) 手段(수단)으로서의 LLM과 社會的(사회적) 關係(관계)

이 글은 지난 달에 쓴 F/OSS 史唯(史唯): 우리는 LLM을 拒否(거부)할 게 아니라 되찾아 와야 한다의 後續(후속)이다。

Cory Doctorow가 Pluralistic 六週年(6주년) 紀念(기념) 글에서 自身(자신)의 作業(작업) 흐름을 公開(공개)했다。그는 每日(매일) 發行(발행)하는 記事(기사)를 올리기 前(전)에、Ollama라는 오픈 소스 LLM을 誤脫字(오탈자) 校閱(교열) 用途(용도)로 돌린다고 밝혔다。豫想(예상)할 수 있었던 反應(반응)이 따라왔다。그리고 獨逸(독일)의 技術(기술) 批評家(비평가) tante는 이틀 뒤 不完全(불완전)한 世上(세상)에서 倫理的(윤리적)으로 行動(행동)하기(Acting ethically in an imperfect world)라는 글로 應答(응답)했다。

tante의 題目(제목)을 빌려오는 것이 이 글의 始作(시작)으로 어울린다고 봤다。不完全(불완전)한 世上(세상)에서 倫理的(윤리적)으로 行動(행동)한다는 것이 그의 물음이라면、나는 같은 물음에 다른 틀로 答(답)하고 싶다。倫理(윤리)가 아니라 唯物論(유물론)으로。

以前(이전) 글에서 나는 라이선싱을 奪還(탈환)의 手段(수단)으로 너무 前面(전면)에 내세웠다。나이브하다는 批判(비판)을 받았고、그 批判(비판)에 어느 程度(정도) 首肯(수긍)도 한다。다만 내가 말하고 싶었던 것은 奪還(탈환)이라는 方向(방향)이었지、奪還(탈환)의 處方(처방)이 아니었다。이 글에서는 그 方向(방향)을 좀 더 正確(정확)하게 다듬어 보고자 한다。

두 個(개)의 허수아비

tante의 글에는 妥當(타당)한 指摘(지적)들이 있다。Doctorow는 LLM 批判者(비판자)들을 技術(기술)의 創始者(창시자)가 나쁜 사람이어서 쓰면 안 된다는 純粹主義者(순수주의자)들로 그렸는데、이건 허수아비다。實際(실제) 批判(비판)은 全(전)혀 다른 데에 있다。莫大(막대)한 電力(전력)과 물 消費(소비)、同意(동의) 없는 데이터 蒐集(수집)、글로벌 사우스에서 이루어지는 搾取的(착취적) 레이블링 勞働(노동)、오픈 소스 生態系(생태계)를 包含(포함)한 知識(지식) 公有財(공유재)에 加(가)해지는 被害(피해)… Doctorow는 이 批判(비판)들을 Sam Altman이 마음에 안 든다는 感情的(감정적) 反應(반응)으로 還元(환원)해버렸고、tante는 그 還元(환원)이 잘못됐다고 指摘(지적)한다。맞는 말이다。

Bluesky 指摘(지적)도 有效(유효)하다。Doctorow는 中央集權化(중앙 집권화)에 對(대)한 理念的(이념적) 理由(이유)로 Bluesky 加入(가입)을 拒否(거부)했다。그는 自身(자신)의 價値(가치)에 根據(근거)해서 技術(기술)을 拒否(거부)하는 것이 可能(가능)하다고 믿고 實踐(실천)한다。그런데 他人(타인)이 LLM을 같은 方式(방식)으로 拒否(거부)하면 純粹主義(순수주의)라고 부른다。이러한 二重(이중) 잣대도 tante가 正確(정확)히 짚었다。

그런데 tante도 같은 陷穽(함정)에 빠진다。

그는 奪還(탈환)이라는 方向(방향)을 批判(비판)하면서、奪還(탈환)의 手段(수단)을 事實上(사실상) 하나로 限定(한정)한다。GPT에 準(준)하는 프런티어 모델을 처음부터 다시 만드는 것。數十億(수십억) 弗(불)이 必要(필요)하고、그 過程(과정)에서 同一(동일)한 環境的(환경적) 費用(비용)이 發生(발생)하므로、奪還(탈환)은 現實的(현실적)이지 않다는 것이다。하지만 Doctorow가 LLM 批判(비판)을 單純化(단순화)했던 것처럼、tante도 奪還(탈환)의 經路(경로)를 單純化(단순화)했다。라이선스를 通(통)한 法的(법적) 抵抗(저항)이 있다。規制(규제)를 通(통)해 國家(국가)로 하여금 私有(사유) 모델의 公開(공개)를 強制(강제)할 수 있을 지도 모른다。公共(공공) 基盤(기반) 모델을 共同(공동)으로 構築(구축)하는 方向(방향)도 있다。어떤 手段(수단)이 實際(실제)로 作動(작동)할지는 政治的(정치적)·社會的(사회적) 條件(조건)에 달려 있고、아직은 열려 있다。내가 以前(이전) 글에서 라이선싱을 言及(언급)한 것은 그 中(중) 가장 먼저 떠오른 하나였을 뿐이다。

機械(기계)와 그 資本主義的(자본주의적) 適用(적용) 形態(형태)

Marx는 資本論(자본론) 第一卷(제 1권)에서 英國(영국)의 러다이트 運動(운동)을 이렇게 評(평)했다。

勞働者(노동자)들이 機械(기계) 自體(자체)와 機械(기계)의 資本主義的(자본주의적) 適用(적용)을 區分(구분)하고、따라서 物質的(물질적) 生產(생산) 手段(수단) 그 自體(자체)가 아니라 그것의 社會的(사회적) 搾取(착취) 形態(형태)를 攻擊(공격)하는 法(법)을 배우기까지는 時間(시간)과 經驗(경험)이 必要(필요)했다。

紡織機(방직기)를 부순 勞働者(노동자)들의 憤怒(분노)는 正當(정당)했다。方向(방향)이 잘못됐을 뿐이다。問題(문제)는 機械(기계)가 아니라 機械(기계)를 둘러싼 資本主義的(자본주의적) 社會(사회) 關係(관계)였다。機械(기계)가 勞働(노동) 時間(시간)을 短縮(단축)시키기는 커녕 延長(연장)시키고、勞働者(노동자)를 解放(해방)시키는 代身(대신) 機械(기계)의 部品(부품)으로 만드는 것은 機械(기계)의 本性(본성)이 아니라 그것을 配置(배치)하는 方式(방식)의 問題(문제)였다。Marx는 그들을 嘲弄(조롱)한 게 아니라、鬪爭(투쟁)이 成熟(성숙)해지는 過程(과정)을 敍述(서술)한 것이다。

이 틀이 오늘날 LLM 論爭(논쟁)에서도 有效(유효)하다고 생각한다。tante의 接近(접근)은 本質的(본질적)으로 倫理的(윤리적)이다。LLM이라는 技術(기술) 自體(자체)를 道德的(도덕적)으로 評價(평가)하고、그 評價(평가)에 따라 使用(사용) 與否(여부)를 決定(결정)한다。Doctorow의 接近(접근)도 크게 다르지 않다。다만 評價(평가)의 方向(방향)이 反對(반대)일 뿐이다。둘 다 技術(기술)을 道德(도덕)의 對象(대상)으로 놓는다。

唯物論的(유물론적) 接近(접근)은 다른 質問(질문)을 한다。이 技術(기술)이 어떤 社會的(사회적) 關係(관계) 속에 놓여 있는가。누가 所有(소유)하고、누구의 勞働(노동)으로 維持(유지)되며、그 剩餘(잉여)는 어디로 흘러가는가。그리고 그 關係(관계)를 바꿀 수 있는가。

AI 贊反(찬반)이라는 構圖(구도) 自體(자체)가 이 質問(질문)을 가린다。巨大(거대) AI 벤더들에 批判的(비판적)이면서도 LLM이라는 技術(기술)의 可能性(가능성)을 열어두는 것이 一貫性(일관성) 없어 보이는 것은、技術(기술)과 그 資本主義的(자본주의적) 適用(적용) 形態(형태)가 같은 것이라고 前提(전제)하기 때문이다。하지만 그 前提(전제)는 틀렸다。

圖書館(도서관)과 사람

LLM은 圖書館(도서관)이 아니다。圖書館(도서관)이 原本(원본)으로 사람을 連結(연결)한다면、LLM은 原本(원본) 없이 答(답)을 내놓는다는 批判(비판)은 一面(일면) 맞다。그런데 LLM은 사람에 더 가깝다고 생각한다。

Anthropic의 Nicholas Carlini는 最近(최근) Claude Opus 4.6을 利用(이용)해 Rust로 C 컴파일러를 처음부터 作成(작성)하는 實驗(실험)을 進行(진행)했다。 인터넷 接續(접속) 없이、클린 룸으로。結果(결과)는 Linux 6.9 커널을 x86、ARM、RISC-V 세 아키텍처에서 빌드하고、PostgreSQL、FFmpeg、SQLite、Redis를 컴파일하며、GCC 토처 테스트 스위트를 99% 通過(통과)하는 十萬(십만) 줄짜리 컴파일러였다。내가 알기로는 Rust로 作成(작성)된 C 컴파일러 中(중) 그에 匹敵(필적)하는 成果(성과)를 거둔 先例(선례)는 없다。누군가의 作業(작업)을 그대로 再生產(재생산)했다고 볼 수 없다。

勿論(물론) LLM이 恒常(항상) 創造的(창조적)인 것도 아니고、사람이 恒常(항상) 創造的(창조적)인 것도 아니다。이 譬喩(비유)는 LLM을 美化(미화)하기 爲(위)한 것이 아니다。LLM은 本質的(본질적)으로 再生產(재생산)만 한다는 前提(전제) 위에 세워진 批判(비판)의 根據(근거)가 흔들린다는 것이다。

모든 生成型(생성형) AI가 같지 않다는 것도 이 틀에서 더 잘 드러난다。LLM과 이미지 生成(생성) 모델의 差異(차이)는 그저 技術(기술)의 差異(차이)가 아니라、어떤 勞働(노동)을 어떤 方式(방식)으로 代替(대체)하느냐의 差異(차이)다。이미지 生成(생성) 모델이 特定(특정) 作家(작가)의 스타일로 이미지를 뽑아낼 때、그것은 原作者(원작자)의 市場(시장)을 直接(직접) 蠶食(잠식)한다。機能(기능)의 代替(대체)가 아니라 存在(존재)의 代替(대체)다。그 剩餘(잉여)가 어디로 가는지를 보면、Marx가 말한 勞働(노동)의 窮乏化(궁핍화)(Verelendung)가 이미지 生成(생성) 分野(분야)에서 더 直接的(직접적)으로 進行(진행)되고 있다。같은 잣대를 LLM에 그대로 適用(적용)할 수 있는지는 훨씬 複雜(복잡)한 質問(질문)이다。

디폴트 視點(시점)

마지막으로 個人的(개인적)인 이야기를 하나 꺼내고 싶다。

tante의 글은 웹에 올라가 있지만、主要(주요) LLM 벤더의 스크래핑을 막도록 設定(설정)되어 있는 듯하다。朝鮮語(한국어)가 母語(모어)인 내게 英語(영어)는 第二言語(제2언어)다。tante의 글처럼 論證(논증)의 뉘앙스와 暗示(암시)된 前提(전제)가 重要(중요)한 텍스트를、從來(종래)의 機械(기계) 飜譯(번역)으로는 제대로 옮기기 어렵다。LLM 程度(정도)는 되어야 論證(논증)이 살아있는 채로 傳達(전달)된다。나는 結局(결국) 글을 手動(수동)으로 複寫(복사)해서 LLM에게 넘겨 읽었다。

tante는 LLM이 著者(저자)와의 連結(연결)을 끊는다고 했다。檢索(검색) 엔진은 原本(원본)으로 사람을 案內(안내)하지만、LLM은 原本(원본)을 抽出(추출)해서 使用者(사용자)를 自身(자신)의 루프 안에 가둔다는 것이다。틀린 말은 아니다。하지만 내 經驗(경험)은 그 圖式(도식)이 누구의 視點(시점)에서 그려졌는지를 보여준다。英語(영어)가 流暢(유창)한 讀者(독자)에게 LLM은 마냥 連結(연결)을 끊기만 하는 技術(기술)일 수 있다。하지만 英語(영어)가 서툰 讀者(독자)에게 LLM은 連結(연결)을 可能(가능)하게 하는 技術(기술)이기도 하다。tante가 LLM을 막은 行爲(행위)는 그 自身(자신)의 論理(논리)로는 一貫性(일관성)이 있지만、結果的(결과적)으로는 英語(영어)가 流暢(유창)한 讀者(독자)와 그렇지 않은 讀者(독자) 사이의 非對稱(비대칭)을 強化(강화)했다。

이것이 單純(단순)한 아이러니가 아닌 이유는、이 非對稱(비대칭)이 技術(기술) 談論(담론) 全般(전반)에서 作用(작용)하기 때문이다。누구의 視點(시점)이 디폴트로 設定(설정)되어 있는가。어떤 社會的(사회적) 關係(관계) 속에서 그 디폴트가 만들어졌는가。

唯物論的(유물론적)으로 行動(행동)한다는 것은、그 디폴트를 當然(당연)하게 받아들이지 않는 것에서 始作(시작)한다。技術(기술)이 좋은가 나쁜가를 묻기 前(전)에、이 技術(기술)이 누구를 爲(위)해、누구의 勞働(노동)으로、누구의 利益(이익)을 爲(위)해 作動(작동)하는가를 묻는 것이다。그리고 그 물음이 技術(기술)을 拒否(거부)할 이유가 아니라 奪還(탈환)할 理由(이유)가 된다고 나는 如前(여전)히 생각한다。