불완전한 세상에서 유물론적으로 행동하기: 생산 수단으로서의 LLM과 사회적 관계

이 글은 지난 달에 쓴 F/OSS 史唯: 우리는 LLM을 거부할 게 아니라 되찾아 와야 한다의 후속이다.


Cory Doctorow가 Pluralistic 6주년 기념 글에서 자신의 작업 흐름을 공개했다. 그는 매일 발행하는 기사를 올리기 전에, Ollama라는 오픈 소스 LLM을 오탈자 교열 용도로 돌린다고 밝혔다. 예상할 수 있었던 반응이 따라왔다. 그리고 독일의 기술 비평가 tante는 이틀 뒤 불완전한 세상에서 윤리적으로 행동하기(Acting ethically in an imperfect world)라는 글로 응답했다.

tante의 제목을 빌려오는 것이 이 글의 시작으로 어울린다고 봤다. 불완전한 세상에서 윤리적으로 행동한다는 것이 그의 물음이라면, 나는 같은 물음에 다른 틀로 답하고 싶다. 윤리가 아니라 유물론으로.

이전 글에서 나는 라이선싱을 탈환의 수단으로 너무 전면에 내세웠다. 나이브하다는 비판을 받았고, 그 비판에 어느 정도 수긍도 한다. 다만 내가 말하고 싶었던 것은 탈환이라는 방향이었지, 탈환의 처방이 아니었다. 이 글에서는 그 방향을 좀 더 정확하게 다듬어 보고자 한다.

두 개의 허수아비

tante의 글에는 타당한 지적들이 있다. Doctorow는 LLM 비판자들을 기술의 창시자가 나쁜 사람이어서 쓰면 안 된다는 순수주의자들로 그렸는데, 이건 허수아비다. 실제 비판은 전혀 다른 데에 있다. 막대한 전력과 물 소비, 동의 없는 데이터 수집, 글로벌 사우스에서 이루어지는 착취적 레이블링 노동, 오픈 소스 생태계를 포함한 지식 공유재에 가해지는 피해… Doctorow는 이 비판들을 Sam Altman이 마음에 안 든다는 감정적 반응으로 환원해버렸고, tante는 그 환원이 잘못됐다고 지적한다. 맞는 말이다.

Bluesky 지적도 유효하다. Doctorow는 중앙 집권화에 대한 이념적 이유로 Bluesky 가입을 거부했다. 그는 자신의 가치에 근거해서 기술을 거부하는 것이 가능하다고 믿고 실천한다. 그런데 타인이 LLM을 같은 방식으로 거부하면 순수주의라고 부른다. 이러한 이중 잣대도 tante가 정확히 짚었다.

그런데 tante도 같은 함정에 빠진다.

그는 탈환이라는 방향을 비판하면서, 탈환의 수단을 사실상 하나로 한정한다. GPT에 준하는 프런티어 모델을 처음부터 다시 만드는 것. 수십억 불이 필요하고, 그 과정에서 동일한 환경적 비용이 발생하므로, 탈환은 현실적이지 않다는 것이다. 하지만 Doctorow가 LLM 비판을 단순화했던 것처럼, tante도 탈환의 경로를 단순화했다. 라이선스를 통한 법적 저항이 있다. 규제를 통해 국가로 하여금 사유 모델의 공개를 강제할 수 있을 지도 모른다. 공공 기반 모델을 공동으로 구축하는 방향도 있다. 어떤 수단이 실제로 작동할지는 정치적·사회적 조건에 달려 있고, 아직은 열려 있다. 내가 이전 글에서 라이선싱을 언급한 것은 그 중 가장 먼저 떠오른 하나였을 뿐이다.

기계와 그 자본주의적 적용 형태

Marx는 자본론 제 1권에서 영국의 러다이트 운동을 이렇게 평했다.

노동자들이 기계 자체와 기계의 자본주의적 적용을 구분하고, 따라서 물질적 생산 수단 그 자체가 아니라 그것의 사회적 착취 형태를 공격하는 법을 배우기까지는 시간과 경험이 필요했다.

방직기를 부순 노동자들의 분노는 정당했다. 방향이 잘못됐을 뿐이다. 문제는 기계가 아니라 기계를 둘러싼 자본주의적 사회 관계였다. 기계가 노동 시간을 단축시키기는 커녕 연장시키고, 노동자를 해방시키는 대신 기계의 부품으로 만드는 것은 기계의 본성이 아니라 그것을 배치하는 방식의 문제였다. Marx는 그들을 조롱한 게 아니라, 투쟁이 성숙해지는 과정을 서술한 것이다.

이 틀이 오늘날 LLM 논쟁에서도 유효하다고 생각한다. tante의 접근은 본질적으로 윤리적이다. LLM이라는 기술 자체를 도덕적으로 평가하고, 그 평가에 따라 사용 여부를 결정한다. Doctorow의 접근도 크게 다르지 않다. 다만 평가의 방향이 반대일 뿐이다. 둘 다 기술을 도덕의 대상으로 놓는다.

유물론적 접근은 다른 질문을 한다. 이 기술이 어떤 사회적 관계 속에 놓여 있는가. 누가 소유하고, 누구의 노동으로 유지되며, 그 잉여는 어디로 흘러가는가. 그리고 그 관계를 바꿀 수 있는가.

AI 찬반이라는 구도 자체가 이 질문을 가린다. 거대 AI 벤더들에 비판적이면서도 LLM이라는 기술의 가능성을 열어두는 것이 일관성 없어 보이는 것은, 기술과 그 자본주의적 적용 형태가 같은 것이라고 전제하기 때문이다. 하지만 그 전제는 틀렸다.

도서관과 사람

LLM은 도서관이 아니다. 도서관이 원본으로 사람을 연결한다면, LLM은 원본 없이 답을 내놓는다는 비판은 일면 맞다. 그런데 LLM은 사람에 더 가깝다고 생각한다.

인간도 평생에 걸쳐 방대한 양의 텍스트와 코드와 이미지를 흡수한다. 저작권자에게 일일이 허락을 받지 않는다. 그것을 자신의 것으로 녹여내고, 때로는 그냥 짜집기에 불과한 것을 내놓고, 때로는 아무도 생각하지 못했던 연결을 만들어낸다.

Anthropic의 Nicholas Carlini는 최근 Claude Opus 4.6을 이용해 Rust로 C 컴파일러를 처음부터 작성하는 실험을 진행했다. 인터넷 접속 없이, 클린 룸으로. 결과는 Linux 6.9 커널을 x86, ARM, RISC-V 세 아키텍처에서 빌드하고, PostgreSQL, FFmpeg, SQLite, Redis를 컴파일하며, GCC 토처 테스트 스위트를 99% 통과하는 십만 줄짜리 컴파일러였다. 내가 알기로는 Rust로 작성된 C 컴파일러 중 그에 필적하는 성과를 거둔 선례는 없다. 누군가의 작업을 그대로 재생산했다고 볼 수 없다.

물론 LLM이 항상 창조적인 것도 아니고, 사람이 항상 창조적인 것도 아니다. 이 비유는 LLM을 미화하기 위한 것이 아니다. LLM은 본질적으로 재생산만 한다는 전제 위에 세워진 비판의 근거가 흔들린다는 것이다.

모든 생성형 AI가 같지 않다는 것도 이 틀에서 더 잘 드러난다. LLM과 이미지 생성 모델의 차이는 그저 기술의 차이가 아니라, 어떤 노동을 어떤 방식으로 대체하느냐의 차이다. 이미지 생성 모델이 특정 작가의 스타일로 이미지를 뽑아낼 때, 그것은 원작자의 시장을 직접 잠식한다. 기능의 대체가 아니라 존재의 대체다. 그 잉여가 어디로 가는지를 보면, Marx가 말한 노동의 궁핍화(Verelendung)가 이미지 생성 분야에서 더 직접적으로 진행되고 있다. 같은 잣대를 LLM에 그대로 적용할 수 있는지는 훨씬 복잡한 질문이다.

디폴트 시점

마지막으로 개인적인 이야기를 하나 꺼내고 싶다.

tante의 글은 웹에 올라가 있지만, 주요 LLM 벤더의 스크래핑을 막도록 설정되어 있는 듯하다. 한국어가 모어인 내게 영어는 제2언어다. tante의 글처럼 논증의 뉘앙스와 암시된 전제가 중요한 텍스트를, 종래의 기계 번역으로는 제대로 옮기기 어렵다. LLM 정도는 되어야 논증이 살아있는 채로 전달된다. 나는 결국 글을 수동으로 복사해서 LLM에게 넘겨 읽었다.

tante는 LLM이 저자와의 연결을 끊는다고 했다. 검색 엔진은 원본으로 사람을 안내하지만, LLM은 원본을 추출해서 사용자를 자신의 루프 안에 가둔다는 것이다. 틀린 말은 아니다. 하지만 내 경험은 그 도식이 누구의 시점에서 그려졌는지를 보여준다. 영어가 유창한 독자에게 LLM은 마냥 연결을 끊기만 하는 기술일 수 있다. 하지만 영어가 서툰 독자에게 LLM은 연결을 가능하게 하는 기술이기도 하다. tante가 LLM을 막은 행위는 그 자신의 논리로는 일관성이 있지만, 결과적으로는 영어가 유창한 독자와 그렇지 않은 독자 사이의 비대칭을 강화했다.

이것이 단순한 아이러니가 아닌 이유는, 이 비대칭이 기술 담론 전반에서 작용하기 때문이다. 누구의 시점이 디폴트로 설정되어 있는가. 어떤 사회적 관계 속에서 그 디폴트가 만들어졌는가.

유물론적으로 행동한다는 것은, 그 디폴트를 당연하게 받아들이지 않는 것에서 시작한다. 기술이 좋은가 나쁜가를 묻기 전에, 이 기술이 누구를 위해, 누구의 노동으로, 누구의 이익을 위해 작동하는가를 묻는 것이다. 그리고 그 물음이 기술을 거부할 이유가 아니라 탈환할 이유가 된다고 나는 여전히 생각한다.