스티븐 핑커가 말하는 글쓰기의 규칙
— LLM 시대의 비문학 작문법
하버드대 인지과학자 스티븐 핑커(Steven Pinker)는 1980년대부터 인공지능을 연구해 왔다. 그가 평생을 바쳐 분석한 ‘좋은 글’의 원리는 거대언어모델(Large Language Model, LLM) 시대에 어떻게 다시 읽혀야 하는가. 데이비드 페렐(David Perell)이 진행한 인터뷰의 핵심을 짚어 본다.
스티븐 핑커는 ‘쉬운 글’을 쓰는 학자가 아니라 ‘왜 우리는 글을 못 쓰는가’를 평생 연구해 온 사람이다. 그가 쓴 책 가운데 The Sense of Style(좋은 글쓰기의 감각)은 2014년 출간된 작문론으로, 인지과학의 발견을 글쓰기 지침으로 옮겨 놓은 보기 드문 결과물이다. 이번 인터뷰는 그 책의 핵심 원리를 다시 정리하면서, 동시에 LLM이 일상화된 2026년 시점에서 인간의 글쓰기는 무엇이 되어야 하는가를 묻는다. 핵심은 다섯 가지로 압축된다.
왜 세상에는 나쁜 글이 이토록 많은가
핑커가 이 질문을 받았을 때 사람들이 가장 즐겨 내놓는 답은 ‘악의’다. 학자들은 별 내용도 없는 평범한 발상을 일부러 난해한 용어로 포장해 자신을 대단해 보이게 하려 한다는 것이다. 핑커는 이 설명을 거부한다. 그가 인용하는 것은 핸런의 면도날(Hanlon’s razor)이다.
“어리석음으로 충분히 설명되는 일을 결코 악의로 돌리지 말라.”핸런의 면도날
핑커가 보기에 학자들 대부분은 악의로 글을 어렵게 쓰는 것이 아니다. 그들은 자신이 무엇을 안다는 사실 자체를 잊어버린다. ‘분자생물학자(molecular biologist)가 테드(TED, Technology, Entertainment, Design) 무대에 올라가 동료 학회에서 하던 그대로의 발표를 하다가 4초 만에 청중을 잃어버린’ 일화가 그 전형이다. 그는 멍청한 사람이 아니었다. 다만 ‘소통’이라는 영역에서는 멍청했다. 자신이 아는 것을 머릿속에서 빼내고 청자의 자리로 옮겨 앉는 능력이 작동하지 않았기 때문이다.
이것이 경제학자 콜린 캐머러(Colin Camerer), 조지 로웬슈타인(George Loewenstein), 마틴 베버(Martin Weber)가 1989년 『정치경제학 저널(Journal of Political Economy)』에 발표한 논문에서 명명한 지식의 저주(curse of knowledge)다. 우리는 무언가를 알고 나면, 그것을 모르는 상태가 어떤 느낌이었는지 더 이상 기억하지 못한다. 약어, 전공 은어, 추상어, 맥락 없는 일반화 — 이 모든 것은 화자에게는 가장 효율적인 표현이지만 청자에게는 그저 잡음이다.
지식의 저주를 어떻게 피할 것인가
핑커는 이 문제에서 자기 자신도 자유롭지 않다고 인정한다. 그가 쓰는 방법은 단순하다. 실제 사람에게 원고를 보여 주는 것이다. 그는 모친이 살아 계실 때 늘 책의 초고를 어머니에게 보여 주었다. 학자들이 흔히 말하는 ‘무지한 일반인의 대표로서의 어머니’라는 클리셰가 아니다. 그의 어머니는 매우 똑똑하고 박식했지만, 인지심리학자도 심리언어학자(psycholinguist)도 아니었다는 점이 핵심이다.
핑커가 강조한 통찰은 이것이다. 같은 학과의 같은 연구실에 있는 대학원생조차 다른 연구실 사람의 논문 초록을 이해하지 못한다. 다섯 명의 동료, 한 명의 지도교수, 두세 명의 박사후 연구원 — 이렇게 좁은 공동체 안에서만 통하는 은어가 빠르게 만들어지고, 그 작은 원 바깥으로 한 발만 나가면 같은 분야의 학자에게도 통하지 않는다.
핑커가 제시한 첫 번째 규칙은 명확하다. 자신의 공감 능력에 의존하지 말고, 실제 독자에게 보여 주라. 자기 분야 바깥의, 그러나 지적으로 호기심 많고 어느 정도 교육받은 사람. 그 한 명이 막힌 문장은 다른 모든 사람에게도 막힌 문장이다.
글은 시각적이어야 한다
핑커의 두 번째 규칙은 그가 평생 연구해 온 시지각(visual perception) 연구에서 곧장 흘러나온다. 인간이 세계를 다루는 방식은 압도적으로 시각에 기울어져 있다. 우리가 무엇을 ‘이해했다’고 느끼는 순간은 머릿속에 어떤 그림이 그려질 때다. 좋은 글이란 그 그림이 그려지도록 돕는 글이다.
“언어는 좀 과대평가돼 있다. 이해라는 것은 단어의 더미가 아니다. 우리가 전달하려는 생각은 그저 모음과 자음의 줄이 아니다. 그 생각은 대개 시각적이고, 운동적이며, 신체적이고, 감정적이고, 청각적이다.”스티븐 핑커
그래서 그가 권하는 도구는 두 가지다. 첫째, 예시(for example)를 끊임없이 쓰라. 둘째, 시각적 은유(visual metaphor)를 동원하라. 그는 이전 세기의 산문이 오늘날의 글보다 더 생생하게 느껴지는 이유를 흥미롭게 설명한다. 그 시절 작가들에게는 ‘공격성(aggression)’이나 ‘반사회적 행동(antisocial behavior)’ 같은 추상어가 없었다. 같은 뜻을 전하려면 “매(hawk)의 영혼이 우리 살 속에 깃들었다”라고 쓸 수밖에 없었다는 것이다.
학자에게 추상어는 좋은 도구다. ‘생태계’, ‘종’, ‘시약’, ‘장기 강화(potentiation)’ 같은 단어 하나로 두 음절 만에 거대한 지식 더미를 부를 수 있다. 학계 내부에서는 이것이 필수적이다. 문제는 그 단어가 분야 바깥으로 나가는 순간이다. 그때부터는 같은 추상어가 ‘공기 같은 자명함’을 잃고 그저 모르는 단어가 되어 버린다. 그러므로 글을 쓸 때마다 매번 자문해야 한다. 지금 내 독자는 머릿속에 어떤 그림을 그릴 수 있는가.
말은 쉬운데 왜 글은 어려운가
20개월 된 아이의 부모는 “요즘 말이 부쩍 늘었어요”라고 들떠 말한다. 그런데 8세 아이의 부모에게 “글쓰기는 어때요?”라고 물으면 “음… 천천히 가고 있어요”라는 답이 돌아온다. 똑같이 언어를 다루는 능력인데, 왜 말은 자연스럽고 글은 부자연스러운가.
핑커는 몇 가지 이유를 꼽는다. 첫째, 대화에는 공통 기반(common ground)이 있다. 같은 무대 위에 누군가가 갑자기 떨어져 대화를 시작하는 일은 없다. 두 사람은 왜 모였는지, 무엇을 이야기하는 중인지를 공유한다. ‘이것’, ‘저것’, ‘그 일’이라는 지시어가 통한다. 글을 읽는 사람은 다르다. 책장에서 책을 집어 든 그 사람은 당신을 만나 본 적이 없고, 다른 나라에 살고 있을 수도 있고, 당신이 죽은 뒤일 수도 있다. 그가 필요로 하는 모든 맥락은 종이 위에 명시적으로 적혀 있어야 한다.
둘째, 대화에는 실시간 피드백이 있다. 청자의 찌푸린 이마, 의아한 표정, “죄송한데 무슨 말씀이신지”라는 요청 — 이런 신호가 화자의 말을 즉시 교정한다. 강연자라면 누구나 청중이 들썩이기 시작하는 순간을 안다. 글에는 그것이 없다. 독자가 책을 덮어 버릴 때, 작가는 모른다.
맥락과 압축 — 예시와 일반화의 춤
핑커가 일관되게 강조하는 것은 ‘예시 없는 일반화’와 ‘일반화 없는 예시’ 모두가 쓸모없다는 점이다. 일반화는 세부를 지운다. 일반화만 있는 글은 무엇을 가리키는지 종잡을 수 없다. 반대로 예시만 늘어놓으면 “그래서 결국 뭐?”라는 질문이 남는다.
인터뷰 진행자 페렐은 이것을 ‘맥락과 압축의 트레이드오프(trade-off)’라는 말로 정리한다. 보스턴행 기차 여행을 다섯 시간 동안 시적으로 풀어내는 것은 맥락은 풍성하지만 압축이 없다. “편한 기차 여행이었다”라는 한 줄은 압축은 좋지만 맥락이 없다. 좋은 글이란 이 둘 사이의 ‘춤’이다. 예시가 맥락을 채우고, 일반화가 그것을 압축한다.
핑커가 든 자신의 예시를 그대로 옮겨 본다. ‘익숙한 단어의 뜻은 그 부분들의 문자적 의미와 같지 않을 수도 있다.’ 이 문장만으로 사람들은 “그렇겠지”라고 끄덕인다. 그러나 이렇게 덧붙이면 이해의 질이 달라진다.
예시가 일반화를 붙드는 방식
욕실(bathroom)이 꼭 욕조 있는 방을 가리키는 것은 아니다. 화장실에 가는 행위가 욕조 있는 방으로 가는 일은 더더욱 아니다. 아침 식사(breakfast)가 반드시 단식(fast)을 깬다(break)는 뜻은 아니며, 크리스마스(Christmas)도 반드시 그리스도(Christ)의 미사(mass)를 가리키지는 않는다.
리처드 레더러(Richard Lederer)의 위트 있는 문장도 같은 메시지를 던진다. ‘성인(adult)이 간통(adultery)을 저지른다면, 영아(infant)는 보병(infantry)을 일으키는가? 올리브유(olive oil)가 올리브에서 만들어진다면, 베이비 오일(baby oil)은 무엇에서 만드는가?’ 이 농담은 단순한 말장난이 아니다. 언어가 시간 위에서 어떻게 표류하는가를 보여 주는 화석이다. ‘간통’과 ‘불순물 섞기(adulterate)’는 어원적으로 같은 라틴어 adulterare에서 갈라져 나왔지만, 일상 화자에게서 그 연결은 완전히 끊겨 있다. 영어는 1,500년이 넘는 시간 동안 게르만어(Germanic), 그 이전에는 인도유럽어(Indo-European)를 거치며 무수한 규칙이 죽고 태어났다. 살아 있는 규칙도 있고, 사전을 펴야 보이는 화석도 있다.
아름다운 글을 만드는 청각적 감각
핑커가 글의 미학을 이야기할 때 동원하는 단어는 셋이다. 시각적 이미지, 음성적 울림(euphony), 그리고 운율(rhythm)이다. 그는 자신의 산문을 거의 항상 소리 내어 읽거나 적어도 입속으로 중얼거린다고 말한다. 자신이 매끄럽게 발음할 수 없다면, 독자의 머릿속에서도 매끄럽게 흘러가지 않을 가능성이 높다.
그가 의식적으로 다루는 또 다른 요소는 운율 구조다. 언어에는 메트로놈처럼 일정하지는 않아도 분명한 박자가 있다. 그 박자를 너무 어긋나게 끊으면, 종이 위 글자에 불과한 문장조차 읽기에 거슬린다. 그는 같은 의미를 가진 동의어 가운데 치찰음(sibilant)이 적게 나오는 것을 고르고, 두운(alliteration)이 가볍게 맞을 때 그것을 살린다. 너무 두드러지면 부자연스럽지만, 한 줄의 두운이 문장을 부드럽게 굴려 보낸다는 것이다.
학자들은 왜 그렇게 글을 못 쓰는가
핑커가 학계의 나쁜 글쓰기에 그토록 분노하는 이유는 단순히 미학적인 것이 아니다. 그가 꼽는 첫 번째 이유는 낭비다. 학계에는 진짜로 똑똑한 사람들과 진짜로 가치 있는 작업이 있다. 그것을 자기들끼리만 알아듣는 닫힌 원 안에 가두어 두는 일은 — 더구나 세금으로 지원받은 연구라면 — 명백한 자원의 낭비다.
두 번째는 학계 내부의 비효율이다. 학생의 논문을 읽든, 동료의 논문을 심사하든, 연구비 신청서를 평가하든, 같은 단락을 다섯 번 여섯 번 다시 읽어야 무슨 말인지 잡힌다면 — 그것도 잘못 잡을 위험을 안고 — 그 자체가 거대한 시간 손실이다. 세 번째는 잃어버린 즐거움이다. 잘 다듬어진 글을 읽는 일에는 작은 쾌락이 있다. 거꾸로 부풀고 굳은 글을 읽는 데에는 작은 짜증이 있다. 핑커는 이 두 번째 짜증이 학계에서 너무 흔하다는 점에 신경이 곤두서 있다.
그가 특히 분노하는 대상은 언어학자(linguist)와 심리언어학자다. 무엇이 문장을 어렵게 만드는가를 연구하는 학문이 어쩌면 그 자체로 어려운 문장의 모범 답안을 생산하고 있다는 역설이다.
“당신이 연구하는 것이 무엇이 문장을 어렵게 만드는가라면, 자기 연구에 주의를 기울여서 자기 문장을 덜 어렵게 만들어 보면 어떨까.”스티븐 핑커
아이들의 설명이 가르쳐 주는 것
핑커가 자신의 손자에게서 들었다는 한 문장이 인터뷰에 등장한다. “구름은 수증기예요. 연기는 불의 수증기고요.” 이것은 시(詩)다. 새로운 짝짓기이고, 신선함이다. 아이들의 설명에는 진부한 표현이 없다. 수십 년 동안 학문이 쌓아 둔 추상어 더미를 그들은 가지고 있지 않다. 그래서 ‘볼 수 있고 다른 사람도 볼 수 있는 것’에 호소할 수밖에 없다.
핑커가 ‘예전 작가들이 더 생생했던 이유’로 든 그 메커니즘이 아이들에게서도 똑같이 작동한다. 추상어를 쓸 수 없으니 시각적 은유를 찾아야 하고, 결과적으로 새로운 표현이 태어난다. 좋은 작가가 되고 싶다면, 아이가 세계를 처음 보았을 때의 감각을 잊지 말아야 한다는 뜻이다.
간결함이 위트의 영혼인 이유
인터뷰의 한 단락에서 페렐과 핑커는 셰익스피어의 한 문장 위에 머무른다.
핑커는 이 문장이 ‘자기 자신의 예시’라는 점을 짚는다. 풀어 쓰면 ‘간결함은 위트의 본질이다’, ‘간결함은 위트에 중요하다’가 된다. 그러나 셰익스피어는 한 음절 단어 soul(영혼)을 골랐다. 의미는 더 깊어지면서, 길이는 더 짧아진다. 그 단어 하나에 멈춰 잠시 생각하게 만든다.
같은 메시지는 한 세기 뒤 코넬대(Cornell)의 윌리엄 스트렁크(William Strunk Jr.)에게서 다시 나타난다. 그의 강의를 받아 적어 책으로 옮긴 사람이 작가 E. B. 화이트(E. B. White)다. 두 사람의 이름이 붙은 작은 문장론 The Elements of Style(문체의 요소)에서 가장 자주 인용되는 한 줄은 이렇다.
“불필요한 단어를 빼라(Omit needless words).”윌리엄 스트렁크 주니어 · E. B. 화이트, The Elements of Style
이 문장 역시 자기 자신의 예시다. 그 안에 단 하나의 불필요한 단어도 없다. 핑커는 신문이나 잡지에 글을 기고할 때마다 이 원칙의 위력을 새삼 확인한다고 말한다. 800단어 제한이 걸린다. 자신이 보기에는 ‘완벽하게 800자에 맞췄다’ 싶은 문장이 결국 870단어다. 70단어를 다시 빼야 한다. 그러면 신기한 일이 일어난다. 다듬을수록 글의 품질이 올라간다. 같은 메시지가 더 적은 단어로 전달되니 독자의 인지 부담이 줄어들고, 동시에 영어 운율의 음악성도 더 살아난다.
이 원리는 코미디에도 똑같이 적용된다고 핑커는 덧붙인다. 코미디언들이 농담을 다듬어 가는 과정은 곧 ‘짧게 하는’ 과정이다. 길게 늘어진 농담은 자기 펀치 라인을 자기가 밟아 버린다. 짧을수록 농밀하고 농밀할수록 웃기다. ‘간결함이 위트의 영혼’이라는 명제는 글의 미학이자 동시에 인지 비용의 경제학이다.
LLM이 쓰는 글은 왜 무미건조한가
인터뷰의 후반부에서 페렐은 가장 흥미로운 질문을 던진다. 거대언어모델이 일상화된 시대에 ‘좋은 글’의 정의는 어떻게 바뀌어야 하는가. 핑커의 답은 양면적이다.
한편으로 LLM의 출력은 ‘잘 쓰인 글’이다. 학회지 은어가 거의 없고, 문장 구조가 평이하고, 논리 전개가 순서대로 이어진다. 도입 문장과 결론 문장이 자리에 있다. 이 점에서 LLM은 대다수 학자, 변호사, 관료보다 더 깔끔한 산문을 생산한다. 그러나 동시에 그 글은 너무도 일반적이고 평범해서, 글쓴이가 LLM이라는 사실을 거의 즉각적으로 알아챌 수 있을 만큼 무미건조하다.
핑커는 이 ‘안전한 평균성’의 원인으로 두 가지 가설을 제시한다. 첫째는 인간의 강화 학습(reinforcement learning from human feedback, RLHF) — 즉 모델이 사람의 피드백을 받아 다섯 단락짜리 표준 에세이 형식으로 다듬어졌기 때문이라는 설명이다. 둘째는 더 흥미로운 가설이다. 시각적 아름다움에서 ‘평균 얼굴’이 가장 매력적이라는 현상이 산문에도 적용되었을 가능성이다. 수백 명의 얼굴을 합성하면 그 결과는 합성에 쓰인 어떤 개별 얼굴보다 더 잘생긴 얼굴이 된다. 모든 비대칭이 상쇄되어 사라지기 때문이다. 산문에서도 비슷한 일이 일어났다면, 결과는 ‘아름답지는 않지만 명료한’ 평균치 문장이 된다.
여기서 핑커가 ‘예전 시대의 산문이 왜 더 생생했는가’를 다시 끌어 온다. 100년 전, 200년 전의 작가들은 아직 산처럼 쌓이지 않은 추상어와 클리셰의 산기슭에서 글을 썼다. 같은 개념을 가리키기 위해 그들은 시각적 이미지를 끌어와야 했다. 록펠러(John D. Rockefeller)도 에디슨(Thomas Edison)도 다윈(Charles Darwin)도 직업 작가가 아니었지만 천사처럼 글을 썼다. 그들이 특별히 천재여서가 아니라, 클리셰를 거저 가져다 쓸 수가 없었기 때문이다.
지난 한 세기는 비형식화(informalization)의 시대였다. 남자들은 모자를 벗었고, 여자들은 장갑을 벗었다. 모든 사람이 이름으로 서로를 부르게 되었다. 격식이 사라지고 즉흥성과 진정성이 가치가 되었다. 그래서 ‘공들여 다듬은 산문’은 점차 거드름이나 허세로 읽히게 됐다. 이 흐름의 마지막 자락에 LLM이 도착했다. 클리셰의 무한한 저장고에서, 가장 평균적인 표현을 가장 매끄럽게 골라 내는 기계. 이것이 LLM이 ‘무미건조하다’고 느껴지는 이유의 깊은 부분이다.
만약 핑커가 자신의 책을 다시 쓴다면
인터뷰의 마지막 질문은 이것이다. 1980년대부터 인공지능을 연구해 온 학자가, LLM이 이만큼 발전한 2026년의 시점에서 자신의 책들을 다시 쓴다면 무엇이 달라지는가. 핑커는 머뭇거리지 않고 답한다.
“아마 그 책들을 그대로 쓰지는 않을 것이다. 충분히 많은 입력에서 패턴을 추출하는 능력에 더 무게를 두어야 했다.”스티븐 핑커
그가 훈련받은 전통은 노엄 촘스키(Noam Chomsky)의 생성 언어학, 고전 인공지능, 계산주의 인지과학이었다. 그 세계관에서 지능은 규칙, 알고리즘, 논리적 프로그램이었다. 단순히 거대한 비정형 텍스트를 신경망에 부어 넣어 분별 있는 산문이 흘러나오게 만든다는 발상은 ‘있을 법하지 않은’ 일이었다.
그렇다고 핑커가 ‘인간의 마음은 LLM과 같다’고 결론짓는 것은 아니다. 그는 두 가지 결정적인 차이를 짚는다. 첫째, 아이는 LLM이 학습하는 양의 텍스트를 받기 전에 이미 모국어를 유창하게 구사한다. 만약 인간의 마음이 LLM이라면 아이가 첫 문장을 말하기까지 3만 년이 걸렸어야 한다. 둘째, 아이는 텍스트만 받지 않는다. 아이는 세계 속에 있고, 누가 무엇을 말하려 하는지 추측할 수 있고, 행동의 결과로 세계를 다시 읽는다. LLM의 학습 방식과는 종류가 다르다.
그럼에도 핑커는 인정한다. 만일 자신의 책을 다시 쓴다면, ‘방대한 입력에서 패턴을 추출해 내는 능력’에 더 비중을 둘 것이라고. 인간 지능과 LLM 지능을 더 진지하게 화해시켰을 것이라고. 1980년대의 그가 ‘인공지능이 시(詩)를 쓰는 미래’를 상상하기 어려웠던 만큼, 2026년의 그도 그 미래를 절반쯤만 이해하고 있는 셈이다.
맺음 — LLM 시대에 인간이 써야 할 글
인터뷰를 다시 한 줄로 압축한다면 이렇다. LLM은 ‘평균의 합성’을 잘한다. 인간이 할 수 있는 일은 평균에서 벗어나는 일이다. 그 벗어남은 화려한 기교가 아니라 다섯 가지 매우 오래된 원칙에서 나온다.
- 독자가 무엇을 모르는지 상상하라. 그리고 실제 사람에게 보여 주어 그 상상의 빈틈을 메워라.
- 추상어를 시각적 이미지로 번역하라. 독자의 머릿속에 그림이 그려지는가를 매 문장 자문하라.
- 일반화는 예시로 붙들고, 예시는 일반화로 묶어라. 둘 중 하나가 빠지면 글은 공중에 떠 있거나 바닥을 굴러다닌다.
- 소리 내어 읽어라. 입이 막히는 곳은 독자의 머릿속에서도 막힌다.
- 불필요한 단어를 빼라. 짧을수록 더 많이 전달된다.
이 다섯 가지를 따라가 보면 한 가지 사실이 드러난다. 이 원칙들은 LLM이 가장 흉내 내기 어려운 영역이다. LLM은 평균을 잘 합성하지만, 특정한 독자 한 명을 떠올리지는 못한다. 클리셰의 가장 매끄러운 조합을 잘 만들지만, 처음 본 산을 처음 본 사람의 말로 그려 내지는 못한다. 두 번째 음절에서 박자를 흐트러뜨리지 않지만, ‘soul’ 같은 한 단어 위에 독자를 잠시 멈춰 세우는 일은 하지 못한다. 핑커가 인터뷰의 마지막에 ‘인간의 마음은 LLM이 아니다’라고 단언한 이유는 거기에 있다. 인간이 쓸 수 있고 써야 하는 글은, 합성된 평균이 아니라 한 사람의 시선이 통과한 글이다.