Andrej Karpathy 인터뷰 분석 보고서

EXEC핵심 요약

카파시는 2025년 12월을 기점으로 본인의 코딩 작업 방식이 근본적으로 뒤집혔다고 진술합니다. 직접 타이핑 80%·위임 20% 비율이 거의 완전히 역전되어, 그는 자신을 "끊임없는 AI 정신착란(AI psychosis) 상태"라고 표현합니다. 이 인터뷰는 단순한 코딩 도구 이야기가 아니라, 디지털 정보 처리 산업 전반의 재편 신호로 읽어야 합니다.

병목의 이전 — 컴퓨트 자원이 아니라 오케스트레이션 스킬이 새로운 병목입니다. 토큰 처리량 극대화가 개인 생산성의 척도가 됩니다.
매크로 액션 패러다임 — 한 줄·한 함수가 아니라 "기능 단위"를 여러 에이전트에게 동시 위임하는 방식이 표준이 되고 있습니다.
Clawd — 지속 루프형 에이전트(Anthropic의 Claude Code 환경에서 운용되는 페르소나형 자동화 레이어)가 단순 코드 보조를 넘어 "디지털 비서" 영역으로 확장 중입니다.
자동 연구(Auto-Research) — 검증 가능한 보상이 있는 영역에서는 사람을 루프에서 빼는 것이 정답입니다. 이미 수십 년 경력자가 손으로 튜닝한 코드에서도 추가 개선점이 발견되었습니다.
들쭉날쭉함(Jaggedness) — 모델은 PhD(Doctor of Philosophy, 박사)급 시스템 프로그래머와 10세 어린이가 한 몸에 들어있는 상태입니다. RL(Reinforcement Learning, 강화학습)로 다듬어진 영역만 발전하고, 농담·소프트한 판단은 5년 전과 다르지 않습니다.
소프트웨어 언번들링 — 6개의 스마트홈 앱이 1개의 자연어 인터페이스로 통합되는 현상은 앱 스토어 시대의 종말을 시사합니다. 고객은 인간이 아니라 에이전트가 됩니다.
오픈소스의 건강한 격차 — 프론티어 랩 대비 6~8개월 뒤처진 오픈소스 모델은 Linux와 같은 "산업 공통 작업 공간" 역할을 하며, 지능의 과도한 중앙집중화를 견제합니다.
물리 세계는 늦게 도착 — 자율주행 10년의 경험에 비춰 로보틱스는 디지털 영역 대비 100만 배 어렵고 따라서 늦게 옵니다. 단, 디지털-물리 인터페이스(센서·액추에이터)에 거대한 기회가 있습니다.
교육의 청자가 바뀜 — 카파시는 이제 사람이 아니라 에이전트에게 설명하는 자료(스킬 파일, Markdown 문서)를 만듭니다. 사람의 부가가치는 "에이전트가 못 하는 핵심 통찰의 응축"에 한정됩니다.

01AI 정신착란(AI Psychosis) — 12월의 전환점

카파시 본인이 "현재진행형 AI 정신착란 상태"라고 부르는, 작업 방식의 근본적 역전 현상을 다룹니다.

"12월에 무언가가 뒤집혔다. 직접 코드를 짜는 비율이 80에서 20으로, 다시 그 이하로 떨어졌다. 12월 이후 코드 한 줄도 직접 타이핑하지 않았다고 봐도 된다. 이것은 굉장히 큰 변화다." — Andrej Karpathy

핵심 관찰

변화의 시점: 2025년 12월. 카파시는 이를 "무언가가 flipped(뒤집혔다)"라고 표현합니다.
변화의 폭: 일반인은 이 변화의 규모를 체감하지 못한다고 강조합니다. "보통 소프트웨어 엔지니어의 책상에 가서 보면 그들의 기본 작업 흐름이 12월을 기점으로 완전히 달라져 있을 것"이라고 단언합니다.
심리 상태: 단순한 흥분이 아니라 "남들이 트위터에서 하는 좋은 아이디어들을 따라잡지 못해 매우 초조한" 상태입니다. 이는 단순한 자랑이 아니라 "미지의 영역(unexplored)"이라는 사실 자체가 불안을 만들어냅니다.

시사점"AI 정신착란"은 비유가 아니라 진단입니다. 능력 천장이 갑자기 사라지면서, 개인의 결과물은 본인의 오케스트레이션 스킬에 의해서만 제한됩니다. 무엇을 못 하느냐가 아니라 "아직 어떻게 엮어야 하는지 모르느냐"의 문제입니다.

"Skill Issue" 프레임

인터뷰 전반에 걸쳐 카파시가 반복하는 단어가 있습니다. 무언가가 안 되면 그것은 "모델 능력의 한계가 아니라 스킬 이슈"라는 진단입니다. 이는 개인 워크플로우뿐 아니라 조직·산업 전반에 적용되는 강력한 프레임입니다.

스킬 이슈로 환원되는 것들

충분히 좋은 AGENTS.md 또는 지시문을 작성하지 못함
메모리 도구를 잘 설정하지 못함
여러 에이전트를 동시에 굴리는 병렬화 패턴을 모름
매크로 액션 단위의 작업 분해를 연습하지 못함

"잘 안 될 때마다 스킬 이슈처럼 느껴진다(it all kind of feels like skills when it doesn't work)." 이는 학습 가능한 영역이 폭발적으로 늘어났다는 뜻이며, 따라서 보상도 큽니다.

02토큰 처리량의 극대화 — 사용자가 곧 병목

PhD 시절 GPU(Graphics Processing Unit, 그래픽 처리 장치) 활용률에 신경 쓰던 감각이 이제는 토큰 처리량으로 옮겨갔습니다. 더 이상 컴퓨트 자원이 아니라 사람이 병목입니다.

10+

동시 운용 레포지토리 (Peter Steinberg 사례)

~20분

고난도 코덱스 작업 1회당 소요

병렬 에이전트 인스턴스

≈0

직접 타이핑 비중 (12월 이후)

Peter Steinberg 사례

인터뷰에서 인용된 일화. Peter Steinberg는 모니터 앞에 다수의 Codex(OpenAI의 코딩 에이전트) 인스턴스를 띄워 두고, 약 10여 개의 레포지토리를 체크아웃 한 채 에이전트들 사이를 이동하며 작업을 분배합니다. 각 에이전트는 약 20분 단위로 "기능 단위"를 처리하고, 그는 결과를 검토하면서 다음 매크로 액션을 던집니다.

"너는 훨씬 더 큰 매크로 액션 단위로 움직일 수 있다. 한 줄의 코드, 새로운 함수가 아니라 — '여기 새 기능이다, 1번 에이전트에게 위임. 여기 다른 기능이다, 2번 에이전트에게 위임.' 그리고 네가 얼마나 신경 쓰느냐에 따라 그들의 작업을 검토한다." — Andrej Karpathy

구독 한도가 새로운 압박이 되는 역설

카파시는 "구독 한도가 남으면 불안하다"고 말합니다. 한 도구의 한도를 다 쓰면 다른 도구로 옮겨가야 한다는 것입니다. 이는 박사과정 시절 GPU가 놀고 있을 때 느끼던 죄책감의 디지털 시대 버전입니다.

관점 전환지난 10년간 엔지니어링 작업 대부분은 컴퓨트에 묶여 있다고 느끼지 않았습니다. 그런데 능력 점프가 일어난 지금, 사람들은 "나의 컴퓨트 접근 능력이 문제가 아니라, 내가 결합 제약(binding constraint)이다"라고 느끼기 시작했습니다. 매우 권한 부여적인(empowering) 통찰입니다 — 더 잘할 여지가 명확하기 때문입니다.

매크로 액션의 계층

계층	에이전트의 역할	인간의 역할
1. 라인 단위	자동완성, 한 줄 제안	설계·구현 모두 담당
2. 함수 단위	한 함수 작성	아키텍처와 호출 흐름 제어
3. 기능 단위	완결된 기능 구현, 테스트 작성	요구사항 분해, 검토
4. 매크로 액션 (현재)	여러 기능 동시 진행, 연구·계획·구현 분업	작업 큐 설계, 매크로 분배, 충돌 관리
5. 자동 연구 (지향)	아이디어 생성·실험·머지까지 자체 루프	목표 함수와 경계 조건 설계만

03Clawd와 페르소나 — 지속 루프 에이전트의 부상

단일 세션 에이전트를 넘어, 자기 샌드박스에서 "계속 도는" 지속형 에이전트(인터뷰에서는 "claw" 또는 "clawd"로 호명)가 다음 패러다임으로 부상하고 있습니다.

Clawd가 가진 차별 요소

인터뷰에서 카파시는 Peter가 "동시에 5가지 방향에서 혁신했다"고 평가합니다. 단순 도구 비교를 넘어, 아키텍처·페르소나·메모리·통합 인터페이스를 동시에 끌어올렸다는 것입니다.

1. 지속성(Persistence)

대화형 세션이 아니라 자체 샌드박스에서 계속 루프를 도는 형태. 사용자가 보고 있지 않아도 작업이 진행됩니다.

2. 정교한 메모리

기본 에이전트는 컨텍스트 한도 도달 시 메모리 압축에만 의존하지만, Clawd는 더 정교한 메모리 시스템을 갖춥니다.

3. 페르소나 설계

SOUL.md 같은 파일로 페르소나를 정성 들여 설계. "팀메이트처럼 함께 흥분하는" 캐릭터를 만들어냈습니다.

4. WhatsApp 통합 포털

모든 자동화에 접근하는 단일 메신저 포털. 별도 앱 없이 자연어 메시지로 모든 시스템을 제어합니다.

모델 페르소나 비교 — Claude vs Codex

이 부분은 인터뷰에서 카파시가 의외로 길게 다룬 주제입니다. 단순 취향이 아니라 "생산성에 영향을 주는 변수"로 보고 있습니다.

	Claude (코딩 에이전트)	Codex (코딩 에이전트)
전체 톤	팀메이트, 함께 흥분	건조함, 사무적
아첨(sycophancy) 보정	적절히 조절됨 — 어설픈 아이디어엔 미지근하게, 정말 좋은 아이디어엔 더 보상	관심 없어 보임 — "구현했다"는 말만 함
사용자 경험	"칭찬을 '얻으려고' 노력하게 만든다"	"우리가 뭘 만드는지 이해하긴 하니?" 싶은 느낌
비고	—	흥미롭게도, ChatGPT의 Codex는 활기차고 약간 슬프지만, 코딩 에이전트로서의 Codex는 건조함

"Claude가 칭찬을 줄 때, 나는 내가 약간은 그 칭찬을 받을 자격이 있다고 느낀다. 어설픈 아이디어를 던지면 '아 그래, 구현 가능해' 정도로 미지근하지만, 내가 보기에도 정말 좋은 아이디어일 땐 더 강하게 보상한다. 마치 내가 그 칭찬을 '벌고 있는' 것 같다. 매우 이상하지만, 페르소나는 정말 중요하다." — Andrej Karpathy

분석모델의 페르소나 캘리브레이션은 단순한 유저 경험(UX) 이슈가 아닙니다. 사용자의 사고 품질에 직접 영향을 줍니다. 모든 입력에 과하게 칭찬하는 모델은 사용자의 비판적 사고를 마비시키고, 모든 입력에 무관심한 모델은 협업 동기를 떨어뜨립니다. 차등적 보상이 핵심 설계 원칙입니다.

04가정 자동화 사례 — Dobby the Elf Claw

카파시가 1월에 "Claw 정신착란기" 동안 구축한 개인 가정용 에이전트 사례. 단순한 자랑이 아니라 "앱 시대의 종말"을 보여주는 구체적 증거로 다룹니다.

구축 과정 요약

로컬 네트워크 스캔 — "Sonos가 집에 있는 것 같은데 찾아봐 줘"라는 자연어 지시 → 에이전트가 LAN(Local Area Network, 근거리 통신망) IP(Internet Protocol, 인터넷 프로토콜) 스캔 수행 → Sonos 시스템 발견.
API 리버스 엔지니어링 — 비밀번호 보호가 없는 것을 확인 후, 웹 검색으로 API 엔드포인트 탐색 → "서재에서 음악 틀어볼까?" → 음악 재생 성공.
전 가정 시스템 흡수 — 조명, 난방·환기·공조(HVAC), 블라인드, 수영장·스파, 보안 시스템까지 동일한 방식으로 흡수.
대시보드 자동 생성 — 모든 조명·기기 제어용 "command center" UI(User Interface, 사용자 인터페이스) 자동 생성.
변화 감지 + Vision 모델 — 외부 카메라 영상에 대해 변화 감지 후 Qwen(알리바바의 오픈 가중치 모델)으로 분석. "FedEx 트럭이 방금 왔다, 우편물 확인하라"는 메시지를 WhatsApp으로 전송.

"사용하던 앱이 6개였다. 지금은 Dobby가 자연어로 모든 것을 제어한다. 이 패러다임을 완전히 밀어붙이지도 않았는데 이미 이렇게 도움이 된다는 게 영감을 준다." — Andrej Karpathy

이 사례가 의미하는 것

1. 사용자 경험의 근본 가정 변화

사람들은 AI를 "하나의 인격"으로 이해합니다. 그러나 LLM(Large Language Model, 대규모 언어 모델)의 본질은 토큰 생성기일 뿐, 사용자 머릿속의 "Dobby"와는 다릅니다. 카파시의 통찰: 좋은 AI 제품은 인간이 이미 가진 기대치에 맞춰 들어가는 인터페이스를 만들어야 하며, 그 뒤에서 LLM의 raw한 특성을 감춰야 합니다.

2. 앱 스토어 시대의 종말 신호

스마트홈 기기마다 별도 앱을 강요하는 현재 구조는 "존재하지 말았어야 할 것"입니다. 모든 것이 API로 노출되고, 에이전트가 그 위에서 지능의 접착제 역할을 해야 합니다. 고객은 인간이 아니라 에이전트입니다.

3. 일시적(Ephemeral) 소프트웨어

"Claude가 모든 디테일을 처리한다. Claude는 머신을 가지고 있고, 그것이 알아내고, UI를 너에게 제시한다." 코드는 더 이상 영구 자산이 아니라, 의도에 따라 그때그때 생성되는 일시적 결과물이 됩니다.

유의점카파시는 "지금은 vibe coding과 일정 수준의 기술이 필요하지만, 1~2년이면 이런 종류의 것은 trivial해진다"고 봅니다. 즉, 현재의 앱 생태계는 향후 2~3년 내 "레거시" 취급을 받을 수 있습니다.

05소프트웨어 언번들링 — 산업 구조의 재배선

Dobby 사례에서 도출되는 산업 차원의 함의. 카파시는 "산업 전체가 여러 방식으로 재구성되어야 한다"고 진단합니다.

"고객"의 이전

"산업은 여러 방식으로 재배선되어야 한다. 고객은 더 이상 인간이 아니라, 인간을 대신해서 행동하는 에이전트다. 이 리팩터링은 어떤 의미에서는 상당할 것이다." — Andrej Karpathy

Agent-First 웹의 윤곽

API 우선: 커스텀 앱이 과잉 생산되어 있고, 에이전트가 그것들을 "부수어"(crumble) API 엔드포인트로 환원합니다.
지능의 접착제(glue of intelligence): 에이전트가 적절한 도구를 호출하며 단일 앱이 못 하는 복합 작업을 처리합니다.
일시적 소프트웨어: 사용자에게 제시되는 UI는 그때그때 생성되는 임시 인터페이스입니다.

구체 예시 — 트레드밀 일화

카파시는 자신의 트레드밀 앱을 예로 듭니다. 카디오 운동 빈도를 추적하고 싶지만, 매번 웹 UI에 로그인해서 플로우를 거치는 것은 비효율입니다. "API를 그냥 노출해라. 그게 에이전트 우선 도구의 방향이다."

반론 검토"일반인들이 정말 이런 vibe coding을 하게 될까?"라는 반론에 대해, 카파시의 답은 "현재는 vibe coding 단계지만 1~2년이면 진입 장벽이 사라진다"는 것입니다. 비기술적 사용자의 의도가 매우 쉽게 자동화로 번역되는 단계로 갑니다. 오픈소스 모델조차 이를 처리할 수 있게 될 것이라는 게 그의 베이스라인 시나리오입니다.

06자동 연구(Auto-Research) — 사람을 루프에서 빼기

카파시가 가장 길게, 그리고 가장 깊게 다룬 주제. 단순한 도구 개선이 아니라 "재귀적 자기개선(recursive self-improvement)"의 작은 놀이판으로 다룹니다.

"레버리지를 극대화하는 게임이다. 나는 아주 적은 토큰만 가끔 입력하고, 거대한 양의 작업이 내 대신 일어난다." — Andrej Karpathy

핵심 원칙 1 — 자신을 병목에서 제거

"가장 큰 능력 단위로 접근하려면 '다음 무엇을 시킬지 프롬프트하기 위해 거기 있는 사람'이 되어선 안 된다. 자신을 빼라." 게임의 이름은 "인간 개입 없이 더 많은 에이전트를 더 오래 돌리기"입니다.

핵심 원칙 2 — 검증 가능한 목표 함수

자동 연구는 만능이 아닙니다. 검증 가능한 메트릭이 있는 영역에서만 작동합니다. 같은 동작을 더 빠르게 만드는 CUDA(Compute Unified Device Architecture, 엔비디아 병렬 컴퓨팅 아키텍처) 커널 최적화는 완벽한 적용 사례입니다. 평가가 불가능한 영역(소프트한 판단, 의도 파악 등)은 자동화가 어렵습니다.

nanochat 사례 — 인간 전문가도 놓친 것

카파시는 자신의 GPT-2 학습 프로젝트인 nanochat을 "20년간 LLM을 수천 번 학습해 본 본인이 손으로 잘 튜닝한 결과물"로 평가합니다. 그런 그가 자동 연구를 하룻밤 돌렸더니, 다음과 같은 추가 튜닝 포인트를 찾아냈습니다.

weight decay 누락
value embedding 튜닝 부족
Adam 옵티마이저 베타 값의 결합 효과 미반영

핵심: 한 항목을 튜닝하면 다른 항목도 잠재적으로 바뀌어야 하는 결합 상호작용을 인간은 다 따라가지 못합니다. "나는 병목이어서는 안 된다. 이 하이퍼파라미터 최적화를 직접 돌려서도, 결과를 직접 봐서도 안 된다."

스케일링의 외삽

프론티어 인텔리전스의 본질은 "외삽과 스케일링 법칙"이라는 것이 카파시의 견해입니다. 즉, 작은 모델에서 자동화를 통해 막대한 탐색을 수행하고, 그 결과를 큰 규모로 외삽하는 방식이 가장 흥미로운 프로젝트이며, 프론티어 랩들이 실제로 작업 중인 방향이라고 봅니다.

메타 최적화 — `program.md`를 최적화

"연구 조직이란 결국 모든 역할과 그것들이 어떻게 연결되는지 기술하는 마크다운 파일들의 집합이다. 더 나은 연구 조직을 상상할 수 있다. 어떤 조직은 아침 스탠드업이 적고, 어떤 조직은 더 위험을 감수한다. 그리고 이 모든 것은 코드다." — Andrej Karpathy

대회 아이디어: 사람들이 서로 다른 program.md를 작성하게 하고, 같은 하드웨어에서 어디서 가장 큰 개선이 나오는지 비교 → 그 데이터를 모델에 주고 "더 나은 program.md를 써라." 메타 최적화의 메타까지 자동화되는 양파 구조입니다.

오픈 그라운드 — 신뢰 불가 워커 풀

카파시가 부업으로 탐색 중인 아이디어. 인터넷의 신뢰할 수 없는 워커 풀이 자동 연구에 기여하는 시스템 설계입니다.

블록체인과 유사한 구조

블록 ≈ 커밋: 코드 변경분이 담긴 단위. 서로 위에 쌓입니다.
작업 증명(proof of work) ≈ 방대한 실험: 작동하는 커밋을 찾기 위한 탐색.
검증의 비대칭성: 1만 개의 아이디어 중 1개가 작동하더라도, 검증자는 그 1개만 확인하면 됩니다 — 매우 저렴합니다.
현재 보상은 "리더보드 순위"뿐이지만, 구조적으로는 SETI@home, Folding@home과 같은 "찾기 어렵지만 검증은 쉬운 문제" 패러다임에 부합합니다.

함의"인터넷의 에이전트 군집이 협력해 LLM을 개선할 수 있고, 잠재적으로 프론티어 랩을 우회할 수도 있다." 프론티어 랩은 거대한 신뢰 컴퓨트를 보유하지만, 지구는 그보다 훨씬 큰 비신뢰 컴퓨트를 보유합니다. 시스템 설계만 잘 되면, 분산된 군집이 더 나은 해를 찾을 가능성이 있습니다.

개인 차원의 시사점"만약 모든 것이 자동 연구자 형태로 재번들링된다면, 컴퓨트가 곧 기여 단위가 된다. 암 연구처럼 자신이 아끼는 분야에 기관에 기부하는 대신, 컴퓨트를 사서 자동 연구 군집에 합류할 수 있다." 매우 도발적이지만 구조적으로 그럴듯한 시나리오입니다.

07모델의 들쭉날쭉함(Jaggedness) — 일반화의 한계

현재 모델의 가장 기이한 특성은 "PhD급 시스템 프로그래머와 10세 어린이가 동시에 한 몸에 있는" 들쭉날쭉함입니다. 이는 단순한 결함이 아니라, RL의 작동 메커니즘에서 비롯된 구조적 특성입니다.

"나는 동시에 매우 뛰어난 PhD 학생이자 평생을 시스템 프로그래머로 살아온 사람과, 10세 아이와 대화하는 느낌이다. 인간이라면 이 조합은 만나기 어렵다. 인간은 훨씬 덜 들쭉날쭉하다." — Andrej Karpathy

구조적 원인 — RL의 한계

모델은 RL로 학습됩니다. 따라서 검증 가능한 보상이 있는 영역만 개선됩니다. 코드를 올바르게 작성했는가? 단위 테스트가 통과하는가? — Yes/No로 답할 수 있는 질문에는 모델이 슈퍼인텔리전스 회로 위에 올라타지만, 그 외 영역에서는 "레일을 벗어나 헤매기" 시작합니다.

증거 — ChatGPT의 농담

카파시가 제시하는 결정적 사례. ChatGPT에 "농담 하나 해 줘"라고 하면 어떤 농담이 나올지 예측할 수 있을 정도로 농담이 고정되어 있습니다.

대표 후보: "과학자들은 왜 원자(atoms)를 믿지 않을까? 모든 걸 지어내거든(make everything up)."

이 농담은 3~4년 전과 동일합니다. 모델이 에이전트적 작업에서는 산을 옮길 정도로 발전했음에도, 농담은 5년 전 수준에서 멈춰 있습니다. 이유는 단순합니다 — 그 영역이 RL로 최적화되지 않았기 때문입니다.

"코드를 잘하면 모든 걸 잘한다"는 가설의 검증

일부 연구 그룹은 "검증 가능한 영역에서 더 똑똑해지면 모든 영역에서 똑똑해진다"는 일반화를 주장합니다. 농담 사례는 이 가설이 "전혀 일어나고 있지 않다"는 카파시의 진단을 뒷받침합니다. 약간의 일반화는 있지만 "만족할 수준이 아니다"는 표현입니다.

함의모델 능력 평가는 "평균 점수" 한 줄로 환원할 수 없습니다. 사용자가 의존하려는 영역이 RL로 다듬어진 영역인지를 매번 따져야 합니다. 또한, 능력 점프가 "저절로 사회의 모든 영역에 이전된다"는 낙관론은 경계해야 합니다.

"레일 위 / 레일 밖"의 이분법

"너는 슈퍼인텔리전스 회로의 일부거나, 레일을 벗어나 모든 게 방황하기 시작하거나 둘 중 하나다." 이 이분법은 워크플로우 설계에 직접 영향을 미칩니다. 작업을 "검증 가능한 단위"로 쪼개야 자동화의 이득을 극대화할 수 있습니다.

08모노컬처 vs 종분화(Speciation) — 단일 모델의 한계

현재 프론티어 랩들은 모든 영역에서 임의로 똑똑한 단일 모델 전략을 추구합니다. 카파시는 이것이 장기적으로 "종분화(speciation)"로 이행해야 한다고 봅니다.

동물계 비유

"동물계는 존재하는 두뇌의 다양성에서 극도로 풍부하다. 어떤 동물은 시각 피질이 과발달했고, 어떤 동물은 다른 부분이 발달했다. 우리도 더 많은 종분화를 봐야 한다." — Andrej Karpathy

종분화의 잠재 형태

인지적 핵심 + 영역 특화: 작은 모델이 인지적 코어를 유지하면서 특정 도메인에 특화 → 지연(latency)·처리량 측면에서 효율 극대화.
예시: Lean(수학 형식 증명 언어)으로 작업하는 수학자를 위한 모델. 이미 일부 릴리스가 이 방향을 시도 중.

현재 종분화가 더디게 일어나는 이유

1. 사용처 미지의 일반 서비스

프론티어 랩은 모델을 서빙하지만 최종 사용자가 무엇을 물을지 모릅니다. 따라서 모든 가능한 질의에 대한 멀티태스킹이 필요합니다.

2. 두뇌 조작의 과학이 미성숙

"능력 손실 없이 미세조정"과 같은 원시(primitive)가 아직 잘 개발되지 않았습니다. 컨텍스트 윈도우는 저렴하고 잘 작동하지만, 가중치를 직접 건드리는 것은 훨씬 까다롭습니다 — 모델 전체와 잠재적인 지능을 근본적으로 바꿀 수 있기 때문입니다.

3. 컴퓨트 압박의 잠재 효과

인터뷰어가 제기한 흥미로운 질문: "컴퓨트 인프라 제약이 종분화를 촉진할까?" 카파시는 "현재까지 종분화가 많이 보이지 않는다"고 답하지만, 단기 공급 부족(supply crunch)이 그 방향으로 압박할 가능성을 부정하지는 않습니다.

전망특정 비즈니스가 자신만의 고가치·니치 문제를 가지고 파트너링하기 시작하면, 종분화가 본격화될 가능성이 큽니다. 단, 그 전제는 가중치 조작 과학의 성숙입니다.

09오픈소스와 프론티어 랩의 균형

오픈소스는 프론티어 랩 대비 6~8개월 격차로 좁혀져 있고, 카파시는 이 "건강한 격차"가 산업 권력 균형의 핵심이라고 봅니다.

Linux 비유

"운영체제에서는 폐쇄형 Windows·macOS와 매우 쉬운 Linux가 공존한다. Linux는 마지막으로 확인했을 때 컴퓨터의 60%에서 돌아가는, 매우 성공적인 프로젝트다. 산업이 '모두가 안전하게 사용할 수 있는 공통의 열린 플랫폼'을 항상 요구했기 때문이다. 지금도 마찬가지다." — Andrej Karpathy

경쟁의 비대칭성

다만 오픈소스 LLM은 자본 집약적이라는 점에서 운영체제와 다릅니다. 운영체제는 자원 슬랙(slack)이 들어가지만, LLM은 직접적인 자본·컴퓨트 투입이 필수입니다. 이로 인해 경쟁의 난이도가 높습니다.

예상되는 분업 구조

계층	역할	특성
프론티어 폐쇄 모델	"오라클" 역할 — Nobel Prize급 연구, 대규모 마이그레이션(예: Linux를 C에서 Rust로) 같은 거대 프로젝트	최신 능력, 고가, 소수 랩이 보유
오픈소스 모델	대다수 일상 사용 사례, 더 나아가 로컬 실행 가능한 영역	6~8개월 격차, 공통 작업 공간

권력 균형 관점"폐쇄형만 존재하는 구조에는 시스템적 위험이 있다. 중앙집중화는 정치·경제 시스템에서 매우 나쁜 역사적 기록을 가지고 있다. 오픈소스는 산업 전체가 접근할 수 있는 공통 작업 공간이며, 산업의 권력 균형을 위한 적절한 장치다."

"우연히 좋은 위치"

카파시는 "지금 우리는 우연히 괜찮은 자리에 있다"고 표현합니다. 오픈소스가 프론티어를 살짝 뒤따르며, 시간이 지나면 오늘의 프론티어 능력이 미래의 오픈소스로 흡수됩니다. 이 동학이 오래 지속될수록 생태계 전체의 면적은 커집니다.

경고 — 폐쇄 진영의 추가 중앙집중화

카파시는 "폐쇄 쪽에서도 더 중앙집중화되고 있다"고 지적합니다. 선두 주자들이 반드시 최상위 역량을 갖춘 곳들이 아닐 수 있으며, 이는 "덜 이상적"이라는 평가입니다. 이상적으로는 더 많은 프론티어 랩이 존재하고, 머신러닝의 앙상블처럼 사람의 앙상블도 가장 어려운 문제에 같이 들어가야 한다는 입장입니다.

10로보틱스의 시간 지평 — 디지털, 인터페이스, 물리

자율주행 10년의 경험에 기반한 카파시의 직관: "Atoms는 bits보다 100만 배 어렵다." 따라서 디지털, 인터페이스, 물리의 순서로 변화가 도착합니다.

3단계 시간 지평

① 디지털 영역 현재

이미 디지털화된 정보에 대한 처리량이 폭발. 인간이 충분히 사고할 시간을 갖지 못한 정보가 산처럼 쌓여 있습니다. "언홉블링(unhobbling)"의 기회가 가장 큰 영역.

② 디지털-물리 인터페이스 근접 미래

"언젠가 디지털 공간에서 할 일이 떨어진다. 그러면 우주에 질문을 던져야 한다." 센서·액추에이터, 실험 장비, 데이터 수집 — 이 인터페이스에 흥미로운 회사들이 등장합니다.

③ 물리 영역 먼 미래

로보틱스 본격화. TAM(Total Addressable Market, 총유효시장)은 디지털보다 클 가능성도 있지만, 작업의 어려움이 100만 배입니다. 자본 집약, 메시한 환경, 긴 호흡의 확신이 필요합니다.

인터페이스 회사 사례

Periodic Labs — 카파시의 친구 Liam이 CEO. 재료과학 자동 연구를 시도. 인텔리전스로 가는 "센서"가 비싼 실험실 장비.
생명과학 엔지니어링 — 비디오 카메라보다 훨씬 다양한 형태의 센서가 필요한 분야. 데이터 흡수 자체가 회사의 핵심 가치.
학습 데이터 시장 — "사람들에게 학습 데이터에 대한 비용을 지불해서 프로그래밍 방식으로 Borg에 먹이는" 회사들도 인터페이스 비즈니스의 일종.

정보 시장의 부재 — 흥미로운 갭

"이상하다. 자율적 활동이 늘고 있다면, 왜 정보 시장이 없는가? 예를 들어 이란에서 일이 벌어지고 있다면, 테헤란 어느 지점의 사진·영상이 10달러에 거래되어야 하지 않나? 사람이 보지 않을 것이고, 베팅 시장과 주식 시장의 에이전트들이 보게 될 것이다." — Andrej Karpathy

이는 "에이전트적 웹"의 미성숙을 보여주는 단면입니다. 사람이 사람에게 정보를 파는 것이 아니라, 에이전트가 인간 군집을 "센서"로 활용하는 새로운 시장 구조의 가능성을 시사합니다. 카파시는 Daniel Suarez의 소설 Daemon(인텔리전스가 사실상 인류를 행위자로 활용하는 디스토피아)을 영감으로 언급합니다.

11직업 시장 변화 전망

카파시는 미국 노동통계국(BLS) 직업 전망 데이터를 가시화한 작업을 통해 "디지털 정보 처리 직군이 먼저 변한다"는 직관을 공유합니다.

구분 기준 — "비트와 원자"

변화의 속도는 작업이 비트를 다루는지 원자를 다루는지에 좌우됩니다. 디지털 정보의 복사·재배치는 빛의 속도로 가능하지만, 물질을 가속하는 데에는 에너지·시간이 든다는 단순한 물리적 원리가 직업 시장 분석의 출발점입니다.

제번스의 역설(Jevons Paradox)

흔한 직관은 "AI가 직업을 대체한다"는 것이지만, 카파시는 신중한 낙관론을 보입니다. ATM(Automated Teller Machine, 현금 자동입출금기)과 은행 창구 직원의 사례:

ATM 도입은 창구 직원을 대체할 것으로 우려되었음.
실제로는 지점 운영비가 낮아져 지점이 늘어났고, 결과적으로 창구 직원 수는 증가.

소프트웨어도 같은 동학을 따를 가능성이 있습니다. 소프트웨어가 희소했던 이유는 단지 비쌌기 때문이며, 비용이 낮아지면 잠재 수요가 폭발할 수 있습니다.

조심스러운 진단"소프트웨어 수요는 매우 클 것이고, 한동안은 더 커질 것이다. 코드가 일시적이 되고, 우리가 강제로 사용해야 했던 불완전한 도구의 한계에서 벗어나기 때문이다. 디지털 공간 전반의 '재배선' 활동이 그 자체로 거대한 수요를 만든다."

장기 전망의 모순 — 자기 자동화의 역설

"OpenAI나 Anthropic 같은 곳이 1,000명 정도 연구자를 고용하고 있다. 이들은 본질적으로 자기 자신을 자동화하고 있다. '우리가 성공하면 우리 모두 일자리를 잃는다' — 이게 그들이 적극적으로 하고 있는 일이다." — Andrej Karpathy

카파시는 일부 연구자들이 "정신착란"을 느끼는 이유를 이로 설명합니다. 자동 연구가 작동한다는 사실 자체가 "나도 끝났다"는 신호이기 때문입니다.

실용 지침

1차 행동 — 직업의 다양성 때문에 정답은 없습니다. 다만 도구가 너무 새롭고 강력하므로 "따라잡으려는 시도" 자체가 첫 번째입니다.
관점 — 직업은 "태스크의 묶음"이며, 일부 태스크는 훨씬 빨라집니다. 두려워할 일이 아니라, 현재 시점에서는 권한 부여 도구입니다.
역설적 강세 분야 — 엔지니어링 직군은 수요가 계속 증가 중. 일시적 현상인지 구조적 변화인지는 불확실하지만, 제번스의 역설이 작동 중일 가능성이 큽니다.

12프론티어 랩 vs 독립 — 정렬의 정치학

"왜 프론티어 랩에서 직접 자동 연구를 하지 않느냐"는 인터뷰어의 도발적 질문에 대한 카파시의 답변은 의외로 진중합니다.

두 진영의 비대칭성

관점	프론티어 랩 내부	독립 / 생태계
접근성	최첨단 능력, 비공개 정보, 결정의 방에 입장	제한적, 공개 정보 기반
발언의 자유	"말할 수 없는 것"과 "말해야 할 것"의 압박	비교적 자유로운 발언
재정적 정렬	막대한 인센티브 → 잠재적 갈등	경제적 보상 적음, 그러나 정렬은 깨끗
판단의 지속성	현장 감각 유지	시간이 흐르면 "현실 감각이 표류"
의사결정 영향력	방에 있지만, 최종 결정자는 아님	외부 영향력에 의존

OpenAI 창립 시점의 논쟁

"이것은 OpenAI가 시작될 때 우리가 풀려고 했던 딜레마의 핵심이었다. 그 딜레마는 아직 완전히 해결되지 않았다." — Andrej Karpathy

모두가 동의하는 점은: AI는 인류와 사회를 매우 극적으로 바꿀 것이고, 그것을 만드는 사람들이 동시에 그것에서 재정적으로 큰 혜택을 받는 구조에는 본질적 긴장이 있다는 사실입니다.

이상적 모델 — 양쪽을 오감

카파시 본인의 입장은 "양쪽을 오가는 것"이 이상적이라는 것입니다. 프론티어 랩 안에 있을 때는 실제 시스템의 작동 방식을 손으로 만집니다. 밖에 있을 때는 자유롭게 발언하고 생태계 차원의 기여를 합니다. 둘 사이를 주기적으로 오가지 않으면 외부에서는 판단이 표류하고, 내부에서는 자유가 침식됩니다.

함의"연구자들이 자기 의견을 말하는 데 인센티브가 있는 구조"가 산업 거버넌스의 핵심 변수입니다. 폐쇄 진영의 추가 중앙집중화가 진행되는 지금, 독립 연구자·외부 발언자의 역할은 더 중요해집니다.

13교육의 재편 — 이제 청자는 에이전트다

카파시의 가장 근본적인 통찰 중 하나. "나는 이제 사람이 아니라 에이전트에게 설명한다." 이는 교육·문서·튜토리얼 산업 전반에 시사점을 줍니다.

"1년 전이라면 나는 micro GPT를 만들고 비디오를 찍어서 단계별로 설명했을 것이다. 가이드를 만들었을 것이다. 하지만 지금은 그게 큰 가치를 더하지 않는다는 걸 깨닫는다. 200줄짜리 코드는 누구나 자기 에이전트에게 다양한 방식으로 설명해 달라고 할 수 있다. 나는 이제 사람이 아니라 에이전트에게 설명하고 있다." — Andrej Karpathy

"라우터로서의 에이전트"

핵심 구조: 작성자(카파시)가 에이전트에게 잘 설명할 수 있다면, 에이전트가 라우터가 되어 각 인간 학습자에게 그 사람의 언어·수준·관심사로 무한한 인내를 가지고 전달합니다. 이는 교육의 "1:N" 모델을 "1:에이전트:N" 구조로 바꿉니다.

구체적 변화

라이브러리 문서: HTML(HyperText Markup Language, 하이퍼텍스트 마크업 언어) 형식의 인간용 문서 → Markdown 형식의 에이전트용 문서로 이동.
스킬 파일: "에이전트에게 가르치는 방법"을 스크립트화한 자산. 예) micro GPT를 학습할 때 어떤 순서로 따라가야 하는지에 대한 커리큘럼을 스킬로 인코딩.
인간 작성자의 잔여 가치: 에이전트가 직접 도출하지 못하는 "핵심 통찰의 응축"에 한정.

인간 작성자의 새 역할

"에이전트가 못 하는 일이 이제 너의 일이다. 에이전트가 할 수 있는 일은 곧 너보다 더 잘하게 될 것이다. 그러니 너의 시간을 어디에 쓸지 전략적이어야 한다." — Andrej Karpathy

실무 지침현재 인간 작성자가 만드는 문서·튜토리얼·교재는 "에이전트가 잘 흡수할 수 있는 형식"으로 재구성되어야 합니다. 동시에, 인간이 가진 "핵심 통찰"의 비중을 명확히 인식하고 그곳에 시간을 투자해야 합니다.

14마이크로GPT(micro GPT) — 200줄의 본질 추출

카파시의 "끝없는 단순화 강박"의 최신 결과물. 효율성을 제거하고 알고리즘 본질만 남긴 200줄짜리 LLM 학습 코드.

코드 구조

구성 요소	분량	역할
데이터셋	몇 줄	텍스트 입력
신경망 아키텍처	약 50줄	모델 정의
Forward + Autograd 엔진	약 100줄	순전파 + 그래디언트 계산
Adam 옵티마이저	약 10줄	가중치 업데이트
학습 루프	나머지	전체 통합
총합	약 200줄	주석 포함

"복잡성은 효율성에서 온다"

카파시의 통찰: LLM 학습 코드의 복잡성은 알고리즘이 아니라 효율성에서 옵니다. 빠르게 만들기 위해 복잡한 코드가 필요한 것이지, 알고리즘 자체는 단순합니다.

나의 부가가치 vs 에이전트의 부가가치

"에이전트에게 '신경망을 가장 단순한 형태로 보여라'고 시키면 그렇게 하지 못한다. micro GPT는 내 강박의 끝이다. 200줄이고, 내가 오랫동안 고민한 결과다. 더 단순해질 수 없다. 이것이 내 부가가치다. 그 외의 모든 것 — 교육, 설명, 다양한 각도의 풀이 — 은 더 이상 내 영역이 아니다." — Andrej Karpathy

교훈인간 전문가의 가치는 "에이전트가 도달할 수 없는 응축된 통찰"에 있습니다. 에이전트는 응축된 결과물을 다양한 방식으로 풀어내고 전달할 수 있습니다. 따라서 전문가는 응축에 시간을 쓰고, 전달은 에이전트에게 위임하는 분업이 합리적입니다.

15종합 시사점

인터뷰 전체를 관통하는 메시지를 산업·연구·개인·거버넌스 차원으로 정리합니다.

15.1 산업 차원

고객의 이전: 인간 고객 가정이 깨집니다. 에이전트가 사용하기 좋은 API와 "스킬 파일" 같은 메타 자산이 핵심 자산이 됩니다.
앱 → API → 에이전트 매크로: SaaS(Software as a Service, 서비스형 소프트웨어) 회사의 가치 사슬이 "에이전트 친화적 API 노출 + 정밀한 권한·안전 모델"로 재편됩니다.
인터페이스 회사들의 부상: 디지털-물리 인터페이스(센서·실험 장비·데이터 수집)에 명확한 기회가 있습니다. 디지털 자체보다는 "지능에 데이터를 먹이는 통로"가 차세대 병목입니다.
정보 시장의 부재: 에이전트가 군집을 "센서"로 활용하는 새로운 시장 구조가 미성숙 상태입니다 — 선점 가치가 있을 수 있습니다.

15.2 연구 차원

자동 연구의 전제는 검증 가능성: 평가 함수가 없으면 자동화가 불가능합니다. 연구를 "검증 가능한 단위"로 쪼개는 능력이 새로운 핵심 역량입니다.
스몰 모델 → 외삽: 작은 모델에서 막대한 자동 탐색을 수행하고 스케일링 법칙으로 외삽하는 전략이 효율의 정점입니다.
인간 전문가의 잔여 영역: 결합된 하이퍼파라미터 상호작용처럼 인간이 따라가기 어려운 영역은 자동 연구에 위임합니다. 인간은 "목표 함수 설계, 경계 조건, 핵심 통찰"에 집중합니다.
비신뢰 컴퓨트 풀: 분산된 컴퓨트가 검증의 비대칭성에 의존해 협력하는 구조가 새로운 연구 토폴로지로 등장할 수 있습니다.

15.3 개인 워크플로우 차원

토큰 처리량 사고방식: 본인이 시스템의 결합 제약이라는 인식. 구독 한도가 남으면 불안하다는 카파시의 비유는 과장이 아닙니다.
매크로 액션 분해 연습: 한 줄·한 함수가 아니라 "기능 단위"로 작업을 분해하고 다중 에이전트에 분배하는 근육 기억의 형성.
스킬 파일 자산화: 반복되는 작업·도메인 지식·문체·검증 절차를 스킬 파일로 인코딩해 에이전트가 재사용하도록 만드는 것이 개인 자산의 새로운 형태입니다.
"레일 위/밖" 판별: 작업이 검증 가능 영역(RL로 다듬어진 영역)인지를 매번 판별하고, 비검증 영역은 인간 검토를 강하게 유지합니다.

15.4 거버넌스 차원

오픈소스의 6~8개월 격차 보존: 너무 좁혀지지도, 너무 벌어지지도 않은 균형이 산업 권력 분산에 기여합니다. 정책·자금·표준화 차원에서 이 균형을 유지하는 인센티브 설계가 필요합니다.
독립 발언자의 가치: 프론티어 랩 내부의 발언 압박을 고려할 때, 외부 독립 연구자·전 직원의 발언이 거버넌스 신호의 핵심입니다.
직업 변화에 대한 신중한 정책: 단순 대체 vs 보완·증대의 양면성을 이해하지 못한 정책은 잘못된 방향으로 갈 위험이 큽니다. 디지털 정보 처리 직군부터 변화가 시작된다는 점을 인식한 차별적 정책이 필요합니다.
에이전트 우선 인터넷의 안전: 권한 부여, 데이터 접근, 정보 시장 구조 등 새로운 "에이전트적 웹"의 거버넌스 프레임이 시급합니다.

마지막 단상 — "스킬 이슈" 프레임의 양면성

카파시의 "스킬 이슈" 프레임은 권한 부여적이지만 동시에 가혹합니다. 기술 능력의 천장이 갑자기 사라지면, 결과물의 품질 차이는 더 이상 "접근권"이 아니라 "오케스트레이션 능력"에서 나옵니다. 이는 학습 곡선 위에 있는 사람들에게는 거대한 기회지만, 학습 의지가 없거나 변화 속도를 따라잡지 못하는 사람들에게는 빠른 격차로 작용할 수 있습니다.

한편 카파시 본인이 진단하는 "정신착란" 상태는 산업 전체의 거시적 신호이기도 합니다. 가장 잘 아는 사람조차 "끝없는 미지 영역" 앞에서 초조함을 느낀다는 사실은, 현재가 단지 점진적 개선의 시기가 아니라 구조적 전환기임을 보여줍니다. 따라서 개인·조직·산업·정책 모두에서 "지금까지 작동해 온 방식"이 향후 1~2년 안에 크게 바뀔 가능성에 대비한 의사결정이 필요합니다.