jacobhan.me
전기 보고서 · Biography

안드레이 카파시 (Andrej Karpathy)

현대 인공지능(AI, Artificial Intelligence)을 가장 명료하게 번역한 연구자·교육자

안드레이 카파시는 OpenAI(오픈에이아이)의 창립 멤버이자 테슬라(Tesla)의 자율주행 비전(Vision) 부문을 이끈 인공지능 연구자입니다. 박사 시절에는 이미지와 자연어를 잇는 멀티모달(multimodal, 다중양식) 학습 분야에서 영향력 있는 논문을 남겼고, 산업 현장에서는 자율주행 신경망을 대규모로 양산하는 시스템을 설계하였습니다. 동시에 그는 학계와 업계의 최첨단 내용을 일반 개발자가 이해할 수 있는 형태로 풀어내는 "번역가"의 역할을 자임해 왔으며, 현재는 AI 시대의 새로운 학교를 표방하는 유레카 랩스(Eureka Labs)를 창업하여 교육 분야를 새로 쓰고 있습니다.

출생1986년 10월 23일, 브라티슬라바(Bratislava), 체코슬로바키아(현 슬로바키아)
국적슬로바키아·캐나다
학력토론토 대학교 학사(2009) · 브리티시 컬럼비아 대학교 석사(2011) · 스탠퍼드 대학교 박사(2016)
박사 지도교수페이페이 리(Fei-Fei Li)
주요 경력OpenAI 창립 연구원 · 테슬라 AI 총괄 · OpenAI 복귀 · 유레카 랩스 창업
대표 업적CS231n 강의 · Software 2.0 에세이 · nanoGPT · 테슬라 비전 전용 자율주행 아키텍처

1. 어린 시절과 가족의 이주 (1986 – 2001)

카파시는 1986년 10월 23일, 동유럽 사회주의 체제 말기의 체코슬로바키아 브라티슬라바에서 태어났습니다. 슬로바키아가 분리·독립한 시점은 그의 어린 시절과 맞물려 있으며, 그의 가족은 격변하는 동유럽을 떠나 그가 15세이던 무렵 캐나다 토론토(Toronto)로 이주하였습니다. 카파시 본인은 어린 시절 수학과 컴퓨터에 매료되어 알고리즘의 논리적 우아함과 소프트웨어의 창작적 가능성에 빠져들었다고 회고합니다.

대중에게 그의 이름이 처음 알려진 통로는 의외로 인공지능이 아니라 루빅스 큐브(Rubik's Cube) 였습니다. 그는 2006년 무렵부터 "badmephisto"라는 유튜브(YouTube) 채널에서 큐브 풀이 강의를 올렸고, 이 영상들은 펠릭스 젬데그스(Feliks Zemdegs) 같은 정상급 스피드 큐버들도 참고할 정도로 영향력을 가졌습니다. 자기 손으로 풀어내고, 그 풀이 과정을 다른 사람이 따라 만들 수 있도록 설명한다는 그의 평생의 작업 방식은 이때 이미 형성되어 있었습니다.

2. 학부와 석사: 토론토와 밴쿠버 (2005 – 2011)

카파시는 2005년 토론토 대학교(University of Toronto)에 진학하여 컴퓨터 과학과 물리학을 복수 전공하고 수학을 부전공으로 이수한 뒤, 2009년에 학사 학위를 받았습니다. 토론토 대학교는 딥러닝(deep learning, 심층학습)의 부흥을 이끈 제프리 힌턴(Geoffrey Hinton)이 자리한 곳으로, 카파시는 학부 시기에 신경망(neural network)에 대한 초기 관심을 굳혔다고 밝히고 있습니다.

이후 그는 캐나다 서부의 브리티시 컬럼비아 대학교(UBC, University of British Columbia)로 옮겨 미셸 반 더 판느(Michiel van de Panne) 교수의 지도 아래 2011년 석사 학위를 받았습니다. 석사 연구 주제는 물리적으로 시뮬레이션된 캐릭터(physically simulated figures) 의 운동 제어로, 가상 인물이 달리거나 군중 속에서 움직이는 동작을 학습 기반 컨트롤러로 만들어내는 작업이었습니다. 이 시기의 경험은 후에 그가 학습 기반 시스템과 시뮬레이션을 자연스럽게 결합해 사유하는 사고 습관의 토대가 되었습니다.

3. 스탠퍼드 박사과정: 보는 기계와 말하는 기계의 만남 (2011 – 2016)

2011년 카파시는 스탠퍼드 대학교(Stanford University) 박사과정에 진학하여 페이페이 리(Fei-Fei Li) 교수의 비전 랩(Vision Lab)에 합류합니다. 그의 박사학위 논문 제목은 "Connecting Images and Natural Language(이미지와 자연어를 잇기)" 이며, 이미지를 보고 사람처럼 문장으로 설명해 내는 모델 — 오늘날 멀티모달 AI라 불리는 분야의 초기 토대 — 을 설계하는 데에 집중하였습니다. 박사 1년 차 로테이션 기간 동안 그는 다프네 콜러(Daphne Koller), 앤드루 응(Andrew Ng), 세바스찬 트런(Sebastian Thrun), 블라들렌 콜툰(Vladlen Koltun) 등 유수의 연구자들과 함께 작업할 기회를 가졌습니다.

박사과정 동안 그는 세 번의 인턴십을 거치며 산업 규모의 학습을 경험합니다. 2011년 초기의 구글 브레인(Google Brain)에서 유튜브 영상을 활용한 대규모 비지도학습(unsupervised learning)을, 2013년 구글 리서치(Google Research)에서는 유튜브 영상의 대규모 지도학습(supervised learning)을, 그리고 2015년 딥마인드(DeepMind)에서 코레이 카부쿠오글루(Koray Kavukcuoglu)와 함께 심층 강화학습(deep reinforcement learning)을 다루었습니다.

스탠퍼드에서 그가 남긴 가장 큰 자취 중 하나는 강의입니다. 카파시는 페이페이 리와 함께 CS231n: Convolutional Neural Networks for Visual Recognition(시각 인식을 위한 합성곱 신경망) 을 설계하고 주강사를 맡았습니다. 이 강의는 스탠퍼드 최초의 본격적인 딥러닝 강좌로 자리 잡았고, 2015년 150명에서 시작해 2016년 330명, 2017년에는 750명으로 수강생이 폭증하면서 학교 안팎의 표준 교재로 정착하였습니다. 동영상 강의는 전 세계 개발자들이 딥러닝을 처음 접하는 통로가 되었습니다.

학생으로서의 그를 보여주는 유명한 일화도 이 시기에 나옵니다. 신경망의 이미지넷(ImageNet) 분류 성능이 사람보다 좋은가를 직접 검증하기 위해, 그는 수백 개의 카테고리를 스스로 익히고 자신만의 평가 도구를 만들어 자신의 상위 5위 오차율을 측정하였습니다. 결과는 5.1%로, 당시 최신 신경망의 6~7%보다 약간 좋은 수준이었습니다. 이 실험 자체가 그의 "이해하려면 직접 만들어 보아야 한다"는 태도를 단적으로 드러내는 사건이었습니다.

▎ 비유 박스 — 멀티모달 AI란?

멀티모달 AI는 마치 외국 미술관의 그림 앞에서 작품을 보고 그것을 자기 언어로 풀어내는 가이드와 같습니다. 한쪽 회로는 그림(이미지)을 보고 색·형태·배치를 부호화하고, 다른 한쪽 회로는 그 부호를 모국어(자연어)로 옮깁니다. 카파시의 박사 시기 작업은 이 두 회로를 처음으로 단일한 신경망 위에서 자연스럽게 잇는 방법을 보여 준 사례 중 하나였습니다.

4. OpenAI 창립 멤버 시기 (2015 – 2017)

2015년 12월, 일론 머스크(Elon Musk)와 샘 알트만(Sam Altman) 등이 비영리 AI 연구소 OpenAI를 출범시킬 때, 카파시는 창립 연구 과학자(founding research scientist) 중 한 명으로 합류합니다. 이 시기 그의 연구 주제는 컴퓨터 비전, 생성 모델(generative model), 그리고 강화학습이었으며, 후에 OpenAI의 GPT 계열 모델로 이어지는 초기 방향성을 함께 다듬는 데에 기여하였습니다. 함께 작성한 대표적 결과물 중 하나가 픽셀CNN++(PixelCNN++) 논문이며, 이 시기의 협업진에는 디데릭 킹마(Diederik P. Kingma)와 팀 살리만스(Tim Salimans) 등이 포함되어 있었습니다.

그러나 그의 OpenAI 1차 시기는 1년 반 남짓으로 비교적 짧게 끝납니다. 2017년 6월, 그는 머스크의 직접 영입 제안을 받아들여 테슬라로 자리를 옮기게 됩니다.

5. 테슬라 AI 총괄 시기 (2017 – 2022)

카파시는 2017년 6월부터 2022년 7월까지 테슬라의 AI 디렉터(Director of AI), 이후 시니어 디렉터(Senior Director of AI)로서 오토파일럿(Autopilot) 비전 팀을 이끌었습니다. 이 시기에 테슬라가 시도한 것은 일종의 대규모 산업 실험이었습니다. 즉, 도로 위의 모든 인지·판단을 핵심적으로 카메라와 신경망만 으로 풀어내겠다는 비전 우선(vision-first) 전략의 본격 추진이었습니다.

그의 팀은 데이터 라벨링, 신경망 훈련, 테슬라 자체 추론 칩(custom inference chip) 위로의 배포까지 모든 공정을 사내(in-house)에서 수직 통합하였습니다. 2021년 8월 진행된 테슬라 AI 데이(Tesla AI Day) 발표는 이 수직 통합된 자율주행 스택을 외부에 가장 상세히 공개한 자리로, 카파시 본인이 발표 핵심 인물 중 하나였습니다. 또한 그는 휴머노이드 로봇인 옵티머스(Optimus) 프로젝트에도 잠시 관여하였습니다.

엔지니어링 리더로서의 시기 중에 그는 자신의 사상적 시그니처가 된 글을 한 편 남깁니다. 2017년 11월의 미디엄(Medium) 에세이 "Software 2.0" 이 그것입니다.

▎ 비유 박스 — Software 2.0이란?

전통적인 프로그래밍(Software 1.0)은 사람이 종이 위에 요리 레시피의 모든 단계를 빠짐없이 적어 내려가는 일에 비유할 수 있습니다. 어떤 재료를 몇 분간 어떤 불에서 익힐지를 인간이 일일이 명시합니다. 반면 카파시가 말하는 Software 2.0은, 요리 결과물의 사진 수백만 장을 모아 두고 주방 로봇(신경망)이 스스로 가중치(레시피)를 추정하도록 만드는 방식입니다. 코드는 사라지지 않습니다. 다만 그 코드는 더 이상 사람이 손으로 쓰지 않고, 학습 알고리즘이 데이터를 보고 "쓰는" 형태로 바뀐다는 관점입니다. 자율주행처럼 손으로 다 적어내려 가기엔 너무 복잡한 문제에 이 패러다임이 특히 잘 맞는다는 것이 그의 주장이었습니다.

2022년 3월 그는 수개월간의 안식 휴가를 발표하였고, 같은 해 7월에는 테슬라를 떠난다고 밝혔습니다. 5년에 걸친 그의 재임 기간 동안 테슬라의 풀 셀프 드라이빙(FSD, Full Self-Driving) 베타 소프트웨어는 레이더(radar)를 제거한 순수 비전 기반의 종단간(end-to-end) 신경망 아키텍처로 거듭났으며, 자율주행 분야 전반에 "비전만으로 가능한가"라는 큰 질문을 던졌습니다. 그 답은 여전히 진행 중이지만, 적어도 산업 표준의 한 축을 그가 만든 것은 분명합니다.

6. 안식기와 OpenAI 복귀 (2022 – 2024)

테슬라를 떠난 카파시가 곧장 새 직장으로 향한 것은 아니었습니다. 2022년 후반부터 그는 유튜브에 "Neural Networks: Zero to Hero(신경망: 0에서 영웅까지)" 강의 시리즈를 올리기 시작하였습니다. 200줄 미만 파이썬으로 자동미분(autograd)을 직접 구현하는 micrograd(마이크로그라드)에서 출발하여, 문자 단위 언어 모델 makemore(메이크모어), 그리고 GPT를 처음부터 만드는 nanoGPT(나노지피티)까지, "최소한의 가장 읽기 좋은 코드로 가장 본질적인 것을 보여 준다"는 그의 미학이 응축된 결과물이었습니다.

2023년 2월 9일, 그는 자신이 OpenAI로 돌아간다고 발표하였습니다. 두 번째 OpenAI 시기에 그는 챗GPT(ChatGPT)에 통합되는 모델 구축에 관여하였고, 미드트레이닝(mid-training)과 합성 데이터(synthetic data) 생성에 집중하는 팀을 새로 꾸려 이끌었다고 본인이 밝힌 바 있습니다. 같은 해 5월의 마이크로소프트 빌드(Microsoft Build) 발표 "State of GPT" 는 GPT 학습 파이프라인의 전 과정을 일반 청중에게 처음으로 깔끔하게 정리해 보여 준 사례로 자주 인용됩니다.

카파시는 2024년 2월 13일 OpenAI를 다시 떠난다고 알렸고, OpenAI 측에서도 이를 확인하였습니다. 두 번째 재직 기간은 정확히 1년 정도였습니다.

7. 유레카 랩스: AI 시대의 새로운 학교 (2024 – )

2024년 7월 16일, 카파시는 자신의 X(엑스, 옛 트위터) 계정으로 새 회사 유레카 랩스(Eureka Labs) 의 출범을 알렸습니다. 그의 표현을 빌리자면 유레카 랩스는 "AI 네이티브 학교(AI-native school)"로, 전문가가 설계한 콘텐츠와 AI 보조 교사(AI teaching assistant)의 공생 이라는 모델을 핵심으로 합니다. 핵심 가설은 단순합니다 — 양질의 교사는 절대적으로 부족하지만, 그 교사의 가르침을 AI가 학생 한 명 한 명에게 맞춰 무한히 전달할 수 있다면, 교육의 병목은 사라질 수 있다는 것입니다.

첫 강좌는 LLM101n 으로, 학생이 직접 자신만의 LLM(대규모 언어 모델, Large Language Model)을 처음부터 끝까지 훈련시키며 파이썬·C·CUDA(쿠다)를 함께 익히는 학부 수준의 커리큘럼입니다. 회사는 2025년 초 컨빅션(Conviction, 사라 구오)과 샘 알트만 등이 참여한 약 2천만 달러 규모의 시드 라운드를 받았다고 업계에서 보도된 바 있으며, 2026년 5월 시점에도 여전히 초기 빌드(build) 단계의 회사입니다.

유레카 랩스의 출범 이후 그는 일종의 "공개 교과서 시리즈"로서 오픈소스 프로젝트들을 계속 내놓고 있습니다. 2025년 10월에 공개된 nanochat(나노챗) 은 그가 "100달러로 살 수 있는 최고의 챗GPT"라고 표현한 약 8천 줄 규모의 오픈소스 프로젝트로, 토크나이저(tokenizer) 훈련부터 사전훈련(pretraining), 미드트레이닝, 지도 미세조정(SFT, Supervised Fine-Tuning), 강화학습(RL, Reinforcement Learning), 추론·웹 UI까지의 전 과정을 한 코드베이스에 담아냈습니다. 8장의 H100 GPU 노드(8xH100 GPU node)로 약 4시간 만에 자신만의 챗GPT 비슷한 모델을 띄울 수 있다고 본인이 밝혔습니다.

8. 사상의 전개: Software 3.0, 컨텍스트 엔지니어링, 그리고 AGI 10년론

2025년 6월 18일, 카파시는 와이 콤비네이터(YC, Y Combinator)의 AI 스타트업 스쿨(AI Startup School)에서 "Software Is Changing (Again)(소프트웨어가 다시 바뀌고 있다)" 라는 키노트를 발표하였습니다. 여기서 그는 자신의 2017년 Software 2.0 개념을 확장하여 Software 3.0 이라는 명칭을 제시하였습니다.

패러다임"코드"가 무엇인가누가 "쓰는가"
Software 1.0사람이 손으로 쓴 명시적 코드(C, Python 등)인간 프로그래머
Software 2.0학습된 신경망 가중치(weights)최적화 알고리즘이 데이터로부터 학습
Software 3.0LLM을 향한 자연어 프롬프트(prompt)사람이 영어 등 자연어로 의도를 기술

이 흐름에서 그는 2023년 1월에 이미 던졌던 트윗 "가장 뜨거운 새 프로그래밍 언어는 영어다(The hottest new programming language is English)"를 다시 환기하며, 2025년 2월에는 "바이브 코딩(vibe coding)" 이라는 표현을 만들어 냅니다. 그가 말한 바이브 코딩이란, 사람이 자연어로 의도만 던지고 LLM이 생성한 코드를 일일이 검토하지 않은 채 받아들이며 만들어 나가는 새로운 양상의 개발 행위입니다.

같은 해 후반부터 그는 또 하나의 키워드, 컨텍스트 엔지니어링(context engineering) 을 강조하기 시작합니다. 이는 단순한 프롬프트의 문구 다듬기를 넘어, LLM의 제한된 컨텍스트 윈도(context window) 안에 어떤 정보를 어떤 순서로 채워 넣을 것인가를 체계적으로 설계하는 작업을 가리킵니다.

2025년 10월, 그는 드워케시 파텔(Dwarkesh Patel)의 팟캐스트(podcast)에 출연하여 또 다른 화제를 만들어 냅니다. 거기에서 그는 "범용 인공지능(AGI, Artificial General Intelligence)은 여전히 약 10년쯤 떨어져 있다"는 입장을 분명히 하였고, 강화학습이 현 단계에서 만능 해법인 것처럼 다뤄지는 분위기에는 비판적인 견해 — 본인 표현으로는 "강화학습에 대해 매우 비관적(bearish)"이라는 — 를 드러냈습니다. 일부 매체는 그의 이 발언을 "AI 거품에 찬물을 끼얹은 발언"으로 다뤘지만, 카파시 본인은 자신은 비관론자가 아니며, 다만 현장에서 확인되는 미세한 비효율과 함정들을 정직하게 짚는 것뿐이라고 거듭 강조하였습니다.

▎ 비유 박스 — 컨텍스트 엔지니어링이란?

LLM은 매번 새로 깨어나는 단기 기억의 비서와 같습니다. 비서가 한 번에 책상 위에 펴 놓고 볼 수 있는 종이의 양은 정해져 있는데(컨텍스트 윈도), 어떤 자료를 어떤 순서로 비서 책상에 올려 두느냐에 따라 그가 내려놓는 결정의 질이 크게 달라집니다. 컨텍스트 엔지니어링은 이 책상 위에 무엇을 어떤 순서·형식으로 올릴 것인가를 설계하는 일입니다. 카파시가 보기에 이 일은 단순한 문장 다듬기보다 훨씬 더 본질적인 엔지니어링 영역입니다.

9. 학술적 기여와 영향력

카파시의 학술적 기여는 크게 세 영역으로 묶을 수 있습니다.

학술 논문의 인용 수만큼이나, 그가 학계 외부에 미친 영향은 강의·블로그·오픈소스라는 비공식 경로로 전달되었습니다. CS231n 강의록, "The Unreasonable Effectiveness of Recurrent Neural Networks(순환 신경망의 비합리적인 효율성)" 같은 블로그 글, 그리고 micrograd / makemore / minGPT / nanoGPT / minbpe / llm.c / nanochat 같은 GitHub(깃허브) 저장소들은 한 세대의 AI 개발자에게 일종의 "표준 교과서"로 기능해 왔습니다.

10. 인물 — 미니멀리즘과 직접 만들어 본다는 태도

그의 작업 방식을 한 줄로 요약하면 "내가 만들 수 없으면 내가 이해한 것이 아니다(If I can't build it, I don't understand it)" 라는 파인만(Feynman) 인용으로 압축됩니다. 이 태도는 그의 모든 결과물에 깔려 있는 한 줄의 헌법과도 같습니다. 그의 nanoGPT는 GPT-2(약 1억 2400만 파라미터)를 한 노드의 GPU로 며칠 만에 재현할 수 있을 만큼 단순하고, 동시에 신경망이 작동하는 핵심 메커니즘을 그대로 노출합니다. nanochat은 그 정신을 챗GPT 풀스택까지 확장합니다.

또한 그는 일관되게 과장된 표현을 경계해 왔습니다. 2023년의 "State of GPT" 발표에서부터 그는 LLM의 사용 방식에 대해 "위험도가 낮은 작업에서, 사람을 루프 안에 두라(low-stakes + human-in-the-loop)"는 보수적인 원칙을 강조해 왔으며, 2025~2026년의 사회적 열기 속에서도 LLM의 한계 — 들쭉날쭉한 지능(jagged intelligence), 일종의 단기기억상실(anterograde amnesia)에 비유될 수 있는 컨텍스트 망각, 환각(hallucination) 등 — 를 가장 분명하게 짚는 화자 중 한 명으로 남아 있습니다.

11. 수상과 외부 평가

12. 주요 연표

1986
슬로바키아 브라티슬라바 출생.
2001경
15세 무렵 가족과 함께 캐나다 토론토로 이주.
2006
유튜브 채널 "badmephisto"에서 루빅스 큐브 강의 시작.
2009
토론토 대학교 컴퓨터과학·물리학 학사.
2011
UBC 컴퓨터과학 석사(지도: 미셸 반 더 판느). 구글 브레인 인턴.
2013
구글 리서치 인턴.
2014
대규모 비디오 분류(CVPR) 논문, Sports-1M 데이터셋 공개.
2015
CS231n 첫 개설(주강사). 딥마인드 인턴. 12월 OpenAI 창립 멤버로 합류.
2016
스탠퍼드 박사 학위 취득(논문: Connecting Images and Natural Language).
2017
6월 테슬라 AI 디렉터로 합류. 11월 Software 2.0 에세이 발표.
2020
MIT 테크놀로지 리뷰 "35세 미만 혁신가" 선정.
2021
테슬라 AI 데이(8월) 발표. 비전 전용 자율주행 스택 공개.
2022
3월 안식 휴가 발표, 7월 테슬라 퇴사. 11월부터 유튜브 "Zero to Hero" 시리즈 개시.
2023
1월 "The hottest new programming language is English" 트윗. 2월 OpenAI 재합류. 5월 "State of GPT" 발표. nanoGPT 공개.
2024
2월 OpenAI 두 번째 퇴사. 7월 16일 유레카 랩스 창업, LLM101n 발표. 타임 100 AI 인물 선정.
2025
2월 "바이브 코딩" 용어 제시. 6월 YC AI 스타트업 스쿨 키노트에서 Software 3.0 발표. 10월 nanochat 공개 및 드워케시 파텔 팟캐스트 출연(AGI 약 10년론).

13. 마무리

카파시의 경력은 한 줄로 요약하기 쉽지 않습니다. 그는 학자였고, 산업 엔지니어링 리더였고, 창업자이며, 동시에 무엇보다 교사였습니다. 그가 일관되게 추구해 온 것은 신기술을 신비화하지 않는 일 — 즉, 작동의 원리를 가장 작은 코드로 드러내어 누구든 따라 만들고 의심하고 개선할 수 있게 하는 일입니다. 그가 만든 200줄짜리 micrograd가 누군가의 첫 신경망 학습 경험이 되었고, CS231n이 한 세대의 컴퓨터 비전 연구자에게 첫 강의가 되었으며, 테슬라 비전 스택은 자율주행 산업의 한 가능성을 끝까지 밀어붙인 사례가 되었습니다. 2026년의 시점에서 유레카 랩스의 성공 여부는 아직 단정하기 어렵지만, 그가 인공지능과 교육이라는 두 영역의 경계에서 또 한 번의 번역을 시도하고 있다는 사실만큼은 확실합니다.