Engineering · Interview Notes

Claude Code 1년, 코딩이라는 직업은 어디로 가는가

Anthropic의 Claude Code 책임자 Boris Cherny가 1주년을 맞아 들려준 이야기. 작은 해킹 프로젝트가 어떻게 깃허브 커밋의 4%를 차지하는 도구가 되었는지, 그리고 그 과정에서 그가 배운 다섯 가지 원칙.

2026년 5월 · Lenny's Podcast 인터뷰 정리

2025년 2월 외부 공개된 Claude Code는 1년 만에 GitHub(깃허브) 공개 커밋의 약 4%를 차지하는 도구가 되었다. Semianalysis(반도체·AI 분석업체)는 연말까지 이 비율이 20%에 이를 것으로 전망했다. Boris Cherny는 이 프로젝트를 시작하고 이끌어온 인물이다. 그는 Anthropic(앤스로픽) 합류 → 사내 해킹 → 터미널 기반 프로토타입 → 외부 공개로 이어진 1년을 회고하면서, 코딩이라는 직업이 어디로 가고 있는지에 대한 자기 관찰을 풀어놓았다.

이 글은 인터뷰 전문을 다섯 개의 주제—탄생, 성장, 다음 프론티어, 빌드 원칙, 사용 팁—로 재구성한 정리본이다.

01 / 탄생좋아요 2개로 시작한 사내 해킹

Cherny가 Anthropic에 합류해 처음 한 일은 한 달간 무작정 프로토타입을 만들어 보는 것이었다. 대부분은 출시되지도 않을 실험들이었다. 그 다음 한 달은 포스트 트레이닝(post-training, 모델 사후 학습) 연구에 들어가 모델 자체를 깊이 이해하려 했다. 그의 표현으로는 “좋은 일을 하려면 자기가 일하는 층의 한 층 아래를 이해해야 한다.”

이 우회로를 거친 후 만든 첫 프로토타입의 이름은 Claude CLI였다. 당시 Sonnet 3.5에 bash(배시) 도구 하나를 쥐여주고 “지금 무슨 음악을 듣고 있는지 알아내라”고 시켰더니 모델이 알아서 명령어를 조합해 답을 찾아냈다. 그는 이 장면을 보고 무언가 있다고 직감했다. 사내에 공유한 첫 게시물은—

좋아요 두 개를 받았다. 그게 당시 반응의 전부였다. Boris Cherny

당시 사내 모두가 “코딩 도구는 IDE(Integrated Development Environment, 통합 개발 환경)여야 한다”고 생각했기 때문이다. 그가 터미널을 고른 이유는 단순했다. 혼자 만들고 있었기 때문에 가장 쉬운 형식이었던 것이다. 그러나 이것은 결과적으로 중요한 선택이 됐다. 모델이 너무 빠르게 좋아지고 있어서, 터미널만큼 가볍게 따라잡을 수 있는 형식이 없었기 때문이다.

비유 박스 — 왜 “하부 한 층”을 알아야 하는가

요리사가 자기가 쓰는 식재료가 어디서 어떻게 길러지는지 알면 메뉴 설계가 달라진다. 토양을 직접 농사짓진 않지만, 토양 사정을 알면 재료 선택과 조리법이 정교해진다. 엔지니어가 자기가 다루는 추상화의 한 층 아래(모델, 컴파일러, 가상머신 등)를 이해해야 한다는 말은 같은 맥락이다. AI 시대에는 그 아래층이 바로 모델 자체가 됐다.

외부 공개 후에도 Claude Code는 즉시 히트하지 못했다. 초기 사용자들이 모였을 뿐, 다수가 “이게 뭔지” 이해하는 데는 몇 달이 걸렸다. 첫 변곡점은 Opus 4 출시였고, 두 번째는 2025년 11월이었다. 그 이후로 성장 곡선은 가팔라지기만 했다.

02 / 성장1주년의 숫자, 그리고 인쇄기 비유

GitHub 공개 커밋 중 Claude Code가 작성한 비율 (2026년 초)

200%

Anthropic 엔지니어 1인당 PR(Pull Request, 풀 리퀘스트) 증가율

100%

Cherny 본인이 손으로 쓴 코드 비율 (2025년 11월 이후 0%)

Cherny가 인용한 Semianalysis 보고서는 공개 저장소만 집계한 수치다. 비공개 저장소까지 포함하면 실제 비율은 더 높을 것으로 추정된다고 한다. 그는 “4% 자체보다도 성장 가속도가 줄지 않는다는 점이 충격”이라고 말했다.

이 변화를 어떻게 자리매김할지 묻자, 그는 가장 가까운 역사적 유비로 구텐베르크 인쇄기를 꼽았다.

비유 박스 — 인쇄기와 코딩

1400년대 중반 유럽에서 글을 읽고 쓸 줄 아는 인구는 1% 미만이었다. 필사(筆寫)는 소수 필경사의 직업이었다. 인쇄기가 등장하자 50년 안에 출간된 인쇄물 양이 그 이전 1,000년 합계를 넘어섰고, 책 가격은 100배가량 떨어졌다. 문해율 자체가 70%대까지 오르는 데는 200년이 더 걸렸지만, 그 사이 르네상스와 종교개혁이 가능해졌다.

Cherny의 관찰은 코딩도 같은 곡선을 그릴 수 있다는 것이다. “코드를 쓸 수 있다”는 능력이 직업 집단의 전유물에서 일반 도구로 풀려나는 중이라는 시각이다. 다만 그는 이 전환이 “많은 사람에게 고통스러울 수 있다”고 분명히 덧붙였다.

구체적 변화로는 Spotify(스포티파이) 최고 엔지니어들이 2025년 12월 이후 손으로 코드를 쓰지 않았다는 보도, 그리고 Cherny 본인이 같은 시점부터 모든 코드를 Claude Code에 맡겨왔다는 사실이 인용됐다. Anthropic 내부 엔지니어 수는 1년 동안 약 4배 늘었고, 그 와중에 1인당 PR 산출량은 200% 증가했다. 그가 Meta(메타) 시절 코드 품질팀에서 보던 연간 “수 퍼센트 포인트” 단위의 생산성 변화와는 자릿수가 다른 수치다.

03 / 프론티어코딩은 풀렸다, 다음은 “무엇을 만들지”다

Cherny는 “자신이 다루는 종류의 프로그래밍에 한정해 말하면, 코딩은 사실상 풀린 문제(largely solved)”라고 단언했다. 그래서 팀의 관심은 이미 그 바깥으로 옮겨가고 있다. 두 방향이다.

① 모델이 무엇을 만들지 제안한다

Claude가 Slack(슬랙) 채널의 사용자 피드백, 버그 리포트, 텔레메트리(원격 계측)를 훑고 스스로 수정 아이디어를 내고 PR까지 올리기 시작했다. Cherny가 직접 쓰는 방식은 단순하다. Claude Code나 Cowork(코워크)를 열고 “이 슬랙 채널을 보고 할 일을 찾아라”라고 시킨다. 그 다음 올라온 PR을 확인한다.

② 코딩을 벗어난 일반 작업

두 번째 방향이 Cowork이다. Cowork는 Claude Code의 사고 엔진을 데스크톱 앱과 브라우저 위에 얹어 일반 사용자가 일상 업무를 자동화할 수 있게 한 제품이다. 출발점은 “비엔지니어들이 터미널 앞까지 와서 Claude Code를 우회적으로 쓰고 있다”는 관찰이었다.

누군가는 토마토 모종 키우는 데 썼고, 누군가는 자기 게놈을 분석했다. 망가진 하드 드라이브에서 결혼식 사진을 복구하는 데 쓴 사람도 있었다. MRI를 분석한 사람도 있다. Boris Cherny, 외부 사용자들의 Claude Code 활용 사례

Cherny는 사내 데이터 사이언티스트 Brendan(브렌든)이 어느 날 자기 데스크 위 터미널에서 Claude Code로 SQL(에스큐엘) 분석을 하는 것을 보고 충격을 받았다고 한다. 그 다음 주에는 데이터팀 전원이 같은 짓을 하고 있었다. 이 패턴이 그가 말하는 잠재 수요(latent demand)의 신호다. 사용자가 도구를 “설계 의도와 다르게” 비틀어 쓰고 있다면, 그것을 위한 정식 제품을 만들 시간이라는 뜻이다.

비유 박스 — Agent라는 단어의 정확한 의미

요즘 “에이전트”라는 말은 마케팅 슬로건처럼 쓰여 의미가 흐려졌다. Cherny가 정의하는 에이전트는 명확하다: LLM(Large Language Model, 거대 언어 모델)이 도구를 사용할 수 있는 상태. 즉 단순히 대화만 하는 것이 아니라, 이메일을 보내고 명령어를 실행하고 파일을 열 수 있는 LLM이다. 이 정의를 지키면 “챗봇”과 “에이전트”가 왜 다른 카테고리인지가 분명해진다.

04 / 안전모델 안전성을 보는 세 개의 레이어

Anthropic의 정체성은 “안전 연구소(safety lab)”다. Cherny는 모델 안전성 연구가 세 층으로 나뉜다고 설명했다. 아래로 갈수록 내부 동작에 가깝고, 위로 갈수록 실세계에 가깝다.

아래 층일수록 모델 내부에 가깝고, 위 층일수록 실세계 행동에 가깝다.

1층의 기계적 해석 가능성(mechanistic interpretability)은 Chris Olah(크리스 올라)가 개척한 분야다. 모델 뉴런이 어떤 개념에 반응하는지, 여러 뉴런이 함께 활성화되는 중첩(superposition) 상태에서 어떤 복합 개념을 표현하는지를 추적한다. “기만”에 해당하는 회로가 켜지면 모니터링이 가능한 수준까지 와 있다는 것이다.

2층 evals(평가)는 합성된 페트리 접시 환경에서 모델을 시험하는 작업이다. 3층은 실배포 후 관찰이다. 모델이 정교해질수록 1·2층에서 멀쩡해 보이던 행동이 3층에서 어긋날 수 있어, Cherny는 “Claude Code와 Cowork를 의도적으로 조금 일찍 공개했다”고 설명했다. Anthropic은 이런 작업의 상당 부분을 오픈소스로 공개한다. 그가 말하는 “정상으로의 경주(race to the top)” 전략이다.

05 / 빌드 원칙AI 제품을 만드는 다섯 가지 원칙

인터뷰에서 가장 실용적인 부분이었다. AI 시대에 제품을 만드는 사람을 위한 Cherny의 원칙은 다음과 같다.

엔지니어가 토큰을 마음껏 쓰게 두라

초기에 비용 최적화부터 들이대지 말라는 조언이다. 한 명의 엔지니어가 실험 단계에서 쓰는 토큰 비용은 인건비에 비해 미미하다. 아이디어가 통하는지부터 확인한 다음, 스케일이 커지면 그때 Haiku나 더 싼 모델로 내려보내며 최적화한다. Anthropic은 사내에서 토큰 한도를 풀어두고 있고, 다른 회사들도 “무제한 토큰”을 복지로 내거는 사례가 등장하고 있다.

6개월 뒤 모델을 위해 빌드하라

오늘 모델의 한계에 맞추면 출시 시점에 이미 낡는다. Claude Code도 초기 6개월간 PMF(Product–Market Fit, 제품·시장 적합성)가 약했지만, Opus 4 시점에 모델이 따라잡으면서 단번에 변곡점을 맞았다. 모델이 더 길게 자율적으로 도구를 쓴다는 추세에 베팅하는 것이 핵심이다.

모델을 박스에 가두지 말라

1년 전에는 엄격한 워크플로(“반드시 단계 1 → 2 → 3”)와 정교한 오케스트레이터(orchestrator)가 필요했다. 지금은 그렇지 않다. 모델에 도구와 목표만 주고 알아서 결정하게 하면 더 좋은 결과가 나온다. 컨텍스트를 미리 잔뜩 채워주지 말고, 컨텍스트를 가져올 수 있는 도구를 주는 편이 낫다.

Bitter Lesson을 기억하라

Rich Sutton(리치 서튼)이 2019년에 쓴 에세이 「The Bitter Lesson」의 메시지: 인간의 도메인 지식을 끼워 넣은 모델은 단기적으로 잘 나가지만, 결국에는 더 일반적인 모델이 그것을 추월한다. 작은 fine-tune(파인튜닝, 미세조정)이나 정교한 스캐폴딩으로 10~20% 성능을 올려도, 다음 모델이 나오면 그 이득은 흔히 사라진다. 가능하면 가장 일반화된 모델에 베팅하라.

잠재 수요(Latent Demand)를 찾아라

사용자가 도구를 비틀어 쓰는 패턴이 관찰되면, 그것이 다음 제품의 신호다. Facebook Marketplace(페이스북 마켓플레이스)는 “Facebook Groups 게시물의 40%가 거래 글”이라는 관찰에서 출발했다. Facebook Dating도 “프로필 조회의 60%가 친구가 아닌 이성 간”이라는 데이터에서 나왔다. Cowork는 “비엔지니어들이 터미널까지 와서 Claude Code로 비코딩 작업을 하더라”에서 나왔다.

06 / 사용 팁Claude Code를 더 잘 쓰는 세 가지

Cherny가 직접 권한 사용 팁은 단순하다.

가장 강한 모델을 쓰라

현재 그가 항상 켜두는 설정은 Opus 4.6 + maximum effort다. 직관과 반대지만, 약한 모델로 같은 작업을 시키면 토큰을 더 쓰면서도 결과가 더 늦게 나오는 경우가 많다고 한다. 모델 지능이 곧 토큰 효율이다.

Plan Mode로 시작하라

그는 작업의 약 80%를 plan mode로 시작한다. 터미널에서는 Shift+Tab 두 번. 데스크톱 앱·웹에는 전용 버튼이 있다. 메커니즘은 의외로 단순하다. 시스템 프롬프트에 “아직 코드를 쓰지 말라”는 문장 하나를 끼워 넣을 뿐이다. 모델과 계획을 합의한 뒤 실행으로 넘어가면, Opus 4.6 수준에서는 첫 시도에서 거의 한 번에 맞춘다고 한다.

인터페이스를 골라 쓰라

Claude Code는 동일한 에이전트가 다양한 표면에서 동작한다. 같은 모델·같은 도구가 터미널, 데스크톱 앱, iOS·Android 앱, Slack 통합, GitHub 통합 등 여러 진입점으로 노출돼 있다. 디자이너처럼 터미널이 부담스러운 사용자는 데스크톱 앱의 Code 탭을 쓰면 같은 능력을 GUI(그래픽 사용자 인터페이스)로 받을 수 있다. Cherny 본인의 코드도 1/3 터미널, 1/3 데스크톱 앱, 1/3 iOS 앱으로 갈려 있다.

비유 박스 — “일반인이 코딩한다”는 말의 진짜 의미

Go(고) 언어를 한 달간 써서 서비스 하나를 거의 다 만든 엔지니어에게 “Go 잘 하시네요?”라고 물었더니 “여전히 Go는 잘 모른다”는 답이 돌아왔다고 한다. 새로운 단계의 추상화가 자리잡을 때마다 같은 일이 일어났다. 1960년대 펀치카드를 알던 세대는 고급 언어 프로그래밍을 “진짜 코딩”으로 인정하지 않았고, 그 뒤로도 매번 그랬다. Cherny의 표현으로, “결과가 맞고 효율적이면 디테일을 다 알 필요가 없는” 단계가 또 한 번 온다는 뜻이다.

07 / 일하는 방식“언더펀딩”과 제너럴리스트

인터뷰의 마지막 큰 주제는 팀 운영이었다. 두 가지 사고가 두드러진다.

첫째, 의도적 언더펀딩(under-funding)이다. 자원이 부족할수록 사람들은 자동화에 의존하게 되고, 그 과정에서 AI 활용이 자연스러워진다. Cowork 자체가 “단 한 명의 인턴”에게 맡겨진 데서 출발해 빠르게 출시됐다. AI는 인력을 줄이기 위한 도구가 아니라, 인력을 줄인 상태에서 가장 큰 효과가 난다는 역설이 깔려 있다.

둘째, 제너럴리스트 우대다. Cherny가 가장 강한 동료로 꼽는 사람들은 분야를 넘나든다. Claude Code 팀에서는 프로덕트 매니저, 엔지니어링 매니저, 디자이너, 재무 담당, 데이터 사이언티스트가 모두 코드를 쓴다. 가장 강한 엔지니어들은 “프로덕트·인프라 겸업” 또는 “디자인 감각이 있는 엔지니어” 같은 하이브리드형이다. 그는 직함이 점차 흐려져 “software engineer” 대신 “builder”로 묶이는 흐름이 올해 안에 가시화될 것이라고 봤다.

가장 흔한 실패는 사람들이 상식(common sense)을 쓰지 않는 것이다. 프로세스를 그대로 따르고, 모멘텀에 휩쓸리고, 좋은 아이디어가 아닌데도 멈추지 않는다. Boris Cherny, 그가 가장 자주 인용하는 좌우명

08 / 끝맺음“이건 1% 끝난 것이다”

인터뷰 말미에서 Cherny는 두 가지를 강조했다. 하나는 안전성이 Anthropic의 존재 이유라는 점, 다른 하나는 지금이 매우 이른 시점이라는 점이다.

그는 “세계 인구의 대부분은 아직 Claude Code를 쓰지 않고, AI 자체를 쓰지 않는다”고 했다. 1년 만에 GitHub 커밋의 4%가 모델에서 나오는 일이 벌어졌지만, 그가 보기에 이 변화는 “1% 정도 끝난 상태”다. 1년 전 May 2025 시점에 그가 한 “연말에는 IDE 없이도 코딩하는 사람이 생긴다”는 예측이 청중을 술렁이게 했지만, 11월에 본인에게 그 일이 실제로 일어났다는 일화는 이 인터뷰 전체의 톤을 요약한다.

한편 그는 AI 이후 자기 삶을 묻자 “시골 일본에서 미소(된장)를 만드는 일”을 꼽았다. 흰 미소 한 배치는 최소 3개월, 붉은 미소는 2~4년이 걸린다. 매일같이 가속도 곡선을 쳐다보는 사람이, 시간 척도가 정반대인 작업에 끌리는 이유는 그 자체가 흥미로운 균형감각이다.

원문 출처: Lenny's Podcast, Boris Cherny(Anthropic Claude Code 책임자) 인터뷰. Claude Code 외부 공개 1주년 시점(2026년 봄) 진행.

본문 중 검증 가능한 사실:

「The Bitter Lesson」은 Rich Sutton이 2019년 3월 발표한 에세이.
Mechanistic interpretability 분야는 Chris Olah가 Anthropic을 중심으로 정착시켰다.
Anthropic 공동창업자들 중 다수가 OpenAI 시절 「Scaling Laws for Neural Language Models」(2020) 논문의 주요 저자.
GitHub 커밋의 4% 수치와 Spotify 사례는 인터뷰에서 Cherny가 인용한 보도(각각 Semianalysis 보고서, Spotify 헤드라인) 출처에 의거한다. 인터뷰 발언 그대로의 표현이며, 외부 보고서 원문에서 정확한 산정 기준은 별도 확인이 필요하다.