Stanford CS230 · Lecture 9

AI 시대의 커리어 조언 — 스탠퍼드 CS230 강의 정리

앤드루 응(Andrew Ng)과 로런스 모로니(Laurence Moroney)가 같은 무대에 섰다. 한 사람은 지금이 무언가를 만들기 가장 좋은 시대라고 말했고, 다른 한 사람은 그럼에도 채용 시장은 얼어붙어 있으며 거품이 다가오고 있다고 말했다. 두 메시지는 모순처럼 보이지만, 합치면 한 가지 결론으로 모인다.

강의 일자 2025년 11월 18일(구글 Gemini 3 공개일) · 연사 앤드루 응(DeepLearning.AI 창립자, 스탠퍼드 겸임교수), 로런스 모로니(AI 저술가, 현 Arm 소속) · 진행 키안 카탄포루시(Kian Katanforoosh, Workera CEO)

앤드루 응 — 지금이 만들기 가장 좋은 시대인 이유
로런스 모로니 — 채용 시장의 현실과 신뢰받는 조언자
바이브 코딩과 기술 부채
하이프(hype)를 가르는 법
거품은 온다 — 그리고 살아남는 자
큰 AI와 작은 AI의 분기
맺음말 — 실천 정리

이 강의는 두 사람의 발표를 이어 붙인 구성이다. 앞부분에서 앤드루 응은 기술의 흐름과 빌더(builder)의 관점에서 낙관론을 펼쳤고, 뒷부분에서 로런스 모로니는 채용 시장과 산업 현장의 냉정한 진단을 내놓았다. 아래 정리는 두 발표의 핵심 논지를 주제별로 재구성하고, 강의에서 언급된 수치와 사례는 공개 자료로 사실관계를 확인해 필요한 부분을 바로잡은 것이다. 인용한 통계의 출처와 수정 사항은 글 끝의 주(註)에 모았다.

1부 · 앤드루 응 — 지금이 만들기 가장 좋은 시대인 이유

AI 발전은 정체되고 있는가

강의 몇 달 전부터 "AI 발전이 둔화된 것 아니냐"는 질문이 언론과 소셜 미디어에 떠돌았다. 응은 이 질문이 나오는 한 가지 이유를 지적한다. 벤치마크의 만점이 100%라면, 빠르게 발전한 모델은 어느 순간 100% 위로 올라갈 수 없게 되어 마치 진보가 멈춘 것처럼 보인다는 것이다. 점수의 천장에 부딪힌 것을 능력의 천장으로 오해하는 셈이다.

그가 자신의 생각에 가장 큰 영향을 주었다고 말한 연구는 비영리 평가기관 METR(Model Evaluation and Threat Research)의 작업이다. METR은 AI의 능력을 점수가 아니라 "사람이 하면 얼마나 걸리는 작업까지 AI가 자율적으로 끝낼 수 있는가", 즉 작업의 길이로 측정했다. 몇 해 전 GPT-2는 사람이 몇 초면 끝낼 일을 처리했고, 이후 모델들은 4초, 8초, 1분, 2분, 4분으로 다룰 수 있는 작업의 길이를 늘려 왔다.

METR는 사람이 50% 신뢰도로 완수하는 데 걸리는 시간으로 작업 길이를 정의하고, 프런티어 모델이 자율적으로 해내는 작업 길이를 측정했다. 세로축이 로그 척도라는 점이 핵심이다. 지수 성장은 로그 축에서 직선으로 나타난다. 수치는 강의 취지를 보이기 위한 모식도이며 정확한 데이터 점이 아니다.¹

METR의 결론은 이렇다. AI가 자율적으로 끝낼 수 있는 작업의 길이가 약 7개월마다 두 배로 늘어 왔으며, 이 추세는 지난 6년간 일관되게 이어졌다. 응은 코딩 작업에 한정하면 더블링 주기가 더 짧다고 덧붙였다. 그가 언급한 70일이라는 수치는 데이터 부분집합과 측정 구간에 따라 달라지는 추정치로, METR가 후속 분석에서 최근 구간의 더블링이 더 빨라졌다고 보고한 것과 같은 방향의 이야기다. 요점은 단순하다. 점수의 천장에 가렸을 뿐, 능력의 곡선은 계속 가팔라지고 있다.

핵심 메시지

벤치마크 점수가 100%에 수렴한다고 발전이 멈춘 것이 아니다. AI가 다룰 수 있는 작업의 길이는 여전히 빠르게 두 배씩 늘고 있다.

더 강력하게, 그리고 더 빠르게

응이 지금을 "만들기 가장 좋은 시대"라고 부르는 근거는 두 가지로 압축된다. 더 강력하게, 그리고 더 빠르게.

첫째, 더 강력하게. 이제는 대형 언어 모델(LLM, Large Language Model), 에이전트 워크플로(agentic workflow), 음성 AI, 딥러닝 같은 구성 요소를 조합해 1년 전에는 지구상 누구도 만들 수 없었던 소프트웨어를 만들 수 있다. 흥미로운 점은 LLM 스스로가 딥러닝에 대한 기본 이해를 갖추고 있어서, 프런티어 모델에게 트랜스포머 신경망을 구현해 달라고 요청하면 꽤 쓸 만한 결과를 내놓는다는 것이다. 도구가 도구를 만드는 셈이다.

둘째, 더 빠르게. AI 코딩 덕분에 같은 소프트웨어를 쓰는 속도가 과거와 비교할 수 없이 빨라졌다. 응은 도구의 최전선에 머무는 것이 중요하다고 강조했다. 그가 꼽은 개인적 선호 도구는 몇 달 사이 Claude Code로 옮겨 갔고, GPT-5 출시 이후 OpenAI Codex가 크게 발전했으며, 강의 당일 아침 공개된 Gemini 3 역시 또 한 번의 도약으로 보인다고 했다. 그는 "AI 코딩 도구는 3개월마다, 적어도 6개월마다 개인적 1순위가 바뀐다"며, 반세대만 뒤처져도 생산성이 눈에 띄게 떨어진다고 말했다.

병목은 "무엇을 만들지"로 옮겨간다

코드를 쓰는 일이 싸지고 빨라지면, 병목은 역설적으로 다른 곳으로 이동한다. 명확한 명세(spec)에서 코드로 가는 길이 쉬워질수록, 진짜 어려운 일은 무엇을 만들지 결정하고 그 명세를 잘 쓰는 일이 된다. 응은 이를 제품 관리(PM, Product Management) 병목이라고 불렀다.

그가 소프트웨어를 만드는 방식은 하나의 반복 루프다. 코드를 짜서 사용자에게 보여 주고, 피드백을 받아 무엇이 좋고 나빴는지 판단을 고치고, 만들 대상에 대한 생각을 바꾼 뒤 다시 코드를 짠다. 이 루프를 여러 번 돌며 사용자가 사랑하는 제품으로 수렴시킨다. AI 코딩이 이 루프의 코딩 구간을 압축하면서, 가치는 "사용자를 이해하고 무엇을 만들지 정하는" 구간에 집중된다.

그 결과 실리콘밸리에서 오래 회자되던 엔지니어 대 PM 비율이 내려가고 있다. 전통적으로 PM 한 명이 엔지니어 4~8명을 바쁘게 만들 수 있다고들 했지만, 엔지니어링은 AI로 빨라진 반면 제품 관리는 그만큼 빨라지지 않았다. 응이 함께 일하는 일부 팀은 PM 한 명에 엔지니어 한 명이라는, 전통적 실리콘밸리에서는 보기 드문 구성을 제안하기도 했다.

엔지니어링이 AI로 빨라지면서 엔지니어 대 PM 비율이 1:1 수준까지 내려오고, 사용자와 대화하며 무엇을 만들지 스스로 정하는 엔지니어가 가장 빠르게 움직인다.

응은 한 걸음 더 나아가, 엔지니어와 PM이 한 사람으로 합쳐지는 흐름을 본다고 했다. 코드를 짤 줄 알면서 사용자와 대화해 무엇을 만들지 스스로 결정하는 엔지니어가 오늘날 실리콘밸리에서 가장 빠르게 움직인다는 것이다. 다만 그는 솔직한 단서를 달았다. 과거 한 직책에서 그는 엔지니어들에게 제품 일을 더 하라고 밀어붙였다가, 훌륭한 엔지니어들이 "제품 관리에 서툴다"는 자괴감을 느끼게 만든 적이 있고 이를 오래 후회했다고 했다. 모든 엔지니어가 사용자와 대화하는 일을 즐기는 것은 아니다. 그럼에도 그 일까지 해내는 엔지니어가 더 빨리 나아간다는 관찰은 분명하다고 말했다.

함께하는 사람이 가장 강한 예측 변수다

커리어를 항해할 때 학습 속도와 성공 수준을 가장 강하게 예측하는 변수로 응은 "주변에 두는 사람"을 꼽았다. 가장 가까운 친구 다섯 명이 흡연자라면 본인이 흡연자일 확률이 높다는 사회학 연구가 있는데, 같은 논리로 가까운 사람들이 부지런하고 빨리 배우며 세상을 더 낫게 만들려는 이들이라면 본인도 그렇게 될 가능성이 높다는 것이다.

그가 스탠퍼드의 강점으로 든 것은 단순한 명성이 아니라 연결 조직(connective tissue)이었다. 프런티어 연구실에서 일하는 상당수가 스탠퍼드 교수들의 옛 제자이고, 그 관계망 덕분에 아직 인터넷에 공개되지 않은 최전선의 노하우가 한두 통의 전화로 전해진다. 누군가 기술적 방향을 고민할 때 연구 현장에 가까운 사람과의 짧은 대화가 프로젝트의 아키텍처 선택을 바꾸곤 한다는 것이다.

핵심 메시지

회사 로고의 화려함이 아니라, 매일 함께 일하는 사람에게서 배운다. 따라서 팀을 회사 브랜드보다 우선해서 선택하라.

이 대목에서 그는 같은 수업에서 여러 번 반복했다는 이야기를 꺼냈다. 한 우수한 스탠퍼드 학생이 인기 있는 AI 브랜드 회사에서 합격 통지를 받았는데, 그 회사는 어떤 팀에 배치될지 끝내 알려 주지 않았다. "일단 사인부터 하면 좋은 프로젝트를 찾아 주겠다"는 식이었다. 입사 후 그는 결제 백엔드 자바(Java) 시스템에 배치됐고, 1년쯤 좌절하다 회사를 떠났다. 더 씁쓸한 것은, 응이 이 이야기를 강의에서 한 뒤 몇 해 지나 또 다른 학생이 같은 회사에서 비슷한 경험을 했다는 점이다. 그는 회사가 배치될 팀을 알려 주지 않는 것 자체가 경계 신호라고 봤다. 브랜드가 덜 화려해도 부지런하고 똑똑한 사람들이 모인 팀에 들어가는 편이 배움과 성장에 낫다는 결론이다.

책임감 있게, 그리고 열심히

응의 1순위 조언은 "그냥 만들어라"였다. 강력한 소프트웨어를 빠르게 만들 수 있게 된 만큼, 실패 비용은 과거보다 훨씬 낮다. 주말 하나를 쓰고 무언가를 배운다면 그것으로 충분하다는 것이다. 다만 그는 책임감을 전제로 달았다. 남에게 해를 끼치는 것을 만들지 말되, 그 선만 지킨다면 허락을 기다릴 필요 없이 시도하라고 했다. 세상에는 만들 아이디어가 그것을 구현할 사람보다 훨씬 많아서, 본인이 만들지 않으면 아무도 만들지 않을 프로젝트가 많다는 관찰이 근거였다.

그는 일부에서 정치적으로 올바르지 않다고 여겨질 수 있다면서도 "열심히 일하라"고 권했다. 단, 출산 직후나 부상, 장애 등 열심히 일할 수 없는 처지의 사람들은 존중하고 지원해야 한다는 단서를 분명히 달았다. 그 위에서, 만약 열심히 일할 수 있는 처지라면 지금처럼 기회가 많은 때에 저녁과 주말에 코딩하고 사용자 피드백을 받는 일에 몰입하는 것이 성공 확률을 높인다고 했다. 그는 한 가지 사족을 붙였다. 무의미한 TV 프로그램을 보는 것과 주말에 에이전트 코더를 돌려 무언가를 시도하는 것 사이라면, 거의 매번 후자를 택하겠다고.

2부 · 로런스 모로니 — 채용 시장의 현실과 신뢰받는 조언자

모로니는 35년 가까이 마이크로소프트, 구글, 로이터, 여러 스타트업을 거친 인물이다. 그는 응이 말한 "함께하는 사람이 중요하다"는 명제를 면접관의 시점에서 뒤집어 보였다. 회사도 당신을 고르고 있으며, 좋은 회사일수록 함께 일할 사람을 신중히 고른다는 것이다.

면접에서 거듭 떨어진 "10배 엔지니어"

그가 멘토링한 한 청년은 명문 교육과 뛰어난 경력을 갖춘 엘리트 코더였다. 4월에 의료 소프트웨어 직장에서 정리해고를 당했고, 그 직전 연인과 헤어졌으며, 몇 주 뒤 키우던 개가 죽었다. 능력을 믿었던 그는 재취업이 쉬울 줄 알았지만, 300곳이 넘는 지원처를 스프레드시트로 관리하며 메타(Meta), 마이크로소프트 등 대형 기술 기업의 면접 루프 끝까지 갔다가도 번번이 하루 만에 불합격 통보를 받았다.

모로니가 모의 면접을 진행하며 어려운 리트코드(LeetCode) 문제와 코드의 까다로운 예외 사례를 던지자 원인이 드러났다. 청년은 채용 안내서에 흔히 적힌 "의견을 굽히지 말고 줏대를 가지라"는 조언을 글자 그대로 받아들여, 면접에서 지나치게 공격적이고 적대적인 태도를 보이고 있었다. 코딩 실력은 흠잡을 데 없었지만, 면접관 입장에서는 이런 태도의 사람을 자기 팀 근처에 두고 싶지 않았던 것이다. 태도를 다듬은 뒤 그는 팀워크를 중시하는 회사에 합격해 직전 연봉의 두 배를 받게 됐다.

핵심 메시지

줏대를 갖되 무례하지는 말 것. 회사도 함께 일할 사람을 고르고 있으며, 태도는 실력만큼 평가된다.

채용 시장은 왜 이렇게 됐나

모로니는 지금의 얼어붙은 신입 채용 시장을 한 줄로 진단하지 않고, 최근 몇 년의 흐름으로 설명했다. 그가 강조한 단어는 "느낌(feels)"이었다. 신입 자리가 없는 것처럼 느껴지지만, 실제로 부족한 것은 자리가 아니라 자리와 사람의 좋은 짝짓기라는 것이다.

팬데믹기 채용 동결로 밀린 수요가 2022~23년 AI 붐과 겹치며 과잉 채용을 낳았고, 2024~25년에는 그 과잉을 되돌리는 재조정이 진행되고 있다.

흐름은 이렇다. 팬데믹기에 모든 산업이 채용을 동결했다. 2022~23년 그 억눌린 수요가 한꺼번에 풀리는 동시에 AI가 폭발하면서, 기업들은 인재 확보 경쟁에 뛰어들어 과잉 채용을 했다. 이력서에 AI만 적혀 있으면 자격을 충분히 따지지 않고 데려가는 일이 흔했다. 그리고 2024~25년, 기업들은 그렇게 뽑은 인력 상당수가 직무에 맞지 않는다는 사실을 깨닫고 대대적으로 재조정에 들어갔다. 그 결과 지금은 AI 역량을 훨씬 까다롭게 본다. 모로니의 결론은 비관이 아니다. 이 맥락을 이해하고 전략적으로 접근하면 기회는 여전히, 그것도 크게 남아 있다는 것이다.

성공의 세 기둥

모로니는 AI 업계에서 통하는 성공의 세 기둥을 제시했다. 이제는 보유한 역량을 말하는(tell) 것을 넘어 보여 주어야(show) 하며, 코드를 즉석에서 만들어 낼 수 있는 지금이 보여 주기에는 역사상 가장 좋은 때라고 했다.

깊은 이해. 두 가지를 뜻한다. 하나는 머신러닝과 모델 구조를 학문적으로 이해하고 논문을 읽어 현장에 적용할 수 있는 능력이고, 다른 하나는 특정 흐름의 맥을 짚어 신호와 잡음을 가려내는 감각이다.
비즈니스 포커스. 그는 노력을 시간이 아니라 산출물로 측정하라고 했다. "9시부터 9시까지 주 6일(996)"은 노력의 척도가 아니라 시간의 척도일 뿐이다. 여덟 시간을 일하든 여섯 시간을 일하든, 무엇을 만들어 냈는지가 노력이다.
실행 편향. "아이디어는 싸고, 실행이 전부다." 막연한 아이디어로 면접에 온 사람과 반쯤 익은 아이디어라도 탄탄히 구현해 온 사람 중 누가 합격하는지는 분명하다.

가진 직무가 아니라 원하는 직무를 위해 산출물을 만들어라. 로런스 모로니 — "원하는 직무를 위해 옷을 입어라"라는 격언을 산출물에 적용한 표현

그는 자신의 사례를 들었다. 구글 면접에 두 번 떨어진 뒤, 세 번째에는 막 출범한 클라우드 팀에 맞춰 자바로 주가 예측 애플리케이션을 직접 만들어 이력서에 코드를 넣었다. 면접은 "버스에 골프공이 몇 개 들어가나" 같은 질문 대신 그가 만든 코드를 두고 진행됐다. 주도권이 그에게 넘어온 것이다. 참고로 그는 PM 면접에서는 떨어지고 엔지니어 면접에서는 합격했는데, 응이 말한 "엔지니어가 PM 일에 서툴 수 있다"는 점과도 맞닿는 일화다.

"쿨한 것"에서 "쓸모 있는 것"으로

2~3년 전만 해도 이미지 분류기 하나를 만들 줄 알면 여섯 자리 연봉과 막대한 주식을 제안받았다. 지금은 다르다. 모로니가 강조한 단어는 P로 시작하는 production, 즉 운영(실서비스 투입)이다. 새 모델을 만들든, 모델을 최적화하든, 사용자를 이해하든, 모든 것이 운영으로 수렴한다. 그는 "쿨한 것을 만들던" 시대에서 "쓸모 있는 것을 만드는" 시대로 넘어왔다고 했다. 쓸모에 집중하면 멋짐은 따라온다는 것이다.

현장의 현실로 그는 세 가지를 들었다. 첫째, 비즈니스 포커스는 협상 불가다. 지난 10년간 큰 기업들은 직원이 자기 자신을 온전히 회사에 가져오도록 장려했고, 그것이 사내 행동주의로 번진 사례도 있었다. 모로니는 행동주의 자체나 정의를 지지하는 일에는 아무 문제가 없다고 분명히 선을 그으면서도, 그것이 비즈니스보다 앞서도록 과도하게 기울었던 진자가 지금은 반대 방향으로 돌아오고 있다고 진단했다. 둘째, 위험 완화가 업무의 일부다. 어떤 업무 과정을 AI 기반으로 바꿀 때의 위험을 이해하고 완화하는 사고방식이야말로 면접에서 가장 강력한 무기라고 했다. 셋째, 책임(responsibility)의 정의가 진화하고 있다.

◆ 사례 · 책임의 정의가 진화한다는 것

제미나이 이미지 생성의 역설

모로니가 든 사례는 몇 해 전 구글 제미나이(Gemini)의 이미지 생성 사고다. 학습 데이터에 의사는 남성, 간호사는 여성이 많으면 모델은 그 편향을 그대로 재생산한다. 이를 막으려는 의도는 옳았다. 그러나 구현이 미숙했다. 그가 같은 프롬프트로 아시아계, 인도계, 흑인, 라틴계 여성을 요청했을 때는 잘 작동했지만, "백인(Caucasian/white)"을 요청하자 "해로운 고정관념을 강화할 수 있다"며 생성을 거부했다. 특정 단어를 막는 조잡한 안전 필터였던 것이다.

그가 "아일랜드 여성"을 요청해 우회하자 모델은 모든 이미지에 빨간 머리를 그렸다. 아일랜드의 빨간 머리 비율이 세계에서 가장 높은 것은 사실이지만 약 8%에 불과하다. 특정 민족을 한 가지 머리색과 묶는 순간 그 자체가 또 다른 고정관념이 된다. 좋은 의도로 만든 좁은 정의의 "책임"이 모델과 회사의 평판을 동시에 해친 것이다.

모로니의 결론은 이렇다. AI에서 책임은 "모두를 위해 작동하게 하자"는 막연한 사회적 구호에서, "먼저 제대로 작동하고 비즈니스를 굴러가게 한 다음, 모두를 위해 작동하게 하자"는 단단한 우선순위로 옮겨 가고 있다. 그리고 누구나 실수하므로, 실수에서 배우고 동료의 실수에 관용을 베푸는 능력이 현장의 현실적 자질이다.

3부 · 바이브 코딩과 기술 부채

코드를 프롬프트로 찍어 내는 일, 이른바 바이브 코딩(vibe coding)이 엔지니어를 쓸모없게 만든다는 밈이 돈다. 모로니는 그 반대라고 봤다. 엔지니어로서 숙련될수록 이 방식을 더 잘 쓴다는 것이다. 그가 권하는 자세는 상대에게 신뢰받는 조언자(trusted advisor)가 되는 것이고, 그러려면 생성된 코드의 함의를 이해해야 하며, 그 함의를 엔지니어보다 잘 이해할 사람은 없다고 했다. 그가 쓰는 잣대는 기술 부채(technical debt)다.

▣ 비유 · 좋은 부채와 나쁜 부채

기술 부채는 돈의 부채와 똑같이 생각하면 된다. 50만 달러를 빌려 집을 사면 30년간 이자까지 약 100만 달러를 갚지만, 그동안 집값은 오르고 월세도 나가지 않으니 받는 가치가 갚는 빚보다 크다. 좋은 부채다. 반대로 고금리 신용카드로 충동구매한 200달러짜리 신발은 다 갚으면 500달러가 되는데, 신발에서 500달러어치 가치가 나오지는 않는다. 나쁜 부채다.

코드도 같다. 무엇을 만들든 부채가 따라온다. 버그, 유지보수, 문서화, 새 요구사항, 마케팅까지 전부 갚아야 할 빚이다. 부채를 피하는 유일한 길은 아무것도 만들지 않는 것뿐이다. 그러니 질문은 "이 코드를 찍어 낼까"가 아니라 "이 코드가 떠안는 기술 부채만큼의 가치가 있는가"여야 한다.

같은 양의 코드라도 명확한 목표·비즈니스 가치·사람이 이해할 수 있는 구조를 갖추면 좋은 부채가 되고, 그렇지 못하면 갚을수록 손해인 나쁜 부채가 된다.

좋은 기술 부채와 나쁜 기술 부채를 가르는 기준으로 그는 세 가지를 들었다. 첫째, 목표가 명확하고 충족됐는가. 무작정 코드를 쏟아 내지 말고 무엇을 만들지 알고 시작하라는 것이다. 그는 자신의 영화 제작 스타트업에서 애플리케이션을 만들고 버리고 다시 만들기를 반복하며 매번 요구사항을 다듬었는데, 코드가 싸진 시대에는 버리는 것도 학습이라고 했다. 둘째, 비즈니스 가치가 나오는가. 몇 시간씩 바이브 코딩으로 멋진 웹사이트를 만들어 놓고 "그래서 어쩌라고(so what)"라는 질문에 답하지 못하는 경우가 많다는 것이다. 셋째, 사람이 이해할 수 있는가. 가장 나쁜 기술 부채는 본인만 이해하는 코드를 남기고 떠나는 것이다. 변수명까지 신경 써 문서화하고 알고리즘을 명료하게 유지하는 일이 나쁜 부채를 피하는 길이다.

그가 특히 경계한 나쁜 부채는 "문제를 찾아다니는 솔루션", 마구잡이로 만들어져 좋은 것과 나쁜 것을 구분하기 어렵게 만드는 스파게티 코드, 그리고 메리트가 아니라 권위로 들어온 코드다. 코드를 한 줄도 써 본 적 없는 임원이 도구를 결제하고 무언가를 만들어 놓으면, 그것을 고치는 일은 결국 엔지니어의 몫이 된다는 농담 섞인 현실이다.

4부 · 하이프(hype)를 가르는 법

모로니는 하이프를 우주에서 가장 강한 힘 중 하나라고 농담했다. AI와 암호화폐처럼 뜨거운 분야일수록 헛소리가 넘친다는 것이다. 그가 짚은 하이프의 해부학은 단순하다. 소셜 미디어의 화폐는 정확성이 아니라 참여(engagement)다. 링크드인(LinkedIn)조차 인플루언서들이 AI로 자극적인 글을 써서 좋아요를 얻는 곳이 됐고, 알고리즘이 그런 글을 보상하면서 눈덩이처럼 불어난다.

핵심 메시지

소셜 미디어는 정확성이 아니라 참여를 보상한다. 신호와 잡음을 가려내고, 주변 사람을 신호 쪽으로 이끄는 사람이 일대일 환경에서 매우 가치 있어진다.

에이전트 사례 — "왜"부터 묻기

한 유럽 기업이 모로니에게 "에이전트를 구현해 달라"고 요청했다. 그가 던진 첫 질문은 "왜?"였다. CEO는 링크드인과 트위터에서 에이전트가 비용을 줄여 준다는 글을 보았다고 답했다. 질문을 거듭 벗겨 내자 진짜 목적이 드러났다. AI도 에이전트도 아닌, "영업사원을 더 효율적으로 만들고 싶다"는 것이었다.

영업사원들에게 무엇이 가장 싫으냐고 묻자, 상담 전 회사와 인물을 조사하는 일이라고 답했다. 사이트마다 구조가 달라 인지 부하가 크고, 시간의 약 80%를 조사에, 20%만 실제 영업에 쓰고 있었다. 대부분 수당으로 버는 영업사원에게 이는 직접적 손해였다. 그래서 목표를 "영업사원을 20% 더 효율적으로"로 잡은 다음에야 비로소 AI와 에이전트를 꺼냈다.

에이전트형 AI는 결국 네 단계로 분해된다. 의도를 이해하고, 가용 도구로 계획을 세우고, 도구로 실행하고, 결과를 의도와 견주어 반성한다. 어떤 문제든 이 네 단계로 쪼개는 것이 에이전트를 만드는 출발점이다.

모로니는 에이전트형 AI를 네 단계로 정리했다. 의도 이해, 계획, 도구 실행, 반성이다. LLM이 가장 잘하는 것은 사실 "이해"여서, 첫 단계에서 작업의 의도를 파악하게 하고, 가용 도구를 선언해 계획을 세우게 하며, 도구로 결과를 만든 뒤, 결과가 의도를 충족했는지 되돌아보고 아니면 루프를 다시 돈다. 그가 만든 파일럿은 영업사원의 낭비 시간을 10~15% 줄였고, 영업이 늘어 수입이 오르자 직무 만족까지 높아지는 부수 효과를 낳았다. 하이프에 끌려 무작정 에이전트를 만들었다면 길을 잃었을 일이다.

그는 이 대목에서 "기업 AI 프로젝트의 약 85%가 실패한다"는 보고를 인용했다. 가장 널리 인용되는 2025년 자료는 그가 떠올린 수치와 출처가 조금 다른데, MIT의 조사로 기업 생성형 AI 파일럿의 약 95%가 손익에 측정 가능한 영향을 내지 못했다는 것이다. 어느 쪽이든 요지는 같다. 실패의 주된 이유는 모델 성능이 아니라 범위 설정과 통합 전략의 부재, 즉 하이프에 올라타 문제를 제대로 이해하지 못한 데 있다.²

"가능한 한 평범하게 만들어라"

모로니가 한때 코칭받은 조언 하나는 처음엔 틀린 말처럼 들렸지만 결국 옳았다. 하이프를 마주하면 그것을 가능한 한 평범하게(mundane) 만들어 보라는 것이다. 텍스트로 영상을 만든다는 마법 같은 이야기도, 평범하게 풀면 "연속된 프레임을 한 장씩 예측해 잇는 일"이다. 모델은 1번 프레임에서 손이 이렇게 있고 2번에서 저렇게 있으면 이렇게 움직인다고 예측하도록 영상으로 학습됐을 뿐이다. 이렇게 평범하게 내려놓으면 비로소 사람들이 이해하기 시작하고, 그 분야의 비기술 전문가들이 거기서 멋진 일을 해낼 수 있게 된다. 거꾸로 "프롬프트 하나로 마인크래프트 클론을 만들었다"는 식의 과시는 평범함의 정반대다. 대개 화려한 데모일 뿐 실제로 그것을 만든 것은 아니다.

5부 · 거품은 온다 — 그리고 살아남는 자

모로니는 앞에 위험이 있다고 했다. 뉴스에 오르내리는 그 단어, 거품(bubble)이다. 그는 타이타닉의 한 장면을 비유로 들었다. 망대(crow's nest)의 두 견시원은 추위 이야기만 나누고 있었고, 정작 그들에게 쌍안경은 지급되지 않았다. 앞으로 나아가는 일에만 도취해 위험을 살필 채비를 갖추지 않은 모습이 지금의 AI 산업과 닮았다는 것이다.

그러나 그의 결론은 비관이 아니다. 역사상 가장 큰 거품이었던 2000년대 닷컴 거품도 터졌지만 우리는 여전히 여기 있다. 닷컴을 제대로 한 아마존과 구글은 살아남았을 뿐 아니라 번성했다. 거품의 본질을 이해하고 비즈니스의 기초를 갖춘 곳은 하이프가 꺼져도 함께 꺼지지 않는다. 반면 "만들면 사람들이 올 것"이라는 막연한 믿음으로 슈퍼볼 광고까지 했던 펫츠닷컴(Pets.com) 같은 곳은 거품과 함께 증발했다.

모로니가 그린 거품의 해부학. 꼭대기의 하이프가 비현실적 기업가치와 미투 제품, 막대한 VC 투자를 떠받친다. 정작 진짜 가치는 작은 핵에 있고, 그 핵을 위해 짓는 이들이 거품 이후 살아남는다. 그는 VC 투자가 이미 줄기 시작했다고 덧붙였다.

모로니는 AI 거품의 구조를 피라미드로 그렸다. 꼭대기에 하이프, 그 아래로 비현실적 기업가치, 미투 제품, 그리고 바닥에 막대한 벤처캐피털(VC, Venture Capital) 투자가 있다. 그는 이 투자가 이미 줄기 시작했다고 했다. 한때 AI라고 적혀 있으면, 그다음엔 LLM이면 무엇이든 투자를 받았지만 지금은 훨씬 신중하다는 것이다. 정작 진짜 가치는 피라미드 속 작은 핵에 있고, 그 핵을 향해 짓는 이들이 거품이 터진 뒤 살아남고 번성한다는 것이 그의 메시지다.

6부 · 큰 AI와 작은 AI의 분기

모로니가 향후 5년의 방향으로 본 것은 분기(bifurcation)다. 그는 이를 큰 AI와 작은 AI로 거칠게 나눴다.

큰 AI는 외부가 호스팅하는 대형 모델로 AGI를 지향하며 계속 커진다. 작은 AI는 직접 호스팅하는 오픈 웨이트·온디바이스 모델로, 작은 모델이 빠르게 똑똑해지면서 다운스트림 과제에 파인튜닝하는 역량이 중요해진다.

큰 AI는 외부가 대신 호스팅하는 대형 모델이다. 제미나이, 클로드(Claude), 오픈AI가 더 큰 모델로 인공일반지능(AGI, Artificial General Intelligence)을 향해 계속 커진다. 작은 AI는 직접 호스팅할 수 있는 모델이다. 모로니는 오픈소스라는 말 대신 오픈 웨이트(open weights) 또는 자체 호스팅 가능 모델이라 부르기를 선호했다. 그는 와이콤비네이터(Y Combinator) 기업의 약 80%가 특히 중국발 소형 모델을 쓴다는 글을 읽었다며, 이 분기가 진행 중이라고 봤다.

그가 든 구체적 사례는 할리우드다. 그는 영화 스튜디오와 일하며 지식재산(IP, Intellectual Property) 보호가 얼마나 극단적인지 체감했다. 대형 언어 모델의 진짜 기회는 창작보다 분석에 있다고 그는 봤다. 어떤 영화가 왜 흥행했고 어떤 영화는 왜 실패했는지, 어느 시기에 개봉했는지를 시놉시스로 분석하는 일은 마진이 박한 영화 산업에 큰 가치다. 그러나 그러려면 영화의 세부를 모델과 공유해야 하는데, 스튜디오는 제3자인 GPT나 제미나이에 자사 IP를 넘기지 않는다. 여기서 자체 호스팅 소형 모델이 답이 된다. 법률 사무소, 의료 기관처럼 프라이버시가 중요한 곳도 마찬가지다. 그래서 그는 오픈 웨이트 모델을 다운스트림 과제에 파인튜닝(fine-tuning)하는 역량이 향후 2~3년간 근본적으로 중요해진다고 했다.

◆ 사례 · AI는 GPU 위에만 있다는 습관 깨기

모로니가 Arm에서 하는 일과 닿는 대목이다. 전통적으로 AI 연산은 CPU와 GPU의 조합으로 여겨졌지만, 모바일에서는 SME(Scalable Matrix Extensions)라는 기술로 AI 워크로드를 CPU에서 돌리는 혁신이 일어나고 있다. 별도의 칩이 전력과 공간을 더 쓰지 않아도 되고, 저전력 CPU에서 AI를 돌릴 수 있다는 것이다.

그가 든 예는 알리페이(Alipay)다. 사진 속에서 특정 장면을 검색해 슬라이드쇼를 만드는 기능은 보통 사진을 제3자 서버에 올려야 한다. 여기엔 세 가지 문제가 있다. 프라이버시(사진 공유), 지연(업로드·처리·다운로드), 그리고 클라우드 서비스 구축 비용이다. 이 모든 것을 기기 안에서 처리하면 세 문제가 한꺼번에 풀린다. 애플(Apple)이 A·M 시리즈 칩의 신경 코어로 같은 방향에 투자해 온 것도 같은 맥락이다. 모델이 작아지고 저전력 기기가 그것을 돌릴 수 있게 되면서, 어디에나 지능이 깃드는 일은 더 이상 공상이 아니라는 것이 그의 전망이다.

NVIDIA처럼 매우 구체적인 한 가지 문제에 맞는 인재를 뽑는 회사도 있다는 청중 질문에 그는 그래도 역량을 다변화하라고 답했다. 한 가지 좁은 시나리오에 모든 것을 거는 것은 한 바구니에 달걀을 담는 일이라는 것이다. 그가 말한 다변화는 LLM이냐 컴퓨터 비전이냐의 문제가 아니다. 모델을 다루는 지식은 하나의 단일 역량일 뿐이고, 그 위에서 애플리케이션을 만들고 확장하며 사용자 경험(UX, User Experience)을 설계하는 능력으로 넓혀 가라는 뜻이다.

맺음말 · 실천 정리

모로니는 두 가지 인상적인 일화로 마무리했다. 시리아 출신 청년은 텐서플로(TensorFlow) 자격증을 따 독일로 이주해 가족을 전쟁 지역에서 빼낼 수 있었고, 학교를 일찍 그만둔 그의 아이스하키 선수 친구는 챗GPT(ChatGPT)로 비영리 단체의 분기 보고서를 직접 만들어 연 15만 달러의 컨설팅 비용을 아껴 그 돈을 아이들의 장비와 교습에 돌렸다. 기술적이지 않은 사람에게도 초능력이 쥐어진 사례들이다. 그가 AI에 대해 가장 놀란 점으로 꼽은 것은 하이프가 의사결정자들마저 그토록 휩쓸었다는 사실, 그리고 장기적 이익보다 즉각적 수익을 좇는 경향이었다.

두 발표를 합치면 메시지는 하나로 모인다. 만들 도구는 그 어느 때보다 강력하고 빠르며, 그래서 진짜 경쟁력은 무엇을 만들지 정하고, 비즈니스 가치로 연결하고, 하이프에서 신호를 가려내는 데 있다. 강의에서 끌어낼 수 있는 실천 항목을 정리하면 다음과 같다.

그냥 만들어라. 실패 비용은 낮아졌다. 다만 남에게 해를 끼치지 않는 선은 지킨다.
도구의 최전선에 머물러라. AI 코딩 도구는 분기 단위로 바뀐다. 반세대만 뒤처져도 생산성이 떨어진다.
사용자와 대화하라. 무엇을 만들지 스스로 정하는 엔지니어가 가장 빨리 움직인다.
회사 브랜드가 아니라 팀을 보라. 매일 함께 일하는 사람에게서 배운다.
가진 직무가 아니라 원하는 직무를 위한 산출물을 만들어 보여 줘라.
코드를 찍기 전에 물어라. 이 코드가 떠안는 기술 부채만큼의 가치가 있는가.
하이프를 만나면 "왜"부터, 그리고 "가능한 한 평범하게" 풀어 신호를 가려내라.
역량을 다변화하라. 모델 지식 위에 애플리케이션·확장·UX를 더하고, 작은 AI와 파인튜닝에 주목하라.

모로니가 사회적 평등에 관한 마지막 질문에 답한 말이 두 발표를 관통한다. 도구는 선택하지 않으며, 결국 사람이 어떻게 쓰느냐의 문제라는 것. 그는 좋은 의도를 가정하되 나쁜 의도에 대비하며 살아간다고 했다. 지금이 만들기 가장 좋은 시대라는 낙관과, 거품과 잡음에 대비하라는 경계는 그렇게 한 자세 안에 함께 들어간다.

주(註) · 출처와 사실관계 확인

METR(Model Evaluation and Threat Research), 2025년 3월. AI가 50% 신뢰도로 완수하는 작업 길이가 약 7개월마다 두 배로 늘었다는 분석. 강의에서 언급된 "코딩 70일 더블링"은 데이터 부분집합·측정 구간에 따른 더 빠른 추정치로, METR는 후속 업데이트(2026년 1월)에서 2023년 이후 더블링 주기를 약 130일(4.3개월)로 추정했다. 본문 그래프의 데이터 점은 취지를 보이기 위한 모식도다. 출처: metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks
강연자는 "McKinsey, 약 85%"로 언급했으나, 2025년 가장 널리 인용된 자료는 MIT NANDA 이니셔티브의 "The GenAI Divide: State of AI in Business 2025"로, 기업 생성형 AI 파일럿의 약 95%가 손익에 측정 가능한 영향을 내지 못했다는 내용이다. 두 수치는 출처가 다르나, 실패의 주원인이 모델 성능이 아니라 통합·범위 설정에 있다는 결론은 같다.
강의 일자는 구글 Gemini 3 공개일인 2025년 11월 18일이다(앤드루 응이 "오늘 아침 Gemini 3가 공개됐다"고 언급). SME(Scalable Matrix Extensions)는 Arm의 CPU용 행렬 연산 확장 기술이며, 알리페이·애플의 온디바이스 AI 사례, 와이콤비네이터의 중국 소형 모델 사용 비율 등은 강연자가 제시한 주장으로 본문에 그대로 옮겼다.

원본 강의: Stanford CS230 Deep Learning, Autumn 2025, Lecture 9 "Career Advice in AI" — Andrew Ng, Laurence Moroney 발표, Kian Katanforoosh 진행.