AI 생태계 · 인터뷰 정리

AI 승자독식을 넘어서: 최예진 교수가 말하는 작은 모델과 한국의 전략

미국과 중국이 자본으로 밀어붙이는 거대 모델 경쟁 속에서, 스탠퍼드대 최예진 교수는 “더 크게”가 아니라 “더 영리하게”라는 다른 길을 제시한다. 다보스 포럼 현장 인터뷰를 토대로, 스케일링 법칙 비판부터 한국의 생존 전략까지 그의 주장을 정리했다.

2026년 5월 22일 · 인터뷰 출처: 플러스 TV(다보스 포럼 현장)

최예진(Yejin Choi)

스탠퍼드대 컴퓨터과학과 교수 · Stanford HAI 시니어 펠로우 · NVIDIA Distinguished Scientist

전공 분야: 자연어 처리(NLP, Natural Language Processing), 상식(commonsense) 추론, 소형 언어 모델
학력: 서울대 컴퓨터공학과 학사, 미국 코넬대 컴퓨터과학 박사(지도교수 Claire Cardie)
주요 수상: 2022년 맥아더 펠로십(이른바 ‘천재들의 상’), TIME100 AI 2023·2025 두 차례 선정
대표 연구: 상식 추론 지식베이스 ATOMIC·COMET, 물리 상식 벤치마크 PIQA 등

인공지능(AI, Artificial Intelligence) 분야에서 가장 영향력 있는 인물을 꼽는 미국 시사주간지 타임(TIME)의 ‘TIME100 AI’ 명단에 한국 출신으로 2023년과 2025년 두 차례 이름을 올린 학자가 있다. 스탠퍼드대 최예진 교수다. 그는 일론 머스크, 샘 올트먼처럼 거대 자본을 움직이는 인물들과 나란히 ‘구상가(Thinkers)’ 부문에 선정되었지만, 정작 업계가 달려가는 방향에는 거리를 둔다.

이 글은 다보스 포럼 현장에서 진행된 그의 인터뷰를 주제별로 재구성한 것이다. 핵심은 하나의 질문으로 모인다. 미국과 중국이 자본을 쏟아부어 거대 모델을 키우는 ‘승자독식’ 구도에서, 다른 길은 없는가.

01 — 지난 1년하이프에서 현실로

최 교수가 지난 1년간 가장 크게 체감한 변화는 업계의 ‘온도’였다. 2024년에는 인공지능이 빠르게 발전하면서 기대감이 부풀어 올랐다. 곧 모든 것이 바뀔 것이라는 다소 과열된 분위기가 지배적이었다. 반면 2025년의 대화는 사뭇 달라졌다고 그는 말한다. 산업계의 이윤이 기대만큼 빠르고 폭넓게 확산되지는 않는다는 인식이 퍼지면서, 사람들은 현실을 직시하고 인공지능의 부족한 부분을 어떻게 메울지 더 진지하게 논의하기 시작했다는 것이다.

그가 짚는 가장 근본적인 한계는 학습 방식이다. 현재의 인공지능은 데이터에 크게 의존하며, 주어진 문서를 그대로 ‘수동적으로’ 읽으며 학습한다. 읽다가 질문을 던지지도, 모르는 대목으로 되돌아가 다시 확인하지도 못한 채 그저 끝까지 통과한다. 인공지능이 스스로 묻고 되짚는 ‘주도적 학습’을 하도록 만드는 것, 이것이 그가 보는 다음 과제다.

비유로 이해하기 — 문제집과 창의력

인공지능을 문제집을 엄청나게 많이 푼 학생에 빗댈 수 있다. 문제는 많이 풀었으니 시험 점수는 잘 나온다. 그러나 문제집을 가장 많이 푼 학생이 가장 창의적인 것은 아니다. 잘 배우는 사람은 수동적으로 받아 적기만 하지 않고, 스스로 질문하고 모르는 곳으로 되돌아가며 능동적으로 공부한다. 최 교수가 인공지능에 채워 넣고 싶은 능력이 바로 이 ‘능동성’이다.

02 — 스케일링 법칙“더 크게”를 다시 본다

요즘 AI 업계의 지배적 서사는 단순하다. “클수록 좋다(larger is better).” 더 많은 데이터와 연산을 거대한 신경망에 밀어 넣으면 성능이 매끄럽게 올라간다는 ‘스케일링 법칙(scaling law)’이다. 최 교수는 이 법칙 자체를 부정하지는 않는다. 실제로 규모로 밀어붙이면 성능이 잘 나오는 것은 기정사실이고, 단기적으로는 한국도 규모를 키우는 편이 합리적일 수 있다고 인정한다.

그가 비판하는 지점은 따로 있다. 모두가 획일적으로 ‘스케일’ 하나만 좇는 흐름이다. 초기 모델은 최적화가 덜 되어 있고 기술적으로 부족한 점이 많아 거대화에 기댈 수밖에 없었지만, 연구를 잘하고 아이디어를 잘 짜면 알고리즘의 힘으로 작고도 성능 좋은 모델을 만들 수 있다는 것이 그의 주장이다. 그가 강연에서 내건 표현을 빌리면, ‘더 영리한 알고리즘으로 스케일링 법칙을 구부린다(bending scaling laws with brighter algorithms)’.

그 가능성의 결정적 증거로 그는 인간의 두뇌를 든다.

지금의 지배적 서사는 클수록 좋다는 것이다. 그러나 우리 자신의 효율적인 두뇌가, 수십억 달러를 점점 더 큰 모델에 쏟아붓지 않고도 다른 길이 가능하다는 살아 있는 증거다. — 최예진, TIME 인터뷰 중

비유로 이해하기 — LED 전구보다 적은 전력

인간의 두뇌는 LED 전구 하나가 쓰는 전력에도 못 미치는 에너지로 작동한다. 그런데도 포괄적으로 사고하고, 아주 적은 양의 데이터만으로도 많은 것을 배운다. 자연은 이미 ‘저전력 고성능’ 학습 기계를 만들어 냈다. 인간이 그 방법을 아직 모를 뿐이다. 누군가 도전하지 않으면 영영 발견되지 않는다는 것이 그가 작은 모델 연구를 밀고 나가는 이유다.

거대화 경로는 비용이 클수록 수확이 둔해진다. 두뇌는 아주 적은 규모로도 높은 성능을 내며, 이는 알고리즘 혁신으로 ‘스케일링 곡선을 구부릴’ 여지가 있음을 보여준다.

핵심 메시지

규모는 부정 대상이 아니다. 모두가 규모 하나에만 매달리는 획일성이 문제다. 알고리즘을 잘 설계하면 작은 모델로도 멀리 갈 수 있다.

03 — 작은 모델크기 대신 ‘좋은 데이터’

그렇다면 작은 모델은 어떻게 큰 모델을 따라잡을까. LLM(Large Language Model, 대형 언어 모델)은 거대한 신경망에 막대한 데이터와 자본을 쏟아부어 만든다. 반면 SLM(Small Language Model, 소형 언어 모델)은 부족한 부분을 무언가로 채워야 한다. 최 교수가 보는 가장 좋은 보충재는 ‘좋은 데이터’다.

여기서 핵심은 무엇이 좋은 데이터인가다. 인터넷의 데이터가 아무리 좋아도, 거대 모델은 이미 인터넷을 통째로 내려받아 학습했다. 같은 것을 더 줘 봐야 작은 모델에 이점이 없다. 인터넷에도 없는 고품질 학습 데이터를 만들어 낼 수 있다면, 그것이 작은 모델을 끌어올리는 동력이 된다.

그래서 그의 연구는 ‘인공지능으로 인공지능을 위한 데이터를 짜는’ 방향으로 향한다. 다만 쉽지 않다. 인공지능이 만든 데이터는 상당수가 품질이 낮기 때문에, 많이 만들어 대부분을 버리고 선별하며, 알고리즘으로 부족한 점을 보완해 더 나은 데이터를 만들어 낸다. 창의적 발상과 정교한 알고리즘 설계가 필요한 영역이고, 바로 그렇기에 자본이 적어도 아이디어로 승부를 볼 수 있는 지점이라고 그는 본다.

작은 모델이 어느 수준 이상으로 잘 작동한다면, 기업이나 정부 기관이 굳이 열 배·백 배 비싼 거대 모델을 쓸 이유가 줄어든다. 결국 거대 모델에 대한 의존도 자체를 낮출 수 있고, 학습 알고리즘이 더 발전하면 데이터 의존도까지 줄일 수 있으리라는 것이 그의 기대다.

대형 모델이 ‘규모’로 승부한다면, 소형 모델은 인터넷에 없는 고품질 데이터를 영리하게 만들어 부족분을 채운다. 자본보다 아이디어가 결정하는 영역이다.

핵심 메시지

작은 모델의 승부처는 데이터의 ‘양’이 아니라 ‘질’이다. 인터넷에 없는 데이터를 만들어 내는 알고리즘이 곧 경쟁력이다.

04 — AI 민주화국민의, 국민에 의한, 국민을 위한

최 교수는 인공지능의 ‘민주화(democratization)’를 미국 링컨 대통령이 정의한 민주주의에 빗대 설명한다. ‘국민의, 국민에 의한, 국민을 위한(of the people, by the people, for the people)’이라는 구절을 인공지능에 그대로 옮겨 보는 것이다.

국민의(of)는 원천 데이터를 가리킨다. 인공지능의 데이터는 인류의 가치와 지혜, 지식을 반영해야 하며, 그것이 곧 인터넷 데이터다. 국민에 의한(by)은 누구나 인공지능을 만들 수 있어야 한다는 관점이다. 그런데 모든 나라와 단체가 거대 모델을 위한 막대한 GPU(Graphics Processing Unit, 그래픽 처리 장치)를 살 수는 없다. 그래서 소형 모델이 중요해지고, 힘을 합치기 위한 오픈 소스(open source)가 중요해진다. 국민을 위한(for)은 수혜자의 문제다. 인공지능은 모든 사람에게 도움이 되어야 하지만, 자칫하면 특정 국가·기업·집단에만 혜택이 쏠릴 수 있다.

그가 더 역설적인 위험으로 지목하는 것은 따로 있다. 인공지능이 최적화를 거듭하다 사람을 배제하고 ‘인공지능이 인공지능을 돕는’ 상태로 가거나, 더 나아가 사람이 인공지능을 위해 일하는 상태가 생길 수 있다는 것이다. 소수 빅테크에 의존하기보다, 모든 나라와 단체가 함께 ‘인공지능이 사람에게 도움이 되는 방향’을 고민하고 개발해야 한다는 것이 그의 결론이다.

링컨의 민주주의 정의를 인공지능에 적용한 세 기둥. 소형 모델과 오픈 소스가 ‘국민에 의한’ 제작을 가능하게 하는 핵심 수단이다.

05 — 한국의 전략다윗이 골리앗을 이기는 법

그렇다면 자본 규모에서 미국·중국과 정면으로 겨루기 어려운 한국은 어떻게 해야 할까. 최 교수의 답은 명확하다. 인공지능은 자본만으로 이길 수 있는 분야가 아니며, 인재(talent)와 아이디어, 문화적 협력 구조로 충분히 승부할 수 있다는 것이다. 작전을 잘 짜면 한국도 ‘G3(세계 3위 그룹)’까지 가능성이 있다고 그는 본다.

비유로 이해하기 — 다윗과 골리앗

골리앗은 거대한 자본이다. 다윗은 작전을 잘 짜서 이긴다. 한국이 가진 자본은 골리앗만큼 크지 않지만, 영리한 전략으로 충분히 싸워볼 수 있다는 뜻이다. 핵심은 ‘무엇으로 작전을 짤 것인가’다.

① 인재 — 길게 보면 가장 중요한 자원

중국이 빠르게 올라온 배경에는 약 10년 전 미국에서 공부하고 돌아간 교수들이 매년 다수의 우수한 학생을 길러 낸 일이 있다. 나라가 학생 지도와 연구·인재 배출에 많이 투자하면서 인재 풀이 두꺼워졌고, 그만큼 빠르게 인력을 동원할 수 있게 되었다는 분석이다. 한국도 단기적으로는 GPU를 빨리 확보해 중간~거대 규모로 가는 편이 좋지만, 멀리 보면 인재 육성이 가장 중요하다고 그는 강조한다.

② 협력 — 사내 정치는 자원의 낭비다

인공지능을 잘하는 미국의 학교·기업은 내부 협력 문화가 좋다는 것이 그의 관찰이다. 사내 정치를 피하는 것이 매우 중요하다고 그는 말한다. 경쟁하느라 같은 일을 두 번 하는 대신 서로 도와야 한다는 것이다. 본인의 이익만 생각하지 않고 나라의 이익, 나아가 인류의 이익을 함께 고려하는 협력적 문화가 필요하다는 주장이다.

③ 피지컬 AI — 한국의 제조 강점이 통하는 영역

한국이 ‘피지컬 AI(Physical AI, 물리적 인공지능)’에 집중하는 흐름을 그는 좋은 방향으로 평가한다. 피지컬 AI는 가장 어려운 주제 중 하나이고 빅테크도 아직 풀지 못한 숙제라, 빠르게 진행하면 국제 경쟁력을 가질 수 있다는 것이다. 결정적으로 이 분야는 자본만으로 풀리지 않는다. 인터넷에는 사람의 언어를 통한 지능 데이터는 많지만, 로보틱스나 제조 산업의 데이터는 크게 부족하기 때문이다. 게다가 새로운 제품과 브랜드를 만들어 내며 일자리와 경제적 가치를 창출할 수 있는, 희망적인 분야라고 그는 본다.

④ 오픈 소스 — 인재를 끌어당기는 자석

오픈 소스는 협력의 도구이자 인재 유입의 강력한 동력이다. 그는 중국 사례를 든다. 과거에는 미국에서 유학한 중국계 과학자들이 미국에 남았지만, 최근에는 좋은 직장의 제안을 받고도 중국으로 돌아가는 유능한 과학자가 늘고 있다는 것이다. 바이트댄스, 딥시크 같은 곳이 좋은 연구를 오픈 소스로 공개하고 논문을 내면서, 그 자체가 인재를 끌어당기는 자석이 되고 있다는 분석이다.

한국의 전략은 자본 경쟁이 아니라 인재·협력·피지컬 AI·오픈 소스라는 네 갈래의 ‘작전’으로 모인다.

핵심 메시지

한국의 승부처는 자본이 아니라 인재와 협력, 그리고 자본으로 풀리지 않는 피지컬 AI다. 사내 정치를 줄이고 오픈 소스로 인재를 끌어당기는 것이 작전의 핵심이다.

06 — 다양성모델이 많아야 선택지가 생긴다

최 교수가 그리는 이상적인 미래는 ‘건강한 생태계’다. 작은 모델, 중간 모델, 큰 모델, 그리고 한국·미국·대만·싱가포르 등 여러 나라의 모델이 공존하며, 분야와 예산에 따라 골라 쓸 수 있는 구조다. 전문가 모델들이 서로 협력하는 ‘버티컬 AI(특정 분야에 특화된 인공지능)’의 연합도 승자독식을 깨는 한 갈래가 될 수 있다.

비유로 이해하기 — 레스토랑의 다양성

레스토랑에는 아주 비싼 곳도, 저렴한 분식집도 있다. 굳이 한 종류만 있을 필요가 없다. 모든 식당이 하나의 브랜드로 통일되면 좋은 일이 아니다. 선택지가 사라지기 때문이다. 인공지능도 마찬가지로 선택지가 많아야 한다는 것이 그의 생각이다.

이를 가능하게 하는 열쇠가 오픈 소스다. 나라 간 협력은 전통적으로 쉽지 않지만, 싱가포르처럼 동남아 국가들과 힘을 합쳐 자국만이 아닌 인류에 기여하는 인공지능을 고민하는 사례가 나오고 있다. 오픈 소스를 받아 쓰는 쪽도, 베푸는 쪽도 모두 이득을 본다는 것이 그의 관찰이다.

07 — 인간AI 시대에 사람이 지킬 것

인터뷰의 마지막은 개인의 가치관으로 향한다. 최 교수는 어린 시절 ‘4차원’이라는 말을 들었다고 회고한다. 공부는 그럭저럭 잘했지만 시험공부를 좋아하는 성격은 아니었고, 사회가 기대하는 여성상이나 미적 기준에 잘 맞지 않았다. 돌이켜 보면 한 가지 기준만 옳다고 여기는 것은 좋지 않으며, 사람의 다른 점을 더 잘 수용하는 사회가 되기를 바란다고 그는 말한다.

그가 인공지능이 대체할 수 없다고 보는 인간의 능력은 두 가지다. 독창적·독립적 사고력과 창의력이다. 인공지능은 보편적 지식을 방대하게 갖춘 도서관과 같아 ‘많이 아는’ 영역에서는 인간을 대체할 수 있다. 그러나 그 지식을 발판 삼아 다음 단계로 나아가는 명확한 추론력, 그리고 새로운 가치를 만들어 내는 창의력은 사람의 몫이다. 또한 진화의 생태계에서 비롯된 인간 고유의 ‘개별성(individuality)’과 다양성은 인공지능이 대체할 수 없는 가치라고 그는 본다.

AI 전문가를 꿈꾸는 학생들을 향한 그의 조언은 구체적이다. 인공지능은 아직 초창기이며, 바이오·화학·물리·경제 등 다른 분야와 결합해 풀 수 있는 문제가 많으니 적극 도전하라는 것이다. 무엇보다 중요한 것은 창의적이고 독창적으로 사고하는 능력을 스스로 기르는 일이다.

그런 능력을 기르려면 혼자 하셔야 한다. 책이나 논문, 뉴스를 읽으며 스스로 사고하는 습관을 매일 조금씩 연습하는 것이 가장 도움이 된다. — 최예진, 학생들에게 전하는 조언

최 교수가 추천한 책

『죽음의 수용소에서』 — 빅터 프랭클

Man’s Search for Meaning, Viktor Frankl

나치 수용소라는 극한 상황에서도 삶의 의미를 찾아낸 이야기다. 의미는 많이 가져서 오는 것이 아니라 자기 마음속 목표를 향해 매일 조금씩 이뤄 가는 데서 온다는 깨달음을 준다. 남들이 하지 않는 연구를 하며 마음고생하는 이들에게 그가 권하는 책이다.

『넥서스』 — 유발 하라리

Nexus, Yuval Noah Harari

인쇄술로 책이 보급되면 모두가 현명해질 것 같지만, 그 책들이 마녀사냥 같은 억압의 도구로 악용되기도 했다는 점을 짚는다. 인터넷과 소셜 미디어가 연결의 장점과 동시에 에코 챔버·가짜뉴스의 부작용을 낳는 지금, 인공지능을 어떻게 풀어갈지 고민하는 데 도움이 된다.

『이성의 진화』 — 위고 메르시에 · 당 스페르베르

The Enigma of Reason, Hugo Mercier & Dan Sperber

인지과학 분야의 추론에 관한 책이다. 인간의 추론이 막연히 생각하는 것보다 훨씬 지저분하고 복잡하다는 통찰을 담고 있다. 인공지능이나 사람의 인지 능력에 관심 있는 학생에게 그가 권한다.

최 교수의 주장을 한 흐름으로 모으면 이렇다. 거대화 경쟁은 부정 대상이 아니지만 유일한 길도 아니다. 알고리즘과 데이터의 질을 무기로 작은 모델을 키우고, 오픈 소스로 협력해 인재를 모으며, 자본으로 풀리지 않는 피지컬 AI에서 승부를 본다. 그렇게 다양한 모델이 공존하는 생태계를 만드는 것이 승자독식 구도를 깨는 길이라는 것이다. 그리고 그 한가운데에서 사람이 지켜야 할 것은, 인공지능이 대신해 줄 수 없는 독립적 사고와 창의력이다.

이 글은 다보스 포럼 현장에서 진행된 최예진 교수 인터뷰(플러스 TV)를 주제별로 재구성·정리한 것이다. 인물 경력과 수상 이력, 스케일링 법칙·소형 언어 모델 관련 발언 등은 TIME, 스탠퍼드 HAI, NVIDIA Research 등 공개 자료로 교차 확인했다. 직접 인용은 발언 취지를 옮긴 것으로, 표현은 원문과 다를 수 있다.