기술경제 · AI 인프라
토큰마다 전기를 태우는 사업
복제 비용이 0이던 소프트웨어의 황금기가 끝나고, 인공지능 경제학이 제조업을 닮아가는 이유
한 가지 단순한 비교에서 시작해 보자. 워드프로세서 같은 전통 소프트웨어는 한 번 만들어 놓으면, 그것을 백 명에게 팔든 천만 명에게 팔든 복제 한 부를 더 찍어내는 데 사실상 추가 비용이 들지 않는다. 반면 AI(Artificial Intelligence, 인공지능) 챗봇은 한 문장을 답할 때마다 돈이 든다. 글자 하나하나를 만들어 낼 때마다 연산이 일어나고, 그 연산은 전기와 장비를 소모한다.
이 차이는 사소해 보이지만, 두 사업의 손익 구조 전체를 뒤바꾼다. 소프트웨어를 한 세대 풍요롭게 만들었던 "한 번 만들면 공짜로 복제된다"는 경제학이 AI에는 통하지 않는다. 그래서 어떤 이들은 AI가 소프트웨어가 아니라 제조업에 가깝다고 말한다. 이 비유는 핵심을 정확히 짚는 동시에, 두 군데에서 어긋난다. 그 어긋남까지 따라가 보면 AI 경제학의 진짜 모양이 드러난다.
1복제 비용이 0이던 시대
소프트웨어 산업의 부富는 거의 전부 한 가지 사실 위에 서 있었다. 제품을 만드는 데는 큰 돈(고정비)이 들지만, 만들어진 제품을 한 부 더 제공하는 데 드는 비용 — 경제학에서 한계비용(marginal cost)이라 부르는 값 — 이 거의 0에 가깝다는 점이다. 기능 하나를 완성하고 나면, 만 번째 고객에게 전달하는 비용이 백 번째 고객에게 전달하는 비용과 거의 같다.
책 한 권을 쓰는 데는 작가의 수년이 든다. 그러나 일단 원고가 완성되면, 디지털 책을 한 부 더 복제하는 비용은 0에 수렴한다. 종이책은 인쇄·운송 비용이 부당 따라붙지만, 전자책은 그조차 없다. 전통 소프트웨어는 완벽한 전자책에 가깝다. 만드는 데만 돈이 들고, 파는 데는 거의 돈이 들지 않는다.
그 결과가 소프트웨어의 전설적인 이익률이다. 성숙한 서비스형 소프트웨어(SaaS, Software as a Service) 기업의 매출총이익률은 통상 70~85% 수준이며, 상위 기업은 80%를 넘는다. 같은 매출을 올리는 제조업체와 비교하면 차이가 선명하다. 1억 달러어치 제품을 파는 제조업체는 원자재·생산에 6천만~7천만 달러의 매출원가(COGS, Cost of Goods Sold)가 들어 이익률이 30~40%에 그친다. 같은 매출의 SaaS 기업은 매출원가가 2천만~3천만 달러뿐이어서 70~80%가 고스란히 남는다. 투자자들이 소프트웨어 기업에 제조·유통 기업보다 훨씬 높은 가치를 매겨 온 이유가 바로 이 구조다.
진한 막대는 통상 하한, 옅은 막대는 상한을 나타낸다. 소프트웨어의 높은 이익률은 한계비용이 0에 가깝다는 단일한 사실에서 비롯된다. (출처: SaaS·제조업 벤치마크, ICONIQ 2026 AI 마진 추정)
2AI는 한 마디마다 돈이 든다
AI 서비스는 이 구조를 정면으로 깬다. 사용자의 질문에 답할 때마다 모델은 단어(정확히는 토큰)를 하나씩 생성하는데, 그 한 토큰마다 GPU(Graphics Processing Unit, 그래픽처리장치)의 연산이 실제로 일어난다. 이 과정을 추론(inference)이라 부른다. 추론은 전기를 먹고, 값비싼 장비를 닳게 하며, 냉각 설비를 돌린다. 즉 산출물 한 단위마다 실재하는 변동비가 따라붙는다. 소프트웨어가 0이라고 가정했던 그 한계비용이, AI에서는 0이 아니다.
전통 소프트웨어의 한계비용은 0에 수렴한다. AI 추론의 한계비용은 양(+)의 값이며, 사용량에 비례해 늘어난다. 이것이 두 사업을 가르는 근본적인 분기점이다.
그 결과가 손익에 그대로 찍힌다. 외부 추정에 따르면 2025년 한 해, ChatGPT를 만든 오픈AI의 매출총이익률은 33% 수준으로 자체 목표(46%)를 크게 밑돌았고, 앤스로픽 역시 40% 안팎으로 목표보다 10%포인트 낮았다. 두 회사 모두 가장 큰 원인으로 예상을 웃돈 추론 비용을 꼽았다. 앤스로픽의 경우 추론 비용이 예상보다 23% 높게 나왔다. AI 응용 서비스로 내려가면 사정은 더 험하다. 코딩 도구 커서Cursor는 한동안 매출총이익률이 마이너스였다 — 구독료로 받는 돈보다 사용자를 돌리는 데 드는 추론 비용이 더 컸다는 뜻이다.
업계 데이터를 모은 ICONIQ 추정으로는 AI 네이티브 기업의 평균 매출총이익률이 2024년 41%에서 2026년 약 52%로 올라섰다. 개선되고 있으나, 소프트웨어의 70~85%와는 여전히 한 체급 아래다. 벤처투자사 베서머Bessemer는 AI 기업을 둘로 나눈다. 인프라를 최적화하지 못한 채 빠르게 성장하는 "초신성Supernova"은 약 25% 이익률(일부는 마이너스)에, 모델과 가격을 다듬은 "유성Shooting Star"은 60% 수준에 머문다. 순수 소프트웨어에서는 좀처럼 보기 힘든, 마이너스 매출총이익률이라는 현상이 AI에서는 드물지 않다.
3"제조업처럼"이 어긋나는 두 지점
여기까지 보면 AI를 제조업에 빗대는 것이 자연스럽다. 둘 다 산출물 한 단위마다 변동비가 든다. 그러나 그 비유는 두 군데에서 어긋나고, 그 어긋남이 AI 경제학의 독특함을 만든다.
① 변동비의 성격 — 원자재가 아니라 전기다
제조업의 단위당 비용에는 강철, 플라스틱, 부품 같은 원자재(자재명세서, BOM)가 큰 비중을 차지한다. 차를 한 대 더 만들면 강판이 한 대분 더 사라진다. 그러나 AI 추론은 토큰마다 물리적 재료를 소모하지 않는다. 소모하는 것은 전기와, 시간에 따라 나눠 상각되는 하드웨어 자본이다. 이 점에서 AI는 이산적인 제조보다 오히려 발전소나 통신망 같은 인프라·유틸리티 사업에 가깝다. 출력을 한 단위 더 내보내는 데 드는 비용이 본질적으로 "전기요금"인 것이다.
자동차 공장은 차 한 대마다 강판과 엔진을 써서 없앤다. 반면 알루미늄 제련소는 원료 자체보다 전기를 태우는 것이 핵심 비용이다 — 그래서 제련소는 전기가 싼 곳에 짓는다. AI 데이터센터는 후자에 훨씬 가깝다. 토큰을 만드는 일은 곧 전기를 태우는 일이며, 그래서 데이터센터는 전력이 풍부하고 값싼 곳을 찾아 모여든다.
② 비용의 궤적 — 안정적이지 않고 급락한다
제조업의 단위 원가는 비교적 안정적이다. 강판 값이 한 해 만에 10분의 1로 떨어지는 일은 없다. 그러나 AI의 토큰당 비용은 칩 효율 개선과 양자화quantization·증류distillation 같은 모델 최적화 덕분에 가파르게 무너진다. 같은 성능을 기준으로, GPT-4급 모델의 처리 비용은 2022년 말 100만 토큰당 약 20달러에서 2025년 말 약 0.40달러로 떨어졌다 — 3년 만에 50분의 1 수준이다. 일부 추정은 비슷한 성능 구간에서 비용이 해마다 거의 10배씩 떨어졌다고 본다. 이 곡선은 안정적인 제조업보다 "트랜지스터당 원가가 끝없이 하락하는" 반도체 산업을 더 닮았다.
세로축은 로그 눈금(100만 토큰당 달러). 같은 성능 기준 비용이 3년 만에 약 50분의 1로 떨어졌다. 제조업의 안정적 원가가 아니라 반도체식 급락 곡선에 가깝다. (출처: 추론 단가 분석, 2025~2026)
구조적으로는 제조업처럼 양의 한계비용을 갖지만, 그 값이 시간에 따라 급락한다는 점이 근본적으로 다르다. 가트너Gartner는 2030년까지 첨단 모델의 추론 비용이 추가로 90% 더 줄어들 것으로 전망한다.
4진짜 구조: 소프트웨어와 제조업의 혼합
그래서 AI는 둘 중 하나가 아니라 둘의 혼합형이다. 한쪽에는 모델 학습training이라는 거대한 선행 고정비가 있다. 소프트웨어 개발비와 닮았지만, 한 번으로 끝나지 않는다는 점이 다르다. 새 세대 모델을 낼 때마다 처음부터 다시, 더 큰 규모로 학습해야 한다. 다른 한쪽에는 추론이라는 양의 변동비가 사용자 상호작용마다 따라붙는다.
정리하면, 소프트웨어는 앞쪽 고정비만 무겁고 뒤쪽 변동비가 거의 없다. 제조업은 뒤쪽 변동비가 주력이다. AI는 앞쪽 고정비(반복되는 학습)와 뒤쪽 변동비(추론)가 둘 다 무겁다. 양쪽 부담을 동시에 진다는 점에서, AI는 두 산업의 가장 비싼 절반씩을 합쳐 놓은 셈이다.
각 막대는 총비용에서 변동비가 차지하는 비중을 개념적으로 나타낸다. AI의 고정비(학습)는 세대마다 반복된다는 점에서 소프트웨어보다 무겁다.
실무적 함의는 사업 모델로 직결된다. "규모만 키우면 마진 100%에 수렴한다"는 소프트웨어의 공식이 AI에는 성립하지 않는다. 그래서 앤스로픽은 2027년, 오픈AI는 2029년에야 70%대 매출총이익률에 닿겠다는 장기 목표를 내건다. 소프트웨어 기업에는 출발선인 숫자가, AI 기업에는 수년에 걸쳐 도달해야 할 목표선인 것이다.
5값은 떨어지는데 청구서는 커진다
여기서 역설이 등장한다. 토큰당 단가는 분명히 떨어지는데, 기업이 실제로 내는 AI 청구서 총액은 오히려 불어난다. 19세기 경제학자 윌리엄 제번스가 관찰한 현상과 같다 — 석탄을 더 효율적으로 쓰게 되자 석탄 소비가 줄기는커녕 폭증했다. 비용이 싸지면 더 많은 곳에 쓰게 되기 때문이다.
AI에서도 똑같은 일이 벌어진다. 단가가 내려가자 사람들은 토큰을 훨씬 더 많이 태우는 방식으로 AI를 쓰기 시작했다. 한 번 묻고 답하는 단순 대화 대신, 스스로 추론을 거듭하고 여러 단계를 연쇄하는 "에이전트agent" 작업이 늘었다. 이런 작업은 요청 하나에 과거의 수십 배에 달하는 토큰을 소모한다. 단가 하락 속도보다 소비량 증가 속도가 더 빨라, 총비용은 계속 오른다.
오픈AI는 2025년 약 37억 달러의 매출을 올리고도 약 50억 달러를 잃은 것으로 추정된다. 1달러를 벌기 위해 약 1.35달러를 쓴 셈이다. 적자의 주범은 연구개발이나 인건비가 아니라, 매일 수십억 건의 추론 요청을 처리하는 비용 그 자체였다.
더 미묘한 문제는 가격의 바닥이 인위적으로 낮게 깔려 있다는 점이다. 주요 기업들이 시장 점유율을 잡기 위해 추론을 원가 아래로 팔고 있다는 분석이 적지 않다. 그렇다면 지금 사용자가 보는 저렴한 API(Application Programming Interface, 응용프로그램 인터페이스) 가격은 "진짜 바닥"이 아니라, 자본이 풍부할 때만 유지되는 한시적 바닥일 수 있다. 자본 규율이 돌아오면 가격은 위로 정상화될 여지가 있다. 다만 동시에, 칩과 모델 효율 개선이 원가 자체를 끌어내리고 있어 두 힘이 맞부딪치는 중이다.
6그 변동비의 정체는 결국 전기다
AI의 한계비용을 끝까지 따라 내려가면 마지막에 남는 것은 전력이다. 이 지점에서 "AI는 제조업"이라는 비유가 은유를 넘어 문자 그대로 사실이 된다. AI는 전력망 입장에서 거대한 산업용 부하負荷, 즉 새로 등장한 중공업 고객이다.
국제에너지기구(IEA, International Energy Agency)에 따르면 전 세계 데이터센터의 전력 소비는 2024년 약 415테라와트시(TWh)에서 2030년 약 945TWh로 두 배 넘게 늘어, 전 세계 전력 소비의 약 3%에 이를 전망이다. AI 전용 설비의 GPU 랙rack은 일반 서버 랙보다 최대 6배까지 전력을 먹는다. 학습보다 추론이 더 큰 에너지 소비원으로 올라설 것이라는 분석도 나온다. 사람들이 AI를 더 자주 쓸수록, 즉 토큰을 더 많이 태울수록 추론 전력이 늘기 때문이다.
데이터센터 전력 소비는 6년 만에 두 배 이상으로 늘어날 전망이다. (출처: IEA Energy and AI, 기준 시나리오)
전력망 운영자에게 데이터센터 단지는 갑자기 들어선 거대한 제철소와 비슷하다. 한 곳에 집중되고, 밤낮없이 돌아가며, 수요가 급격히 출렁인다. 버지니아, 아일랜드, 오리건처럼 데이터센터가 몰린 지역에서는 이미 국지적 계통 부담이 나타나고 있다. 추론 부하는 평소엔 한 건당 작지만 끊임없이 돌아가며, 사람들의 활동 시간대를 따라 큰 폭으로 출렁인다 — 전력 계획 입장에서 다루기 까다로운 손님이다.
흥미로운 역설은, 바로 이 전력이라는 변동비 때문에 AI 기업들이 전력 자체의 효율을 사업의 핵심 역량으로 끌어안게 되었다는 점이다. 더 효율적인 칩, 더 작은 모델, 캐싱caching과 라우팅routing으로 토큰 낭비를 줄이는 일이 곧 매출총이익률을 지키는 일이 되었다. 소프트웨어 시대에는 누구도 신경 쓰지 않던 "전기요금"이 이제 경쟁의 최전선이다.
7복제가 공짜였던 시대의 끝
처음의 단순한 관찰로 돌아가자. 소프트웨어는 한 부를 더 팔아도 추가 비용이 들지 않고, AI는 한 마디를 더 답할 때마다 전기가 든다. 이 한 줄의 차이가 손익 구조, 가격 정책, 그리고 결국 전력망 계획에까지 파장을 미친다.
정확히 말하면 AI는 소프트웨어도 제조업도 아닌, 둘의 가장 무거운 절반씩을 합친 혼합형이다. 세대마다 반복되는 막대한 학습 고정비를 지면서, 동시에 토큰마다 전기를 태우는 변동비를 짊어진다. 그 변동비는 반도체처럼 빠르게 떨어지지만, 사용량은 그보다 더 빠르게 늘어 총비용을 밀어 올린다. 그리고 그 비용의 끝에는 발전소와 송전선이 있다.
지난 한 세대 동안 디지털 경제를 떠받친 "복제 비용 0"이라는 전제는 AI에서 더는 성립하지 않는다. AI 경제학은 가벼운 소프트웨어의 세계에서, 전기와 설비와 입지를 따지는 무거운 인프라의 세계로 한 발 되돌아왔다. 토큰마다 무언가가 실제로 타고 있다는 사실을, 이제는 손익계산서가, 그리고 전력 수요 곡선이 증언한다.