기술 · 노동 · AI
자연어로 말하면 AI(인공지능)가 코드를 짜는 시대. 화제가 폭발한 지 약 1년이 지났다. 무엇이 실제로 바뀌었고, 무엇이 부풀려졌는지 여러 갈래의 데이터를 교차해 짚어 본다.
코딩을 한 줄도 모르던 사람이 앱이나 게임을 만들어 돈을 벌었다는 이야기가 흔해졌다. 이쯤 되면 "나만 뒤처지는 것 아닌가" 하는 조바심이 들 만하다. 이 글의 목적은 그 화제의 실체를 검증된 수치로만 차분하게 정리하는 데 있다.
다섯 개의 질문을 따라간다. 도구는 정말 그만큼 좋아졌는가, 늘어난 코드는 좋은 코드인가, 일자리는 어떻게 흔들리는가, 소프트웨어 산업의 수익 구조는 어디로 가는가, 그리고 이 흐름은 코딩을 넘어 어디까지 번지고 있는가. 결론을 먼저 한 줄로 줄이기보다, 데이터가 그리는 그림을 한 겹씩 펼쳐 본다.
개념 · 올해의 단어 · 낮아진 문턱
바이브 코딩이라는 말은 2025년 2월, 한 저명한 AI 연구자가 자신의 SNS(소셜미디어)에 남긴 짧은 글에서 출발했다. 핵심은 단순하다. 개발자가 코드를 직접 작성하지 않고, AI 모델에게 자연어로 "이런 걸 만들어 달라"고 요청하면 된다는 것이다. AI가 코드를 써 주고, 에러가 나면 다시 "이 부분을 고쳐 달라"고 말한다. 말 그대로 느낌(vibe) 가는 대로 만드는 방식이다.
예전에는 집을 지으려면 벽돌 쌓는 법을 직접 배워야 했다. C, 자바(Java), 파이썬(Python) 같은 프로그래밍 언어가 그 "벽돌 다루는 기술"에 해당한다. 바이브 코딩은 설계 의도를 한국어나 영어로 설명하면 AI가 통역사이자 시공자가 되어 벽돌을 대신 쌓아 주는 것에 가깝다. 사람은 "거실을 더 넓게" 같은 요구를 던지고, 실제 시공은 AI가 맡는다.
이 표현이 얼마나 빠르게 일상어가 됐는지는 한 가지 사실로 드러난다. 영어권의 한 대표 사전이 2025년 올해의 단어로 이 말을 선정했다. 두 단어로 이뤄진 신조어지만, 사람과 도구의 관계가 근본적으로 바뀌고 있다는 신호로 받아들여졌다.
화제를 키운 건 진입장벽의 붕괴를 보여 주는 사례들이다. 단 몇 시간 만에 만든 간단한 게임이 한때 월 수만 달러대 수익을 올렸다는 이야기, 코딩 경험이 전혀 없는 사람이 주말 동안 실제로 작동하는 앱을 내놓았다는 이야기가 줄을 이었다. 이런 일화들은 기술의 성숙도 자체보다, 무언가를 만들기 위해 넘어야 했던 문턱이 얼마나 낮아졌는지를 상징한다.
코드 산출량 · 품질 저하 · 보안 부채
지난 1년간 새로 만들어진 웹사이트, 모바일 앱, 그리고 협업 저장소에 올라온 코드의 양이 여러 지표에서 동시에 급증했다. 한 대기업군 분석에서는 AI 도구를 쓰는 개발자가 그렇지 않은 동료보다 코드를 3~4배 빠른 속도로 만들어 냈다. 코드를 찍어 내는 속도만 보면 생산성은 분명히 폭발했다.
문제는 그 코드가 좋은 코드냐는 것이다. 양과 질은 같은 방향으로 움직이지 않았다.
보안 측면이 특히 두드러진다. 100여 개의 대규모 언어 모델을 보안 민감 작업으로 시험한 한 분석에서, AI가 생성한 코드의 약 45%가 널리 알려진 주요 취약점을 포함했다. 언어별로는 자바(Java)가 70%를 넘겨 가장 나빴다. 더 눈에 띄는 건 추세다. 2026년 초까지 여러 차례 시험을 반복했지만 이 통과율은 좀처럼 개선되지 않았다. 모델이 똑똑해진다고 보안까지 자동으로 좋아지지는 않았다는 뜻이다.
현장 데이터도 비슷하다. 1,400여 개의 바이브 코딩 기반 운영 애플리케이션을 점검한 조사에서는 65%에 보안 문제가 있었고, 58%는 치명적 취약점을 하나 이상 안고 있었다. 비밀번호나 접속 키 같은 민감 정보가 코드에 그대로 박혀 공개 저장소로 새어 나가는 사고도 늘었다. 2025년 한 해 공개 저장소에서 새로 노출된 비밀 정보는 약 2,866만 건으로 전년 대비 34% 증가해 역대 최대 폭으로 뛰었고, AI가 거든 커밋의 노출률은 사람만 작성한 경우의 약 두 배(3.2% 대 1.5%)였다.
품질도 미끄러졌다. 2억 줄이 넘는 코드 변경을 추적한 한 연구에 따르면, 코드 구조를 다듬는 리팩터링(refactoring) 작업의 비중은 2021년 약 25%에서 2024년 10% 아래로 떨어졌다. 반대로 같은 내용을 복사해 붙여 쓰는 중복 코드의 비중은 8.3%에서 12.3%로 올랐다. 더 많이 만들고, 덜 정리하고, 더 자주 다시 손보는 패턴이 굳어진 것이다.
이 현상을 흔히 기술 부채라고 부른다. 당장 빠르게 짜기 위해 정리·검증을 미뤄 두면, 그 미룬 일이 빚처럼 쌓여 나중에 이자까지 붙어 돌아온다. 신용카드로 급한 지출을 막는 것과 비슷하다. 오늘은 편하지만, 중복된 코드 한 곳을 고치려면 같은 코드를 박아 둔 여러 곳을 모두 손봐야 하는 청구서가 뒤따른다.
그래서 "빨라졌다"는 체감과 "전체로는 더 느려졌다"는 측정이 갈린다. 한 대규모 소프트웨어 전달 현황 조사에서 다수 개발자는 AI가 만든 코드를 디버깅(오류 수정)하고 보안 문제를 해결하는 데 시간을 더 쓴다고 답했다. AI 사용을 25% 늘렸을 때 코드 리뷰와 문서화는 빨라졌지만, 실제로 안정적으로 배포되는 산출물의 처리량은 오히려 7%가량 줄었다는 분석도 있다.
이 긴장은 개발자 설문에서 또렷하게 드러난다. 2025년의 한 대규모 조사에서 응답자의 84%가 개발 과정에 AI를 쓰거나 쓸 계획이라고 답했다. 전년의 76%보다 늘었다. 그런데 같은 조사에서 AI 결과물의 정확성을 신뢰한다는 응답은 29%에 그쳤다. 전년의 40%에서 오히려 떨어졌다. 익숙해질수록 신뢰가 오르는 보통의 기술 수용 곡선과 정반대다.
가장 큰 불만은 "거의 맞지만 정확히는 아닌" 코드였다. 같은 조사에서 응답자의 약 66%가 거의 맞는 AI 코드를 손보는 데 시간을 더 쓴다고 답했고, 약 45%는 AI가 만든 코드를 디버깅하는 것이 직접 작성하는 것보다 오래 걸린다고 응답했다.
완전히 틀린 답은 차라리 다루기 쉽다. 보자마자 버리면 그만이기 때문이다. 정작 까다로운 건 "거의 맞는" 답이다. 어디가 어긋났는지 한참 찾아야 하고, 멀쩡해 보이는 부분까지 다시 의심하게 된다. 거의 다 지은 의자에 앉아 보고 나서야 다리 하나가 부실하다는 걸 알게 되는 셈이다.
이 직관은 통제 실험으로도 확인됐다. 숙련된 오픈소스 개발자 16명에게 246개의 실제 작업을 무작위로 "AI 사용 허용" 또는 "사용 금지"로 배정한 연구가 있었다. 개발자들은 AI를 쓰면 24% 빨라질 것이라 예측했지만, 실제로는 AI를 썼을 때 19% 더 느렸다. 더 흥미로운 대목은, 실험을 마친 뒤에도 본인들은 AI 덕분에 20% 빨라졌다고 믿었다는 점이다. 체감과 실측 사이에 큰 괴리가 있었다. AI가 제시한 방향 자체가 틀린 경우는 드물었고, 숙련자의 눈높이에서 코드 품질과 유지보수성을 따지고 다듬는 과정에 시간이 더 들었다.
한편 AI가 만든 코드의 품질 문제를 다시 AI로 푸는 시도도 진행 중이다. 여러 AI 에이전트가 같은 코드를 동시에 분석하고 서로 교차 검토하게 하는 방식이 대표적이다. 도구가 더 좋아지면 품질 문제도 풀린다는 낙관론과, 숙련자의 검증 부담은 쉽게 사라지지 않는다는 신중론이 아직 맞선다.
직업별 노출도 · 신규 진입 감소
생산성이 늘면 기존 개발자에게는 좋은 일이다. 문제는 앞으로 개발자가 되려는 사람들이다. 신입이 맡던 일을 AI가 먼저 처리해 버리면, 노동시장의 입구가 좁아진다.
한 AI 기업이 2026년 3월 초 공개한 분석은 이 점을 분명히 보여 준다. 실제 업무 사용 데이터를 결합해 직업별 "노출도"를 산출했더니, 컴퓨터 프로그래머가 74.5%로 가장 높았다. 이어 고객 서비스 담당자(70.1%), 데이터 입력원(67.1%), 의료기록 전문가(66.7%), 금융·투자 분석가(57.2%) 순이었다. 반면 요리사, 정비공처럼 몸을 쓰는 직업의 노출도는 0에 가까웠다. 자동화 논의에서 흔히 우려하던 저숙련 일자리가 아니라, 평균 임금과 학위 보유 비율이 높은 직군이 앞자리를 차지했다는 점이 눈에 띈다.
채용 시장에서도 변화의 조짐이 잡힌다. 22~25세 청년층이 AI 노출도가 높은 직업에 새로 진입하는 비율은 2022년 대비 약 14% 줄었다. 흥미로운 건 25세 이상에서는 같은 감소 패턴이 나타나지 않았다는 점이다. 충격이 일자리 전반이 아니라 "입구"에서 먼저 나타나고 있다는 뜻이다. 실제로 일부 기업은 전문 개발자 대신 바이브 코딩을 잘 다루는 사람, 이른바 "바이브 코더"를 채용하기 시작했다.
여기서 작업 대체와 일자리 대체를 구분할 필요가 있다. AI가 한 직업의 특정 작업들을 대신하는 것(작업 대체)과, 직업 자체가 사라지는 것(일자리 대체)은 다르다. 현재는 대체로 작업 대체 단계로 평가된다. 노출도 60%인 분석가가 곧바로 쓸모없어지는 게 아니라, 고용주가 같은 인원으로 더 많은 산출을 얻게 된다는 의미다. 다만 그 효율이 쌓이면 신규 채용은 한계선에서 줄어든다.
SaaS 충격 · 가격 모델 전환 · 시장 전망
변화는 개발자 직군에만 머물지 않는다. 최근 AI 도구는 코딩을 넘어 디자인, 제품 관리, 마케팅까지 한꺼번에 다룬다. 예전에는 업무마다 특화된 소프트웨어를 따로 구매했지만, 이제는 AI 하나를 구독해 여러 일을 처리하는 그림이 그려진다. 그 충격은 기존 소프트웨어 회사들의 주가에서 또렷하게 나타났다.
2026년 1월 말부터 2월 초 사이, 한 AI 기업이 데스크톱에서 여러 업무를 자율적으로 처리하는 에이전트와 법무·회계 같은 분야별 특화 기능을 잇따라 공개하자, 약 48시간 만에 소프트웨어 종목에서 약 2,850억 달러(약 285 billion USD)의 시가총액이 증발했다. 시장은 이 사건을 "소프트웨어 검은 화요일"이라 부르기도 했다. 직원 1인당 한 자리씩 요금을 매기는 이른바 "좌석당 과금"(per-seat) 모델이 구조적 위기에 놓였다는 평가가 나왔고, 일부에서는 서비스형 소프트웨어(SaaS, Software as a Service)의 종말에 빗대 "SaaS 종말론"이라는 표현까지 등장했다.
좌석당 과금은 영화관 좌석을 떠올리면 쉽다. 직원 10명이 쓰면 10좌석 요금을 받는 구조다. 그런데 AI 에이전트 한 개가 직원 10명 몫의 일을 해 버리면, 회사는 더 이상 10좌석이 필요 없다. 좌석 수요가 줄면 좌석을 팔던 회사의 매출이 흔들린다. 이번 충격의 핵심 논리가 바로 이것이다.
이 변화는 추상적인 우려가 아니라 실제 숫자로 나타난다. 좌석당 과금을 주력으로 삼는 기업의 비중은 1년 사이 21%에서 15%로 떨어졌다. 그 자리를 메우는 건 사용량 기반(쓴 만큼 과금), 결과 기반(성과가 나야 과금) 같은 새 모델이다. 기본요금에 사용량을 얹는 혼합형(하이브리드) 모델이 가장 흔한 표준으로 자리 잡아 채택률이 약 41%에 이르렀다. 한 시장조사기관은 2030년까지 기업용 소프트웨어 지출의 40% 이상이 사용량·에이전트·결과 기반 모델로 옮겨 갈 것으로 내다본다. 일부 기업은 100명 규모의 영업 지원 인력을 통째로 AI 에이전트로 대체했고, 오래된 좌석제 강자 가운데 처음으로 좌석 수가 줄어든 곳도 나왔다.
한 대형 투자은행의 리서치는 응용 소프트웨어 시장 자체가 2030년 약 7,800억 달러(약 780 billion USD) 규모로 오히려 커질 것으로 본다. 그 대신 시장의 절반이 넘는(60%를 웃도는) 비중을 AI 에이전트가 차지하게 된다는 분석이다. 즉 파이가 줄어드는 것이 아니라, 파이 안에서 수익을 가져가는 주체가 "사람이 쓰는 좌석"에서 "일을 대신하는 에이전트"로 옮겨 간다는 것이다. 단기 주가 충격을 두고 시장이 사라진다고 읽는 것과, 수익 구조가 재편된다고 읽는 것은 전혀 다른 이야기다.
자연어 앱 빌더 · 도메인 지식의 가치
에이전트형 코딩 도구도 비개발자에게는 여전히 어렵다. 그래서 코드를 거의 보여 주지 않고 자연어 대화만으로 앱을 만들어 주는 도구들이 빠르게 성장했다. 한 북유럽 스타트업은 2026년 2월 한 달에만 매출 1억 달러를 더해 연간반복매출(ARR, Annual Recurring Revenue) 4억 달러를 넘어섰다. 직원 수가 150명 안팎인 점을 감안하면, 1인당 매출이 통상적인 소프트웨어 회사를 크게 웃도는 구조다.
이런 도구를 타고 비개발자들이 만든 서비스도 시장에 쏟아진다. 한 AI 기업이 연 개발 경진대회에서는 수상자 가운데 전통적인 의미의 개발자를 찾기 어려울 정도였다. 변호사, 의사, 음악가처럼 각자의 전문 영역 지식을 코드로 옮긴 작품들이 상위에 올랐다.
자율 실험 · 자율 수학 연구 · 전망
흐름은 코딩 단계에 머물지 않는다. 2026년 3월, 한 저명한 연구자가 약 630줄짜리 파이썬 스크립트를 공개했다. AI 에이전트가 스스로 실험을 설계하고, 코드를 고치고, 결과를 평가해 좋으면 남기고 나쁘면 버리는 과정을 반복하는 구조다. 사람이 하는 일은 "이런 방향으로 실험해 보라"고 적어 두는 것뿐이었고, 그렇게 사람 개입 없이 작은 언어 모델의 학습 효율이 약 11% 개선됐다.
코딩이 아닌 분야에서도 비슷한 사례가 나온다. 수학에서는 AI가 사람 개입 없이 연구 논문 수준의 결과를 만들어 낸 경우가 등장했고, 자율적으로 미해결 문제 일부를 풀어내기도 했다. 코드를 짜는 일을 넘어, 연구라는 행위 자체를 AI가 일부 떠맡기 시작한 것이다.
AI가 AI 연구를 돕는 이 루프를 흔히 재귀적 자기개선이라 부른다. 다만 지금의 사례는 AI가 자기 자신을 직접 개량하는 단계는 아니다. 더 작고 단순한 모델을 다듬는 수준에 가깝다. 그럼에도 실험 설계부터 실행, 분석, 다음 실험까지 며칠씩 걸리던 한 바퀴를 분 단위로 압축할 수 있다는 점에서, 진보의 속도 자체를 바꿀 가능성이 거론된다.
전망은 갈린다. 다음 세대 AI 연구를 사람 개입 없이 상당 부분 자동으로 수행하는 시대가 1~2년 안에 올 수 있다고 보는 업계 리더들이 있는가 하면, 검증과 안전 문제를 들어 그 속도를 신중하게 보는 견해도 만만치 않다.
바이브 코딩 1년의 그림을 정리하면 이렇다. 도구는 빠르게 좋아졌고 진입장벽은 낮아졌으며, 코드 산출량은 폭발했다. 그러나 그 이면에는 품질과 보안의 부채가 함께 쌓였고, 노동시장의 입구가 먼저 흔들렸으며, 소프트웨어 산업의 수익 구조는 좌석에서 결과로 옮겨 가는 중이다. "다 쓰지만 못 믿는" 신뢰의 역설과, 숙련자에게는 오히려 느려질 수 있다는 실측까지 겹친다. 어느 한쪽으로만 단정하기 어려운 전환의 한복판이다.
분명한 방향은 있다. 코드를 작성하고 정해진 문제를 푸는 일은 점점 AI 쪽으로 옮겨 간다. 그렇다면 사람에게 남는 몫은 두 가지로 모인다. 무엇을 만들지 정하고 새로운 질문을 던지는 창의적 사고, 그리고 그럴듯해 보이는 결과물을 의심하고 따져 보는 비판적 검증이다. 도구가 답을 빨리 내놓을수록, 어떤 질문을 던질지 그리고 그 답을 믿어도 되는지 가려내는 능력의 값어치는 오히려 커진다.
이 글의 수치는 2026년 5월 기준으로 공개된 복수의 자료를 교차 확인해 정리했다. 일부 통계는 표본·시점·측정 방식에 따라 해석이 달라질 수 있으며, 빠르게 변하는 분야인 만큼 이후 데이터로 그림이 수정될 수 있다. 특히 "AI 사용 시 개발자가 느려진다"는 결과와 소프트웨어 시장의 향방에 관한 전망은 자료 간 편차가 크므로, 단일 수치로 받아들이기보다 추세로 읽는 편이 안전하다.