앤트로픽의 재귀적 자기개선(RSI, Recursive Self-Improvement) 경고, 컴퓨텍스 2026의 엔비디아 RTX 스파크, 젠슨 황 방한과 서울 AI 기술센터, 마이크로소프트 빌드의 자체 모델 7종, 구글 젬마 4와 양자화 인식 훈련, 오픈AI 코덱스의 즉시 배포 기능, 그리고 메타 AI 비서가 드러낸 보안 구멍까지 — 한 주의 AI 뉴스를 주제별로 정리했다.
한 주의 가장 인상적인 사건은 새로운 기능이 아니라 기능의 실패에서 나왔다. 메타(Meta)의 AI 고객지원 비서가, 공격자에게 타인의 인스타그램 계정을 통째로 넘겨주는 통로가 되었다는 사실이 드러난 것이다. 방식은 충격적일 만큼 단순했다.
공격자는 표적 인스타그램 계정의 사용자명만 알면 됐다. 우선 가상사설망(VPN, Virtual Private Network)으로 자신의 접속 위치를 표적과 같은 국가로 위장한다. 플랫폼이 위치 기반으로 본인 확인을 보조하기 때문이다. 그다음 비밀번호 재설정 흐름에서 AI 고객지원 비서와의 대화를 연다. 그리고 비서에게 이렇게 요청한다. "이 계정에 새 이메일 주소를 연결해 달라."
놀랍게도 비서는 순순히 따랐다. 공격자가 제시한, 공격자가 통제하는 이메일 주소로 인증 코드를 발송했고, 공격자는 그 코드를 비서에게 되읽어 주는 것만으로 본인 확인을 통과했다. 그 직후 비서는 "비밀번호 재설정" 버튼을 제시했고, 공격자는 새 비밀번호를 설정해 계정의 실제 주인을 쫓아냈다. 보고된 바로는 백악관 관련 계정과 우주군 고위 인사의 계정을 포함한 수백 개의 유명 계정이 이 방식으로 탈취되어 다크웹에서 즉시 거래되었다.
호텔 프런트 직원에게 "412호 키 분실했어요, 새로 발급해 주세요"라고 했을 때, 직원이 신분증도 보지 않고 "예약자 본인 맞으시죠?"라고 묻고는 손님이 "네"라고 답하자 곧바로 새 키를 건네는 상황을 떠올려 보자.
여기서 더 황당한 점은, 본인 확인을 위해 보낸 인증 문자조차 손님이 불러준 새 전화번호로 발송했다는 것이다. 확인 절차 자체가 공격자의 손안에서 완결되도록 설계되어 있었던 셈이다.
보안 전문가들은 이를 고전적인 "혼란스러운 대리인(confused deputy)" 문제로 규정한다. 권한을 가진 주체(대리인)가, 그 권한을 쓸 자격이 있는지 검증하지 않고 요청자의 말을 그대로 실행해 버리는 결함이다. 이 비서는 계정 관리 시스템에 직접 접근하는 응용프로그래밍인터페이스(API, Application Programming Interface) 권한을 갖고 있었지만, 사람 상담원이라면 반사적으로 수행했을 단계—연락처를 바꾸기 전에 요청자가 진짜 계정 주인인지 확인하는 절차—가 빠져 있었다.
중요한 것은 이것이 전통적 의미의 코딩 버그가 아니라는 점이다. 코드는 의도대로 동작했다. 문제는 "AI 에이전트에게 얼마만큼의 권한을 넘길 것인가"라는 설계 결정에 있었다. 다단계 인증(MFA, Multi-Factor Authentication)을 켜둔 계정은 원래 버전의 공격을 대체로 막아냈지만, 그조차 절대적 방어가 되지는 못했다.
AI 에이전트 시대의 진짜 어려운 문제는 인증(authentication)이 아니라 인가(authorization)다. "당신이 누구인지"를 확인하는 일보다, "당신이 이 행동을 할 자격이 있는지"를 매 행동마다 검증하는 일이 훨씬 까다롭다. 고객 데이터에 연결된 시스템에 에이전트를 붙일 때, 권한을 넓게 위임할수록 공격 표면도 함께 넓어진다. 거대 기업의 정상급 엔지니어들조차 이 함정을 피하지 못했다는 사실이 경각심의 무게를 더한다.
메타는 문제를 수정했다고 밝혔으나, 일부 연구자들은 수정 이후에도 유사한 탈취가 이어졌다고 보고했다. 표면의 버튼만 제거되고 그 아래 AI 엔드포인트는 여전히 접근 가능했다는 지적이다. AI를 제품에 붙이는 모든 개발자에게 이 사례는 분명한 메시지를 던진다. 편의를 위해 권한을 넓게 열어둔 순간, 그 편의는 그대로 침입 경로가 된다.
이번 주 가장 무게 있는 발표는 새 모델이 아니라 한 편의 글이었다. 앤트로픽(Anthropic)이 "AI가 스스로를 만들 때(When AI Builds Itself)"라는 제목의 보고서를 공개하며, 인공지능이 인간 연구자를 보조하는 단계를 넘어 다음 세대 AI를 직접 설계하고 개발하는 단계—이른바 재귀적 자기개선(RSI, Recursive Self-Improvement)—가 생각보다 가까워졌다고 경고한 것이다.
이 보고서는 AI 발전을 세 단계로 구분한다. 첫째, 인간이 모든 개발 단계를 주도하던 과거. 둘째, AI가 인간의 개발을 보조하는 현재. 셋째, AI가 인간의 개입 없이 자신보다 뛰어난 후속 모델을 자율적으로 설계·학습시키는 미래. 보고서의 핵심 주장은 이미 둘째 단계를 넘어 셋째 단계의 초입에 진입할 조짐이 보인다는 것이다.
수치는 구체적이다. 앤트로픽 저장소에 병합되는 코드 중 자사 모델 클로드가 작성한 비중은 코딩 에이전트 출시 전 한 자릿수에서 80% 이상으로 치솟았고, 엔지니어의 분기별 코드 생산량은 수년 전의 약 8배에 달했다. 모델이 혼자 처리할 수 있는 작업의 시간 길이는 약 4개월마다 두 배로 늘어, 2년 전 수 분 단위였던 것이 이제는 수 시간 단위로 확장됐다.
장인이 도제를 가르쳐 가구를 만든다고 하자. 처음엔 장인이 모든 대패질을 직접 했다(1단계). 이제는 도제가 대부분의 작업을 하고 장인은 감독만 한다(2단계). 다음 단계는 도제가 스스로 더 뛰어난 도제를 길러내는 것이다(3단계).
인간은 하루 24시간 일할 수 없지만, 이 도제는 연산 자원만 있으면 멈추지 않는다. 그리고 더 뛰어난 도제가 또 다음 도제를 길러내는 순환이 시작되면, 발전은 단리가 아니라 복리로 누적된다. 보고서가 우려하는 지점이 바로 이 복리의 고리다.
가장 인상적인 검증 방식은 이렇다. 연구자들은 실제 코딩 세션 중에서 연구자가 '잘못된 길로 빠졌다가 되돌아온' 순간들(분석에 쓰인 사례는 129건)을 골랐다. 그리고 모델에게 그 갈림길 직전까지의 맥락만 보여준 뒤 "다음에 무엇을 하겠는가"를 물었다. 세션의 최종 결과를 아는 별도의 심판 모델이 인간과 모델 중 누구의 다음 수가 더 나았는지 판정했다. 다만 연구소 스스로 강조했듯, 의도적으로 '인간의 선택에 개선 여지가 있던 순간'만 골랐으므로 이는 인간과 모델의 동등 비교는 아니다.
그럼에도 추세는 분명했다. 2025년 후반 모델은 이 까다로운 순간들에서 인간을 약 절반의 경우에 앞섰고, 2026년 봄의 실험 모델(미소스 프리뷰, Mythos Preview)은 약 64%까지 비율을 끌어올렸다. 단순한 코드 구현을 넘어 '연구 방향을 조타하는' 판단력까지 모델이 잠식하기 시작했다는 신호다.
그래서 앤트로픽은 이례적으로 진지한 제안을 내놓았다. 사회 구조와 정렬(alignment) 연구가 기술 발전 속도를 따라잡을 수 있도록, 주요 AI 개발사들이 함께 개발 속도를 늦추거나 일시 중단할 수 있는 검증 가능한 메커니즘을 미리 준비해야 한다는 것이다.
이 제안의 현실성에는 무거운 의문이 따른다. 일시 중단이 효과를 내려면 경쟁 기업과 여러 나라 정부가 같은 제약을 동시에 받아들여야 하지만, 이를 강제할 조약은 없고 경쟁은 오히려 격화되고 있다. 비판자들은 더 근본적인 지적도 한다. 보고서가 보여준 것은 결국 '훨씬 빨라진 코딩'일 뿐, 인간 수준의 범용 지능(AGI)이 달성됐다는 증거는 아니라는 것이다. RSI는 성취됐을지 몰라도 AGI는 여전히 별개의, 더 어려운 문제라는 반론이다.
그럼에도 이 글이 의미심장한 이유는, 경쟁의 선두를 달리는 기업이 스스로 브레이크의 필요성을 공개적으로 제기했다는 점에 있다. 그 동기가 안전에 대한 진심이든, 경쟁사의 속도를 늦추려는 전략이든, 아니면 둘 다이든—'AI가 AI를 만드는' 시나리오가 더는 학회의 사고실험이 아니라 사업 보고서의 수치로 논의되기 시작했다는 사실 자체가 이 주의 가장 큰 변화다.
대만 타이베이에서 열린 정보기술(IT) 박람회 컴퓨텍스(COMPUTEX) 2026 기조연설에서, 엔비디아(NVIDIA) 최고경영자 젠슨 황은 도발적인 주장을 내놓았다. "지난 40년 동안 PC는 앱을 실행하는 기계였다. 클릭하고, 타이핑했다. 이제는 묻기만 하면 PC가 일을 처리한다." 그가 공개한 것은 윈도우 기반의 새로운 통합 칩 'RTX 스파크(RTX Spark)'였다.
이 칩의 핵심은 통합 설계에 있다. 그래픽처리장치(GPU, Graphics Processing Unit)와 중앙처리장치(CPU, Central Processing Unit)를 하나의 패키지로 묶고, 둘이 같은 메모리 풀을 공유하는 구조다. 발표된 사양은 블랙웰 계열 GPU(6,144개의 연산 코어와 FP4 정밀도를 지원하는 5세대 텐서 코어)와 20코어 그레이스(Grace) CPU를 칩-대-칩 인터커넥트(NVLink-C2C)로 연결하고, 최대 128기가바이트(GB)의 통합 메모리를 얹는 형태다.
이 통합 메모리 설계 자체는 새롭지 않다. 이미 애플 실리콘 기반의 맥(Mac) 제품군이 같은 철학으로 시장을 흔들어 왔고, 엔비디아가 앞서 내놓은 개발자용 소형 워크스테이션 'DGX 스파크'도 동일한 칩 계열(GB10)을 썼다. 차이는 운영체제에 있다. DGX 스파크는 리눅스 기반이라 일반 사무 사용자가 쓰기엔 제약이 많았다. 이번 칩은 그 설계를 윈도우 생태계로 옮겨, 대중화를 노린다는 점이 핵심이다.
전문가용 대형 주방기구를 가정용 콘센트와 주방 크기에 맞춰 다시 만든 것에 가깝다. 성능의 뼈대는 같지만, 전력을 줄이고 익숙한 인터페이스(윈도우)를 입혀 "특별한 사람"이 아니라 "보통 사람"이 쓰도록 문턱을 낮춘 것이다.
다만 실사용 관점의 냉정한 평가도 필요하다. 통합 메모리 기기는 넉넉한 용량 덕에 큰 모델을 통째로 적재할 수 있지만, 메모리 대역폭이 데이터센터급 가속기에 한참 못 미친다. 무거운 코딩 작업이나 대형 추론을 시키면 응답이 답답하게 느껴진다. 결국 성능과 속도를 중시하는 사용자는 다시 클라우드 모델로 회귀하는 경향이 크다. 가격 추정치도 3,000달러에서 7,000달러까지로 넓게 거론되며, 첫 세대 제품의 수요에는 물음표가 붙는다.
그럼에도 방향성만큼은 분명하다. 엔비디아는 단순히 칩 하나가 아니라, 데스크톱형 기기와 개발자용 워크스테이션을 함께 내놓고 다른 PC 제조사들과 칩을 공유하며 '윈도우 기반 AI PC' 생태계 전체를 조성하려 한다. 마우스와 키보드 대신 자연어로 명령하면, 에이전트가 목표를 세우고 도구를 호출하며 결과를 스스로 평가·개선하는 새로운 컴퓨팅 방식—그 청사진을 하드웨어 레벨에서 못 박았다는 데 의미가 있다. 데이터센터를 넘어 '엣지(edge)'로, 즉 개인 기기에서 고급 AI를 돌리는 방향으로 무게중심이 이동하고 있다는 신호다.
마이크로소프트(Microsoft)의 연례 개발자 행사 '빌드(Build) 2026'에서는, 한 번에 일곱 종의 새 자체 AI 모델이 공개됐다. 그동안 오픈AI와의 제휴에 크게 기대 온 마이크로소프트가, 추론·코딩·이미지·음성·전사를 아우르는 자체 모델 진영을 본격적으로 구축하겠다는 선언이었다.
라인업의 간판은 첫 추론(reasoning) 모델 'MAI-씽킹-1(MAI-Thinking-1)'이다. 350억 개의 활성 파라미터를 가진 전문가 혼합(MoE, Mixture-of-Experts) 구조에 256K 토큰의 맥락 창을 갖춘 중량급 모델로, 다른 모델로부터 지식을 베끼는 증류(distillation) 없이 상업적으로 정제된 데이터로 처음부터 학습했다는 점을 내세웠다. 독립 평가자들의 블라인드 비교에서 클로드 소네트 4.6보다 선호되었고, 소프트웨어 엔지니어링 벤치마크(SWE-Bench Pro)에서는 클로드 오퍼스 4.6에 필적한다고 주장했다.
거대한 단일 두뇌 대신, 분야별 전문가 여러 명을 한 팀에 두고 질문마다 가장 적합한 소수만 깨워 일을 시키는 구조다. 전체 파라미터(예: 수천억 개)는 크지만, 한 번에 활성화되는 것은 일부(예: 350억 개)뿐이라 연산 비용을 아낄 수 있다. 최근 대형 모델 대부분이 이 방식을 채택하고 있다.
나머지 라인업도 촘촘하다. 이미지 모델 'MAI-이미지-2.5'는 공개 평가 아레나에서 이미지 생성 부문 상위권에 진입하며 강력한 경쟁 모델들 사이에 자리를 잡았다. 음성을 텍스트로 바꾸는 전사(transcribe) 모델 'MAI-트랜스크라이브-1.5'는 43개 언어를 지원하며, 한 시간 분량의 오디오를 수십 초 만에 글로 옮길 만큼 빠른 속도와 표준 벤치마크 최상위권의 정확도를 동시에 달성했다고 한다. 텍스트를 음성으로 바꾸는 'MAI-보이스-2'는 15개 이상의 추가 언어와 감정·속도 조절 기능을 갖췄고, 깃허브 작업에 최적화된 효율형 코딩 모델 'MAI-코드-1'은 깃허브 코파일럿과 비주얼 스튜디오 코드에 곧바로 탑재됐다.
주목할 변화는 이 모델들이 자사 제품 안에만 머물지 않는다는 점이다. 오픈라우터(OpenRouter) 등 외부 모델 서빙 플랫폼에서도 제공되며, 개발자가 직접 가중치를 미세조정할 수 있는 길까지 열렸다. 외부 제휴에 의존하던 기업이, 독자적 모델 신뢰도를 별도로 쌓아 올리겠다는 의지의 표현이다.
같은 행사에서 또 하나의 의미 있는 협업이 발표됐다. 인기 오픈소스 에이전트 '오픈클로(OpenClaw)'를 윈도우 환경 안에서 안전하게 실행할 수 있도록 공식 통합한다는 것이다. 기업 환경에서 이런 에이전트를 쓰려면 보안·기밀 관리가 까다로웠는데, 이를 관리 가능한 형태로 운영체제 차원에서 기본 제공하겠다는 구상이다. 해당 에이전트는 오픈소스로 계속 유지되어 누구나 자유롭게 변형할 수 있다.
윈도우 사용자 기반이 압도적으로 넓다는 점을 고려하면 파급력은 작지 않다. 별도 설치 과정 없이 운영체제에 기본 탑재된 에이전트를 바로 띄울 수 있다면, 사무 영역에서의 AI 사용량이 크게 늘어날 여지가 있다. 같은 맥락에서, 마이크로소프트는 아웃룩 메일함과 팀즈 메신저를 상시 모니터링하며 '결정을 기다리는 사안'을 알려주는 상시 작동형 에이전트 '스카우트(Scout)'도 함께 선보였다. 매번 지시하지 않아도 스스로 일을 이어가는 '오토파일럿'형 비서가 본격화되는 흐름이다.
이 개발자 행사장 앞에서는, 대규모 데이터센터 건설에 반대하는 시위가 벌어졌다. 일부는 비행기에 현수막을 매달아 공중에서까지 메시지를 띄웠다. 전력 소비, 환경 부담, 그리고 데이터센터가 어디에 쓰이는가를 둘러싼 사회적 긴장이, AI 인프라 확장의 그늘에서 점점 또렷한 목소리를 내고 있음을 보여주는 장면이다.
이번 주는 가중치(weight)를 공개해 누구나 내려받아 쓸 수 있는 '오픈 웨이트' 모델이 쏟아진 한 주이기도 했다. 폐쇄형 최상위 모델과의 격차는 여전하지만, 그 간극이 빠르게 좁혀지고 있다는 사실이 여러 발표에서 동시에 확인됐다.
엔비디아는 자사 오픈 모델 계열의 최상위 버전 '네모트론 3 울트라(Nemotron 3 Ultra)'도 공개했다. 5,500억 개 규모(활성 약 550억 개)의 MoE 추론 모델로, 가중치뿐 아니라 학습 데이터와 레시피까지 관대한 라이선스로 함께 공개했다. 독립 분석 기관 아티피셜 애널리시스(Artificial Analysis)의 종합 지능 지수에서 48점으로 미국발 오픈 웨이트 모델 1위를 기록했으나, 중국 진영의 선두 '키미 K2.6'(54점)에는 6점 뒤처졌다. 대신 추론 속도에서 두드러져, 사전 공개 환경에서 초당 300토큰 이상을 처리하며 비슷한 규모의 경쟁 모델보다 몇 배 빠른 성능을 보였다.
'오픈 웨이트'는 요리의 완성품(닫힌 모델)이 아니라 레시피와 반조리 재료까지 통째로 받는 것에 가깝다. 직접 양념을 바꾸고 자기 식당 메뉴로 가공할 수 있다. 반도체 기업이 오픈 모델을 많이 풀수록, 기업들이 그것을 받아다 가공할 때 결국 자사의 가속기를 쓰게 되므로 이는 영리한 생태계 전략이기도 하다.
엔비디아는 로봇·자율주행을 위한 물리 AI(physical AI) 모델 '코스모스 3(Cosmos 3)', 음성을 실시간으로 텍스트로 옮기는 저지연 스트리밍 전사 모델 '네모트론 3.5 ASR' 등도 함께 오픈했다. 로봇 훈련이나 가상 세계의 동작 생성에 쓰일 수 있는 이 모델들 역시 다양한 기업이 자체 시스템에 이식할 수 있도록 공개된 것이다.
한편 구글에서는 경량 오픈 모델 '젬마 4(Gemma 4)' 계열의 새 라인업이 나왔다. 120억 파라미터의 중간 체급 '젬마 4 12B'가 추가되어, 고급 추론과 엣지 효율성 사이의 빈자리를 메웠다. 흥미로운 점은 일부 멀티모달 벤치마크에서 더 큰 젬마 4 26B 모델을 앞섰다는 것이다. 이미지·오디오를 별도 변환 없이 직접 처리하는 통합 트랜스포머 구조 덕에, 16기가바이트 램의 노트북에서도 구동될 만큼 가벼워졌다.
구글은 '양자화 인식 훈련(QAT, Quantization-Aware Training)'을 적용한 버전도 별도로 공개했다. 일반적으로 모델을 작게 압축(양자화)하면 성능이 떨어지는데, 처음부터 압축을 염두에 두고 학습시키면 그 손실을 크게 줄일 수 있다. 그 결과 메모리 사용량을 약 3분의 1 수준으로 낮추면서도 원본에 가까운 정확도를 유지했다.
모델의 수많은 숫자(가중치)를 더 적은 비트로 표현해 용량을 줄이는 기술이다. 고화질 사진을 적당히 압축해 파일 크기를 줄이는 것과 비슷하다. 다만 무작정 압축하면 화질이 망가지듯 성능이 떨어진다. QAT는 "어차피 압축될 것"을 알고 학습시켜, 압축 후에도 또렷함을 유지하도록 미리 대비시키는 방법이다.
이미지 분야에서도 공개 모델의 약진이 두드러졌다. 오픈 웨이트로 공개된 '이디오그램 4.0(Ideogram 4.0)'은 텍스트(특히 필기체나 디자인 글씨)를 깨뜨리지 않고 또렷하게 렌더링하는 능력으로 호평받으며, 공개 평가 아레나에서 최상위 폐쇄형 모델 바로 아래 그룹에 자리 잡았다. 다만 이 모델은 비상업 라이선스라 직접적인 영리 활용에는 제약이 있다. 4K 고해상도를 지원하는 폐쇄형 모델 '리브 2.0(Reve 2.0)'도 등장해, 이미지의 특정 영역만 자연스럽게 변형하는 기능에서 강세를 보이며 아레나 상위권에 올랐다.
음성 합성(TTS, Text-to-Speech) 분야는 한 주에 여러 모델이 쏟아질 만큼 경쟁이 뜨거웠다. 100개 언어를 지원하며 감정과 속도를 자연스럽게 조절하는 공개 모델, 단 몇 초의 음성 샘플만으로 목소리를 복제하는 제로샷(zero-shot) 모델, 리더보드 1위에 오른 억양 재현형 모델 등이 잇따라 공개됐다. 영상 쪽에서도, 한 영역만 지목해 객체를 추가·제거·변형하는 옴니(omni)형 편집 모델의 오픈 버전이 나왔고, 단일 가속기에서 실시간으로 캐릭터 영상을 생성하며 시청자와 대화하는 연구 시연도 등장했다. 라이브 커머스나 실시간 방송 영역을 AI로 공략하려는 흐름이 본격화되고 있음을 보여준다.
오픈 웨이트 진영에서는 '미니맥스 M3(MiniMax M3)'도 발표됐다. 100만 토큰의 넉넉한 맥락 창과 네이티브 멀티모달리티를 갖춘 이 에이전트형 모델은, 종합 지능 점수에서 오픈 웨이트 진영 1위에 오르며 폐쇄형 중상위 모델에 근접했다.
| 구분 | 특징 | 의미 |
|---|---|---|
| 네모트론 3 울트라 | 5,500억 규모 MoE, 학습 데이터·레시피까지 공개, 초당 300+토큰 | 미국발 오픈 모델 최고 지능, 중국 선두엔 소폭 열세 |
| 젬마 4 12B | 120억 파라미터, 멀티모달, 16GB 램 구동, QAT 버전 | 작아지면서도 성능 유지—온디바이스 실용화 진전 |
| 이디오그램 4.0 | 텍스트 렌더링·영역 편집 강점, 비상업 라이선스 | 폐쇄형 최상위 바로 아래까지 추격 |
| 음성·영상 모델군 | 100개 언어 TTS, 제로샷 음성 복제, 실시간 캐릭터 생성 | 방송·커머스 영역의 AI 자동화 가속 |
공통된 흐름은 둘이다. 첫째, 오픈 웨이트 모델의 품질이 폐쇄형 최상위와 '같지는 않아도 충분히 쓸 만한' 지점에 빠르게 도달하고 있다는 것. 둘째, 같은 성능을 점점 더 작고 효율적인 형태로 담아내고 있다는 것. 이 두 흐름이 만나는 지점에서, 개인 기기에서 고급 AI를 돌리는 미래—앞서 본 AI PC가 겨냥하는 바로 그 지점—가 조금씩 현실에 가까워지고 있다.
모델 경쟁과 하드웨어 발표의 배경에는, 점점 더 노골적으로 드러나는 한 가지 진실이 있다. 컴퓨팅 파워가 곧 권력이고, 그 권력에는 천문학적 비용이 따른다는 것이다. 이번 주, 스페이스X(SpaceX)가 상장을 준비하며 제출한 서류에서 이 진실이 숫자로 모습을 드러냈다.
해당 서류에 따르면, 세계 최대 규모의 자체 컴퓨팅 자원을 보유한 것으로 알려진 구글이, 스페이스X로부터 약 11만 개의 엔비디아 GPU를 포함한 컴퓨팅 자원을 임대하는 계약을 맺었다. 자체 전용 칩과 방대한 데이터센터를 가진 기업조차, 폭증하는 AI 수요를 감당하지 못해 외부 자원을 빌려 쓰는 상황에 이른 것이다.
규모가 압도적이다. 월 사용료만 약 9억 2천만 달러(원화로 약 1조 2천억 원)이며, 2026년 가을부터 2029년 중반까지 이어지는 계약 총액은 약 300억 달러에 달한다. 이 자원은 본래 xAI가 자체 용도로 구축한 미국 멤피스의 '콜로서스(Colossus)' 데이터센터 설비로, 스페이스X의 xAI 인수를 거쳐 스페이스X 자산이 됐다. 비슷한 시기 앤트로픽도 같은 데이터센터의 가용 자원 전체를 월 12억 5천만 달러에 빌리는 계약을 맺은 것으로 알려졌다.
유전을 가진 정유 대기업조차 원유가 모자라, 새로 유전을 사들인 항공사로부터 매달 1조 원어치 기름을 사다 쓰는 격이다. 로켓을 쏘아 올리던 기업이 어느새 슈퍼컴퓨터를 임대하는 사업으로 영역을 넓혔고, 컴퓨팅 자원은 발사 역량이나 에너지처럼 '전략 물자'가 되었다.
이 한 건의 계약은 AI 시대의 경제 구조를 압축해 보여준다. 모델을 학습하고 서비스하는 데 드는 연산 수요가, 세계 최대 자본을 가진 기업의 자체 인프라마저 초과할 만큼 폭발적이라는 것. 그리고 그 수요를 충당하는 '컴퓨팅 임대업'이 항공·통신 못지않은 전략 산업으로 부상하고 있다는 것. 데이터센터 반대 시위가 거세지는 사회적 긴장도, 따지고 보면 이 거대한 수요 곡선의 그림자다.
모델과 인프라의 거대 서사 아래에서, 개발자의 일상도 빠르게 바뀌고 있다. 이번 주에는 코드를 짜는 것을 넘어, 만든 결과물을 배포하고 테스트하는 단계까지 AI가 떠맡는 도구들이 등장했다.
오픈AI(OpenAI)의 코딩 에이전트 코덱스(Codex)에는 명령 한 줄로 웹사이트를 즉시 배포하는 '사이트(Sites)' 기능이 추가됐다. "다가오는 행사를 관리할 사이트를 만들어 달라"고 요청하면, 코드 작성은 물론 배포까지 자동으로 처리되어 전용 도메인의 접속 주소가 곧바로 생성된다. 별도의 배포 플랫폼에 연결할 필요가 없어진 것이다. 이는 그동안 '바이브 코딩'(자연어로 설명만 하면 앱이 만들어지는 방식)을 제공하던 여러 스타트업의 핵심 기능을, 오픈AI가 통째로 흡수했음을 의미한다.
코덱스에는 iOS 앱 개발 플러그인도 추가됐다. 앱을 빌드하라고 지시하면 시뮬레이터까지 자동으로 띄워, 작성·실행·테스트를 한 환경에서 이어갈 수 있다. 전통적인 개발 환경 없이도 앱을 만들고 검증하는 길이 열린 셈이다.
예전에는 글을 쓰는 사람(개발자), 인쇄하는 사람(빌드), 서점에 배본하는 사람(배포)이 각각 따로 있었다. 이제는 한 명의 비서가 원고 작성부터 인쇄, 진열까지 한 번에 처리한다. 진입 장벽이 극적으로 낮아지는 만큼, 누구나 손쉽게 결과물을 세상에 내놓을 수 있게 된다.
그 결과는 통계로 나타난다. 에이전트형 AI가 보급되면서 모바일 앱 출시 건수는 가파르게 수직 상승하는 추세를 보인다. 반면 앱에 대한 사용자 리뷰는 오히려 줄어드는 흐름이 관찰된다. 만들어지는 것은 폭발적으로 늘지만, 검증과 선별은 그 속도를 따라가지 못하는 비대칭이 드러나는 대목이다.
편의가 늘어나는 만큼, 비용 구조도 바뀌고 있다. 깃허브 코파일럿(GitHub Copilot)이 6월 1일부로 정액 구독에서 사용량 기반 요금제로 전환했다. 각 요금제에는 매월 일정량의 '깃허브 AI 크레딧'이 포함되고, 초과분은 추가 구매하는 방식이다. 이 변화의 배경에는 에이전트형 작업이 과거보다 훨씬 많은 연산을 소비한다는 현실이 있다.
사용량 기반 요금제에서는, 복잡한 작업 하나를 에이전트에게 맡길 때마다 비용이 빠르게 누적될 수 있다. 한 번의 다단계 코딩 세션이 수십 달러를 소비했다는 보고도 나온다. '무제한'을 전제로 작업하던 습관 그대로 쓰다가는 예상치 못한 요금 폭탄을 맞을 수 있으므로, 예산 한도 설정과 사용량 모니터링이 필수가 됐다.
이는 코파일럿만의 사정이 아니다. AI 서비스 전반이 적자를 감수하며 무제한에 가까운 접근을 제공하던 시기를 지나, '쓴 만큼 낸다'는 원칙으로 수렴하고 있다. 에이전트가 강력해질수록 한 작업에 드는 연산이 커지고, 그 비용을 누군가는 부담해야 하기 때문이다. 앞 절에서 본 천문학적 인프라 비용이, 결국 개별 사용자의 요금 청구서로 흘러 내려오는 구조다.
소프트웨어의 격변과 나란히, 물리 세계의 AI—로봇—도 빠르게 진화했다. 이번 주 공개된 시연들은 휴머노이드 로봇이 데모를 넘어 실용의 문턱에 다가서고 있음을 보여줬다.
한 시연에서는 사람 무용수의 동작을 실시간으로 따라 하는 원격 조작(teleoperation) 기술이 공개됐다. 무용수가 춤을 추면 여러 대의 로봇이 동시에 같은 동작을 재현해, 군무를 정확히 맞추는 장면이 연출됐다. 공연이나 행사 영역에서의 활용 가능성을 시사한다. 또 다른 휴머노이드는 무거운 소방 장비를 들고 험한 지형을 걷고, 언덕을 오르며, 계단을 통과하는 데모를 선보였다. 재난 현장 투입 같은 실무 적용을 겨냥한 모습이다.
한 소비자용 휴머노이드 브랜드는 사람과 흡사한 외형의 '컴패니언형' 로봇을 예고하기도 했다. 감정 계열 AI 모델을 탑재해 상호작용하는, 등신대 크기의 정교한 로봇이다. 다른 한편으로, 격투 시연 중인 로봇이 예상보다 빠르고 강한 타격을 보여주며 화제가 되기도 했다. 로봇의 물리적 능력이 사람의 직관적 예상을 넘어서기 시작했다는, 가볍지만 의미심장한 신호다.
구글은 사용자의 메일·일정 등 개인 데이터와 연동해 맞춤형 제안을 내놓는 실험 기능을 선보였다. 오픈AI는 챗GPT가 지메일(Gmail) 맥락을 반영해 답장을 쓰고 직접 발송까지 하는 기능을 추가했고, 여러 대화에 걸쳐 학습하며 기억을 종합하는 '드리밍(dreaming)'식 메모리 개선도 내놓았다. 편의는 커지지만, 그만큼 사적·업무적 데이터가 AI 서비스로 흘러 들어간다는 점은 사용자가 의식해야 할 대목이다.
이번 주를 관통한 사건들은 서로 떨어진 듯 보이지만, 하나의 질문으로 수렴한다. "AI에게 얼마만큼의 자율과 권한을 넘길 것인가." 권한을 넘긴 비서가 계정을 통째로 내준 보안 사고도, 코드를 스스로 쓰고 다음 모델을 설계하기 시작한 RSI 논의도, 자연어 한마디로 앱을 배포하는 개발 도구도, 사람을 따라 군무를 추는 로봇도—모두 같은 질문의 다른 얼굴이다.
당장의 관전 포인트는 분명하다. 애플의 세계 개발자 회의(WWDC, Worldwide Developers Conference)가 현지 시각 6월 8일 개막한다. 운영체제에 AI 역량이 어떤 방식으로 통합될지가 초점으로, 구글과의 계약을 통해 애플 기기용으로 별도 구축된 제미나이(Gemini) 모델이 탑재될 것이라는 관측도 나온다. 결과에 따라 모바일·PC 생태계의 무게중심이 다시 움직일 수 있다.
한국의 입장에서도 이 주는 의미가 컸다. 젠슨 황 CEO가 컴퓨텍스 직후 방한해 SK·LG·네이버 등 주요 그룹 수장들과 잇따라 회동했고, 엔비디아는 서울을 유력 후보지로 물리 AI 중심의 'AI 기술센터' 설립에 착수하며 디지털 트윈·로보틱스 분야 박사급 인재 채용 공고를 냈다. 고대역폭메모리(HBM, High Bandwidth Memory)·제조·로봇 역량을 두루 갖춘 한국을 단순 부품 공급처가 아니라 연구개발 협력 거점으로 삼겠다는 신호다. 거대한 컴퓨팅 수요 곡선과 물리 AI의 부상이 만나는 지점에서, 한국의 산업 자산이 어떤 역할을 맡을지가 앞으로의 관전 포인트로 남는다.
한 주 동안 벌어진 일들을 모아 놓고 보면, 공통의 리듬이 읽힌다. 능력은 기하급수로 늘고, 비용은 현실로 청구되며, 권한의 경계는 시험대에 오른다. AI가 AI를 만드는 시대의 문턱에서, 가장 중요한 질문은 "무엇이 가능한가"가 아니라 "무엇을, 누구에게, 어디까지 맡길 것인가"가 되어가고 있다.