jacobhan.me
AI 산업 리포트

Google I/O 2026과 그 주변: 2026년 5월 AI 산업 종합 리포트

한 주 사이에 프런티어 모델 발표, 개발 도구의 구조 변화, 대규모 공급망 공격, 그리고 80년 묵은 수학 난제의 해결까지 겹쳐 일어났다. 2026년 5월 중순의 인공지능(AI, Artificial Intelligence) 지형을 한자리에 정리한다.

목차

  1. 개발 도구를 겨냥한 공급망 공격
  2. Google I/O 2026: 100가지 발표의 핵심
  3. Anthropic: 보안 모델, 인재, 컴퓨트, 흑자 전환
  4. OpenAI: 80년 난제의 해결과 Codex
  5. 코딩 모델 경쟁의 재편
  6. 중국과 오픈소스 진영의 추격
  7. 로보틱스: 명령에서 동작까지
  8. AI를 둘러싼 사회적 긴장
  9. 정리: 무엇이 달라졌나

개발 도구를 겨냥한 공급망 공격

이번 달의 보안 뉴스는 평범한 데이터 유출이 아니라, 개발자가 매일 쓰는 도구 자체가 무기가 된 사건이었다. 5월 18일, 널리 쓰이는 VS Code(Visual Studio Code) 확장 프로그램 가운데 하나인 Nx Console의 변조된 버전이 공식 마켓플레이스에 올라왔다. 마켓에 노출된 시간은 약 11-18분에 불과했지만, 편집기의 자동 업데이트 기능 탓에 그 짧은 사이에 설치 기반을 타고 악성 코드가 개발자 PC로 흘러 들어갔다.

이 확장 프로그램은 겉보기에는 정상과 똑같이 동작하면서, 실행 시점에 숨겨진 명령을 돌려 디스크와 메모리에 저장된 자격증명을 긁어모았다. 클라우드 접근 키, 지속적 통합/배포(CI/CD) 토큰, 그리고 AI 코딩 도구의 인증 정보까지 광범위하게 노렸다. 그 결과 GitHub는 자사의 내부 저장소 약 3,800개가 외부로 유출됐다고 확인했다. 다행히 일반 사용자와 기업 고객이 GitHub에 올려둔 코드가 털린 것은 아니며, 유출 범위는 GitHub 내부 저장소로 한정됐다.

주목할 점은 침투 경로다. 공격의 시작은 오픈소스 프로젝트 기여자의 GitHub 토큰 탈취였고, 이 토큰으로 정상 저장소에 악성 커밋을 밀어 넣어 확장 프로그램을 변조했다. 다시 말해 '신뢰받는 유지보수자' 한 명의 계정이 뚫리자, 그를 신뢰하던 수백만 설치 기반 전체가 잠재적 피해 범위로 바뀐 셈이다. 같은 공격 집단이 주도한 일련의 공급망 공격 물결 속에서 PHP(개인 홈페이지 도구에서 출발한 서버용 프로그래밍 언어) 생태계의 다국어 처리 패키지를 포함해 다른 오픈소스 프로젝트들도 잇따라 표적이 됐다.

기여자 토큰 탈취 정상 유지보수자 계정 침해 변조 확장 배포 마켓 노출 11-18분 자동 업데이트 전파 자격증명 수집 클라우드 키 · 토큰 AI 도구 인증정보 저장소 유출 내부 코드 약 3,800개 외부 반출 신뢰의 연쇄가 곧 공격의 경로가 된다
변조된 개발 도구를 통한 공급망 공격의 단계. 한 계정의 신뢰가 전체 설치 기반으로 번진다.
비유

아파트 단지의 마스터키를 가진 관리소장이 신원을 도용당하면, 입주민이 각자 문을 아무리 잘 잠가도 소용이 없다. 오픈소스 도구의 '신뢰받는 유지보수자' 계정이 바로 그 마스터키다. 자물쇠(개별 비밀번호)를 강화하는 것만으로는 부족하고, 마스터키 자체의 발급과 검증 체계를 다시 설계해야 한다는 것이 이번 사건의 교훈이다.

실무 차원의 대응은 단순하지만 번거롭다. 외부 라이브러리 의존도를 줄이는 데는 한계가 있으므로, 클라우드 접근 키와 토큰을 주기적으로 폐기-재발급하고, 다중 인증을 강제하며, 탐지를 위한 로그를 충분히 남기는 기본 통제를 강화하는 편이 현실적이다. 특정 패치 하나가 제때 도착하기를 기대하기보다, 어떤 키가 새도 피해가 제한되도록 설계해 두는 쪽이 안전하다.

Google I/O 2026: 100가지 발표의 핵심

5월 19일 열린 Google I/O 2026은 100가지에 달하는 발표를 쏟아냈다. 관통하는 방향성은 분명했다. AI를 따로 찾아가 쓰는 별도의 서비스가 아니라, 사용자가 머무는 거의 모든 제품에 기본으로 녹여 넣겠다는 것이다. Gemini 앱의 월간 활성 사용자(MAU, Monthly Active Users)는 1년 전 4억 명에서 9억 명으로 늘었고, 검색의 AI 모드(AI Mode)는 월 10억 명을 넘어섰다. 회사가 처리하는 토큰은 월 3.2경(3.2 quadrillion) 규모로, 1년 전의 480조에서 폭증했다.

Gemini 3.5 Flash: 경량 등급이 직전 최상위를 넘다

발표의 머리기사는 Gemini 3.5 Flash다. 이 모델이 의미를 갖는 이유는 단순하다. 그동안 'Flash'는 성능을 양보하는 대신 빠르고 저렴한 보급형 등급이었는데, 이번에는 직전 세대 최상위였던 Gemini 3.1 Pro를 다수의 벤치마크에서 앞질렀다. 공개된 점수로는 코딩 평가인 Terminal-Bench 2.1에서 76.2%, 에이전트형 작업을 측정하는 GDPval-AA에서 1656 Elo, 도구 사용 신뢰도를 보는 MCP Atlas에서 83.6%, 멀티모달 이해를 보는 CharXiv Reasoning에서 84.2%를 기록했다. 출력 토큰 생성 속도는 동급 프런티어 모델 대비 약 4배 빠르다고 한다. 같은 등급의 최상위 모델인 Gemini 3.5 Pro는 다음 달 출시로 예고됐다.

다만 'Flash가 모든 것을 이겼다'는 식의 평가는 정확하지 않다. 절대 성능의 정점에는 여전히 Claude Opus 4.7이나 GPT-5.5 같은 최상위 모델이 자리한다. Gemini 3.5 Flash의 위치는 '최정점'이 아니라 '속도와 지능의 균형이 좋은 가성비 구간'이다. 가격을 둘러싼 비판도 있었다. 회사는 직전 최상위인 3.1 Pro보다 저렴하다고 강조했지만, 과거의 Flash 등급과 비교하면 단가가 눈에 띄게 올랐다. 게다가 추론 과정에서 토큰을 많이 소모하는 경향이 있어, 실제 작업 비용으로 따지면 기대만큼의 가성비가 나오지 않는다는 지적이 따랐다.

출력 속도 (느림 → 빠름) 지능 (낮음 → 높음) Opus 4.7 · GPT-5.5 최정점 지능, 느리고 비쌈 Gemini 3.5 Flash 빠르면서 지능도 높음 이전 Flash 세대 빠르지만 지능은 보급형 3.1 Pro 직전 최상위 '빠른 보급형'이 '높은 지능' 영역으로 올라왔다
속도와 지능 축에서 본 개념적 위치(정량 좌표 아님). Flash 등급이 직전 최상위를 위로 추월했지만, 절대 정점은 여전히 최상위 모델의 몫이다.

Gemini Omni: 무엇이든 입력, 무엇이든 출력

또 다른 축은 Gemini Omni다. 이 모델은 텍스트, 이미지, 오디오, 영상을 가리지 않고 입력으로 받아, 같은 종류들을 출력으로 내보내는 것을 목표로 한다. 이번에 먼저 공개된 것은 영상 영역으로, 핵심은 '원본 영상을 그대로 이해하고 편집한다'는 점이다. 기존 방식은 사진을 먼저 변형한 뒤 그 이미지를 다시 영상으로 바꾸는 단계를 거쳐야 했지만, Omni는 영상 자체를 직접 다룬다. 장면 사이에 인물의 정체성과 목소리를 일관되게 유지하는 능력도 강화됐다. 다만 순수한 영상 생성 품질만 놓고 보면, 중국의 영상 특화 모델인 Seedance 2.0 같은 경쟁작이 더 자연스럽다는 평가가 많다. Omni의 차별점은 화질의 정점이 아니라, 여러 양식을 하나의 모델 안에서 일관되게 다루는 구조 자체에 있다.

비유

기존 영상 편집이 '사진을 인화해 가위로 오리고 다시 촬영하는' 다단계 공정이었다면, Omni는 '영상 원본 위에 직접 덧칠하는' 방식이다. 중간 산출물(정지 이미지)을 거치지 않으니 손실이 줄고, 영상 속 사물의 움직임과 물리적 맥락을 그대로 이어받는다.

활용처도 빠르게 붙었다. 영상 편집 도구 분야의 인기 제품과 제휴해 Gemini 앱 안에서 고급 편집 기능을 쓸 수 있게 되고, YouTube의 짧은 영상(쇼츠) '리믹스' 기능에 Omni가 무료로 탑재돼 기존 영상에 사용자 본인이나 참조 이미지를 끼워 넣는 식의 변형이 가능해졌다. 한편 AI 생성물 식별을 위한 보이지 않는 워터마크 체계(SynthID)에는 OpenAI, Nvidia, ElevenLabs, Kakao 등이 합류해 사실상 업계 표준의 모양새를 갖추기 시작했다. 다만 워터마크와 출처 메타데이터를 제거해 준다고 광고하는 도구들도 동시에 등장하면서, 창과 방패가 함께 진화하는 양상이 이어진다.

Gemini Spark: 24시간 작동하는 개인 에이전트

Gemini Spark는 사용자의 Gmail, 캘린더, 드라이브, 사진, 검색 등과 처음부터 연동된 채로 상시 작동하는 개인용 AI 에이전트다. 별도의 복잡한 설정 파일이나 폴더 매핑 없이, 일반 사용자가 곧바로 쓸 수 있도록 설계됐다는 점이 특징이다. 이메일에 답장하고, 받은 내용을 표로 정리하고, 일정을 등록하는 작업을 개인 맥락 위에서 자동으로 처리한다. 개발자가 직접 가상 머신을 빌려 상시 에이전트를 구축-운영하던 수고를 클라우드가 대신 떠안는 셈이다. 우선 상위 구독 등급(Ultra)에서, 그리고 미국부터 제공된다.

Antigravity 2.0: IDE의 형태가 바뀐다

개발 도구 쪽의 변화가 가장 상징적이다. Antigravity 2.0은 에이전트 상호작용의 중앙 허브 역할을 하는 독립형 데스크톱 애플리케이션으로 다시 태어났다. 기존에 VS Code를 닮은 통합 개발 환경(IDE, Integrated Development Environment)이었던 것이, 코드 편집 창이 아니라 에이전트에게 일을 시키는 창을 중심으로 재편됐다. 코드를 사람이 직접 들여다볼 일이 줄어들면, 코드 창과 파일 트리를 크게 띄울 이유도 줄어든다는 판단이다. 같은 흐름에서 명령줄 도구(CLI, Command Line Interface)와 소프트웨어 개발 키트(SDK, Software Development Kit)도 정비됐고, 기존의 Gemini CLI는 Antigravity CLI로 대체되며 종료 수순에 들어갔다. Gemini API(응용 프로그램 인터페이스)에는 호출 한 번으로 상태를 유지하는 에이전트를 띄우는 '관리형 에이전트(Managed Agents)' 기능도 추가됐다.

기조연설의 시연이 이 방향성을 압축해 보여줬다. 약 93개의 하위 에이전트를 동원해 12시간 만에 운영체제(OS, Operating System)의 핵심 프레임워크를 바닥부터 구축했고, 수십억 개(약 26억) 토큰을 소모하며 1,000달러 미만의 비용으로 그 위에서 고전 게임을 구동하는 데모였다. 검증된 절대 성능이라기보다, 다수의 에이전트를 오케스트레이션해 큰 작업을 분할-수행하는 새로운 개발 양식을 보여 준 사례로 읽힌다.

핵심 메시지 코드를 '쓰는' 도구에서 에이전트를 '지휘하는' 도구로. IDE의 무게중심이 편집기에서 명령 창으로 이동하고 있다.

검색의 재편과 SEO 이후의 질서

검색은 가장 근본적인 변화를 겪었다. AI 모드가 기본값이 되면서, 검색 결과는 '링크 목록과 사이트로의 이동'에서 'AI가 사용자를 대신해 읽고 요약한 답변'으로 옮겨 갔다. 에이전트가 정보를 취합하고, 식당 예약처럼 전화가 필요한 일까지 대신 처리하는 시연이 등장했으며, 검색창 안에서 곧바로 코드가 실행되거나 사용자 맞춤형 웹페이지가 생성되기도 했다. 예컨대 식단과 운동 관리를 물으면 단순 요약이 아니라 그 사람만을 위한 관리용 웹페이지가 그 자리에서 만들어진다.

이는 콘텐츠와 서비스를 운영하는 쪽에 직접적인 함의를 던진다. 검색 결과에 내 사이트가 걸려 방문자가 유입된다는 전제가 흔들리기 때문이다. 이제는 검색엔진 최적화(SEO, Search Engine Optimization)만으로는 부족하고, AI의 답변 안에 정보가 인용되도록 만드는 답변 엔진 최적화(AEO, Answer Engine Optimization)나 생성형 엔진 최적화(GEO, Generative Engine Optimization)가 과제가 된다. 단순 정보 전달형 사이트는 검색 트래픽 감소를 정면으로 맞게 되며, 트래픽 유입의 무게중심은 검색에서 소셜 콘텐츠와 추천으로 옮겨 갈 가능성이 크다.

그 밖의 발표: 인앱 앱 개발과 스마트 안경

Google AI Studio에서는 별도 도구를 설치하지 않고도 웹 브라우저 안에서 네이티브 안드로이드 앱을 만들고, 가상 기기로 미리 보고, 마켓 출시까지 이어 갈 수 있는 흐름이 추가됐다. 디자인 도구 쪽에서는 실시간 스트리밍 방식으로 에이전트가 화면을 디자인하는 과정을 지켜보고 중간에 개입할 수 있게 됐으며, 배포 서비스와의 연동으로 디자인과 배포의 경계가 흐려졌다. 하드웨어로는 안경 제조사들과 협업한 스마트 안경 신제품이 공개됐는데, 디스플레이 없이 음성과 카메라 중심으로 길 안내-촬영-번역을 돕는 형태이며 출시는 올가을로 예고됐다.

왜 가능한가: 컴퓨트 지형

이 많은 제품을 거의 모든 서비스에 동시에 밀어 넣을 수 있는 배경에는 컴퓨트 보유량이 있다. 한 조사에 따르면 테크 기업 가운데 컴퓨트를 가장 많이 보유한 곳은 Google이며, 그 뒤를 Meta, OpenAI, Anthropic, xAI가 잇는 것으로 추정된다. 컴퓨트의 우위가 곧 '모든 제품에 최신 모델을 기본 탑재'하는 전략의 토대가 된다.

컴퓨트 보유 규모 순위 (상대적, 정량 척도 아님) Google 1위 Meta 2위 OpenAI 3위 Anthropic 4위 xAI 5위
막대 길이는 순위를 시각화한 것일 뿐 실제 수치 비율이 아니다. 정점에 Google이 있다는 점이 요지다.

Anthropic: 보안 모델, 인재, 컴퓨트, 흑자 전환

Project Glasswing: AI가 한 달에 1만 건의 취약점을 찾다

Anthropic은 4월 7일 출범한 보안 협력체 'Project Glasswing'의 첫 경과를 5월 22-23일 공개했다. 핵심은 너무 위험해서 대중에 공개하지 않은 미공개 프런티어 모델 'Claude Mythos Preview'를 신뢰할 수 있는 파트너들에게만 제공해, 공격이 아니라 방어에 먼저 쓰게 한 점이다. 약 50개 조직이 참여해 한 달 만에 1만 건이 넘는 고위험-치명적 등급의 소프트웨어 취약점을 찾아냈다. 그중에는 27년간 발견되지 않았던 OpenBSD(보안성으로 유명한 운영체제)의 결함과 16년 묵은 FFmpeg(영상 처리 라이브러리)의 버그처럼, 사람의 코드 검토와 자동 검사를 모두 통과했던 제로데이(zero-day, 알려지지 않은 취약점)들이 포함됐다.

참여 기업들의 보고도 규모를 보여 준다. Cloudflare는 핵심 시스템 전반에서 2,000건의 취약점을 찾았고 그중 400건이 고위험-치명적 등급이었다. 한 협력 은행에서는 이 모델이 실시간으로 150만 달러 규모의 사기성 송금을 차단한 사례도 있었다. 다만 Anthropic은 동일한 능력이 공격에도 쓰일 수 있다는 위험 때문에 Mythos를 아직 일반 출시하지 않으며, 충분한 안전장치가 갖춰진 뒤에야 'Mythos 계열' 모델을 공개하겠다고 밝혔다.

이 보고서가 던지는 진짜 메시지는 병목의 이동이다. 그동안 소프트웨어 보안의 한계는 '얼마나 빨리 취약점을 찾는가'였는데, 이제는 '얼마나 빨리 검증-공개-패치하는가'로 옮겨 갔다. 실제로 일부 유지보수자들이 발견 속도를 늦춰 달라고 요청할 정도로, 패치가 발견 속도를 따라잡지 못하는 위험한 공백기가 열렸다.

비유

그동안 보안은 '범인을 잡는 형사'가 부족한 상황이었다. 이제는 형사가 갑자기 수천 명으로 늘어난 셈인데, 정작 사건을 처리할 검찰과 법원(검증-패치 체계)의 처리 용량은 그대로다. 범인을 더 빨리 잡는 일이 곧 안전을 의미하던 시대에서, 잡은 사건을 얼마나 빨리 처리하느냐가 안전을 결정하는 시대로 넘어간 것이다.

인재: 'vibe coding'을 만든 연구자의 합류

5월 19일, OpenAI의 공동 창립 멤버이자 Tesla의 AI 디렉터를 지낸 안드레 카파시(Andrej Karpathy)가 Anthropic 합류를 알렸다. 그는 '바이브 코딩(vibe coding)'이라는 용어를 만든 인물로, Anthropic의 사전학습(pre-training) 팀에서 Nick Joseph 아래 합류해 'Claude로 사전학습 연구 자체를 가속하는' 하위 팀을 꾸린다. 사전학습은 모델의 핵심 지식과 능력을 형성하는 가장 자원 집약적이고 전략적인 단계다. 순수 컴퓨트 경쟁만이 아니라, AI가 AI 연구를 돕는 '모델 보조 연구'에서 먼저 복리 효과를 내는 쪽이 앞선다는 베팅을 공개적으로 한 셈이다.

컴퓨트와 흑자 전환

컴퓨트 확보도 굵직했다. Anthropic은 경쟁사 xAI를 소유한 SpaceX와 손잡고, 메모리(Memphis)에 있는 데이터센터 Colossus 1의 용량 전체를 빌리기로 했다. 300메가와트(MW) 이상, NVIDIA 그래픽처리장치(GPU, Graphics Processing Unit) 22만 개 이상에 해당하는 규모로, 월 12.5억 달러를 2029년까지 지불하는 조건이다. 흥미로운 점은 이 거래가 Colossus 1에 한정된다는 사실인데, xAI가 자사 학습을 이미 후속 시설(Colossus 2)로 옮겼기에 1세대 시설을 경쟁사에 임대할 수 있었다. 확보한 용량은 Claude의 유료 구독자 서비스 개선에 투입된다.

수익성에서도 전환점이 보고됐다. Anthropic은 투자자에게 2026년 2분기 매출이 직전 분기 48억 달러에서 130% 늘어난 약 109억 달러에 이르고, 약 5.59억 달러의 첫 영업이익을 낼 것으로 전망한다고 밝혔다. 코딩 도구 Claude Code가 출시 6개월 만에 연환산 매출 10억 달러를 넘어선 것이 주된 동력이다. 다만 하반기 컴퓨트 비용 증가로 연간 흑자 유지는 장담하기 어렵다는 단서가 붙었다. 컴퓨트 효율은 개선 중으로, 매출 1달러당 컴퓨트 비용이 1분기 71센트에서 56센트로 낮아질 것으로 예상된다.

OpenAI: 80년 난제의 해결과 Codex

수학자들이 80년간 믿어온 가설을 AI가 반증하다

5월 20일, OpenAI는 내부 추론 모델이 이산기하학의 오래된 추측을 독자적으로 반증했다고 발표했다. 대상은 1946년 폴 에르되시(Paul Erdős)가 제기한 '평면 단위 거리 문제(planar unit distance problem)'다. 평면 위에 n개의 점을 찍을 때, 정확히 한 단위 거리만큼 떨어진 점의 쌍이 최대 몇 개나 나올 수 있는가를 묻는 문제다. 오랫동안 수학계는 점을 격자 모양으로 배열하는 방식이 한계에 가깝다고 여겨 왔는데, 이 모델은 그보다 더 많은 쌍을 만들어 내는 새로운 점 배열 계열을 무한히 찾아내고 그것이 격자를 능가함을 증명했다(다항식 수준의 개선). 증명은 외부 수학자들의 검증을 거쳤고, 배경과 의의를 설명하는 동반 논문도 함께 공개됐다.

주목할 대목이 두 가지다. 첫째, 이 증명은 수학 전용으로 특별히 훈련된 시스템이 아니라 범용 추론 모델에서 나왔다(구체적인 모델명은 공개되지 않았다). 둘째, 초등적인 기하 문제에 대수적 수론(algebraic number theory)이라는 전혀 다른 분야의 기법을 끌어와 연결했다. 이는 인간이 정의해 둔 문제를 푸는 단계를 넘어, 분야를 가로질러 새로운 수학적 아이디어를 구성한 사례에 가깝다. 일부 수학자는 이 결과를 정식 논문으로 받아들일 수준이라고 평가했고, 컴퓨터 보조 증명이 처음으로 학계의 인정을 받았던 순간들에 비견되기도 했다.

비유

오랜 등산로의 정상으로 가는 길이 '능선 코스'가 유일한 최단 경로라고 모두가 믿어 왔다. 그런데 AI가 아무도 시도하지 않던 계곡 쪽 우회로를, 그것도 전혀 다른 지도(대수적 수론)를 펼쳐 가며 찾아내 '능선보다 빠르다'는 사실을 증명했다. 단순히 정해진 길을 빨리 걷는 것이 아니라, 길의 지도 자체를 다시 그린 셈이다.

Codex의 실무 개선

OpenAI의 코딩 도구 Codex에는 실무에서 체감되는 기능들이 더해졌다. 단축키로 화면 전체를 캡처해 작업 맥락으로 첨부하는 기능, 브라우저를 따로 띄우지 않고도 화면을 빠르게 읽어 오는 단축키, 그리고 컴퓨터가 잠겨 있어도 작업을 이어 가는 기능 등이다. 사용자가 자리를 비운 사이에도 에이전트가 맥락을 잃지 않고 작업을 수행하도록 돕는 방향이다. 음성으로 양식의 빈칸을 불러 주면 AI가 듣고 정리해 채워 주는 식의 사례도 화제가 됐다.

코딩 모델 경쟁의 재편

Cursor Composer 2.5: 편집기 회사가 만든 모델

코드 편집기 회사 Cursor가 5월 18일 자체 코딩 모델 Composer 2.5를 공개했다. 프런티어 AI 연구소가 아닌 도구 회사가 만든 모델임에도, 한 독립 평가의 코딩 에이전트 지수에서 3위에 올랐다. 1-2위인 최상위 모델 조합에 근소하게 뒤지면서도, 작업당 비용은 그들의 10분의 1 안팎에 불과하다. 코딩에 특화된 데이터와 강화학습으로 다듬어진 결과로, 실제로 Cursor 안에서 가장 많이 선택되는 모델이 됐다고 한다. 모델의 기반이 중국발 모델 계열이라는 점이 한때 논란이 됐으나, 결과 품질이 받쳐 주면 기반의 출신은 부차적 문제라는 평가가 우세하다.

코딩 에이전트(지수 기준)대략적 위치작업당 비용 경향
Claude Opus 4.7 (Claude Code)최상위권높음
GPT-5.5 (Codex)최상위권높음
Cursor Composer 2.53위권약 10분의 1

평가 환경과 설정에 따라 점수는 달라질 수 있으며, 위 표는 방향성 비교다.

주변 정황도 눈길을 끈다. Cursor는 SpaceX 측과 차세대 모델을 더 큰 컴퓨트로 처음부터 학습하는 협력을 진행 중이며, 별도로 SpaceX가 Cursor에 조건부 인수를 제안했다는 보도도 나왔다. 코딩 도구를 둘러싼 인프라-자본의 합종연횡이 빠르게 진행되고 있다.

Microsoft의 Claude Code 라이선스 회수

한편 Microsoft는 내부에서 쓰던 Claude Code 라이선스를 6월 30일까지 대거 회수하고, 엔지니어들에게 자사 도구인 GitHub Copilot CLI로의 이전을 권고했다. 이 결정을 단순히 'Claude가 비싸서'로 읽는 것은 정확하지 않다. 보도에 따르면 지난해 12월 사내 개방 이후 Claude Code 사용이 빠르게 번지면서 정작 자사의 Copilot CLI가 외면받은 것이 핵심 배경이고, 여기에 회계연도(6월 30일) 종료에 맞춘 비용 절감과 자사 플랫폼으로의 표준화 의도가 겹쳤다. 사내 개발자 다수가 Copilot CLI보다 Claude Code를 선호해 온 상황이라, 전환이 매끄럽지는 않을 전망이다. 역설적으로 이 사건은 Claude Code의 사내 경쟁력을 거꾸로 증언한 셈이 됐다.

중국과 오픈소스 진영의 추격

최상위 모델 경쟁과 별개로, 중국과 오픈소스 진영의 추격 속도가 두드러졌다. 알리바바의 Qwen 3.7 Max는 I/O 다음 날 공개된 프런티어급 추론 모델로, 공개 평가 무대에서 상위권에 자리했다. DeepSeek 계열은 가격 인하로 가성비 구간을 공략했다. 영상-멀티모달 영역에서는 Gemini Omni가 지향하는 '무엇이든 입력, 무엇이든 출력' 구조의 소형 오픈소스 모델들이 빠르게 등장해, 영상 이해와 변형 기능을 공개 라이선스로 풀어내는 흐름이 이어졌다.

음성 인식 분야에서도 진전이 있었다. 시끄러운 환경에서의 음성을 텍스트로 옮기는 자동 음성 인식(ASR, Automatic Speech Recognition) 모델 가운데, 소음에 강한 새 오픈소스 모델이 널리 쓰이던 기존 도구 대비 큰 폭의 오류율 개선을 보였다는 보고가 나왔다. 다만 이런 발표들 가운데 일부(예: 반려동물 음성을 사람 말로 번역한다는 스타트업의 주장)는 독립적 검증이 없는 제조사 측 수치에 머물러, 그대로 받아들이기는 이르다.

핵심 메시지 프런티어의 정점은 소수 기업이 쥐고 있지만, 그 바로 아래 '충분히 좋은' 구간은 오픈소스와 중국 모델이 빠르게 채우며 가격을 무너뜨리고 있다.

로보틱스: 명령에서 동작까지

체화된 AI(embodied AI) 쪽 데모도 이어졌다. 한 휴머노이드 제조사는 음성으로 내린 명령을 사전 설정된 동작이 아니라 즉석에서 생성한 동작으로 수행하는 영상을 공개했다. '점프한 뒤 플랭크 자세를 취하라'는 식의 지시를 듣고 잠시 준비한 뒤 동작을 만들어 실행하는 식이다. 또 다른 영상에서는 휴머노이드가 약 23킬로그램(50파운드)에 이르는 냉장고를 양손으로 들어 올려, 온몸으로 균형을 잡으며 사람처럼 옮기는 장면이 등장했다. 보행 자연스러움이 개선된 휴머노이드 데모도 공개됐다. 이들은 모두 시연 영상이라는 점을 감안해야 하지만, 언어 명령을 물리적 동작으로 직접 옮기는 능력이 빠르게 다듬어지고 있음을 보여 준다.

AI를 둘러싼 사회적 긴장

기술의 진보와 별개로, 그 진보를 받아들이는 사회의 온도는 사뭇 달랐다. 5월 중순, 한 대학 졸업식 축사에 나선 구글 전 최고경영자 에릭 슈미트(Eric Schmidt)는 AI가 거의 모든 직업과 교육·의료·연구 현장에 파고들 것이라는 취지로 말하던 중 졸업생들의 야유를 받았다. 그가 말을 이으려 하자 야유는 더 커졌다. 같은 시기 다른 대학들의 졸업식에서도 AI를 새로운 산업혁명에 빗댄 연사들이 비슷한 반응을 마주했다.

내용 자체가 틀린 말은 아니었다는 점이 오히려 핵심이다. AI가 어디에나 적용되리라는 전망은 이미 상식에 가깝다. 그럼에도 야유가 터진 것은, 신입 일자리 축소처럼 그 전망이 자신의 미래와 직결되는 사람들에게 그 말이 달갑게 들리지 않기 때문이다. 데이터센터 건설에 대한 지역사회의 반발과 맞물려, 기술의 불가피성과 그 비용을 누가 떠안는가라는 질문이 같은 자리에서 충돌하고 있다.


정리: 무엇이 달라졌나

2026년 5월 중순의 한 주를 관통하는 흐름은 몇 갈래로 모인다. 첫째, 모델 경쟁의 무게중심이 '절대 성능의 정점'에서 '속도-비용-에이전트 적합성의 균형'으로 분화했다. Gemini 3.5 Flash가 보급형 등급으로 직전 최상위를 넘긴 것, Cursor의 자체 모델이 10분의 1 비용으로 상위권에 든 것이 같은 신호다.

둘째, 개발과 검색이라는 두 거대한 관문이 동시에 에이전트화됐다. IDE는 편집기에서 명령 창으로, 검색은 링크 목록에서 요약-실행으로 옮겨 가며, 그 사이에 서 있던 SEO 중심의 트래픽 질서가 흔들린다. 셋째, AI의 능력이 양날임이 한층 분명해졌다. 같은 모델이 한 달에 1만 건의 취약점을 찾아 방어를 강화하는 동시에, 공격에도 쓰일 수 있어 출시를 미루게 만든다. 보안의 병목은 발견에서 패치로 이동했다.

넷째, AI가 인간이 정의한 문제를 푸는 단계를 넘어 새로운 지식을 구성하기 시작했다는 신호가 나왔다. 80년 묵은 수학 추측의 반증은 그 상징이다. 그리고 마지막으로, 이 모든 진보의 속도와 사회가 그것을 흡수하는 속도 사이의 간극이 졸업식의 야유처럼 표면 위로 떠올랐다. 기술의 곡선과 수용의 곡선이 벌어지는 지점에서, 다음 국면의 쟁점이 만들어지고 있다.