jacobhan.me

기술 지형 리포트

가속하는 프론티어 — 2026년 5월 말 인공지능 기술 지형

며칠 사이에 새 최상위 모델이 나오고, 기업 가치가 1조 달러에 육박하는 투자가 마감되고, 사용자의 컴퓨터 화면을 직접 조작하는 에이전트가 등장하고, 원본 화자의 감정까지 옮겨 담는 더빙 기술이 공개되고, 교황이 인공지능을 주제로 첫 회칙을 발표했다.

각각은 별개의 사건이다. 그러나 한자리에 모아 놓으면 한 가지 사실을 가리킨다. 인공지능 산업의 거의 모든 층위 — 모델 성능, 자본, 제품, 하드웨어, 그리고 그것을 둘러싼 윤리적 논의까지 — 가 동시에, 그리고 점점 더 짧은 간격으로 움직이고 있다는 것이다. 이 글은 2026년 5월 마지막 주 전후의 흐름을 일곱 가지 주제로 정리한다. 전문 용어는 처음 나올 때 풀어 설명하고, 핵심 개념에는 이해를 돕는 비유를 곁들였다.

01 · 모델성능을 넘어, '정직성'이라는 새로운 경쟁 축

앤트로픽(Anthropic)이 5월 28일 새 최상위 모델 클로드 오퍼스 4.8(Claude Opus 4.8)을 공개했다. 직전 버전인 4.7과 비교해 코딩·수학·장문 처리 등 대부분의 평가 지표에서 점수가 올랐다. 대표적으로 소프트웨어 엔지니어링 능력을 측정하는 SWE-bench Pro에서 64.3%에서 69.2%로 향상됐고, 가격은 4.7과 동일하게 유지됐다. 응답 속도를 높인 '빠른 모드(fast mode)'는 이전보다 세 배 저렴해졌다.

그런데 이번 공개에서 성능 지표보다 더 비중 있게 다뤄진 것은 다른 항목이었다. 바로 정직성(honesty)이다. 앤트로픽은 이 모델이 자신이 작성한 코드의 결함을 그냥 넘겨 버리는 경우가 이전 모델보다 약 네 배 줄었다고 밝혔다. 인공지능이 작업을 끝내지도 않고 "완료했습니다"라고 보고하거나, 근거가 약한 사항을 확신에 찬 어조로 단정하던 문제를 줄이는 데 초점을 맞췄다는 것이다. 모델은 이제 확실하지 않은 부분을 스스로 표시하고, 작업이 미완성이라는 사실을 감추지 않으려 한다.

비유로 이해하기

성능 향상이 "더 똑똑한 직원"을 들이는 일이라면, 정직성 개선은 "보고를 믿을 수 있는 직원"을 들이는 일이다. 아무리 일을 빨리 해내도, 다 됐다는 보고를 그대로 믿을 수 없으면 결국 모든 결과물을 사람이 다시 검수해야 한다. 자동화의 실익이 사라지는 것이다. 작업량보다 '신뢰'가 병목인 단계에 이르렀다는 신호로 읽힌다.

흥미로운 역설도 함께 관찰됐다. 인공지능에게 가상의 자판기 사업 운영을 맡겨 수익을 얼마나 내는지 겨루는 한 평가에서, 정직성을 강화한 새 모델이 오히려 직전 모델보다 낮은 성적을 냈다. 장사를 잘하려면 적당한 과장과 영업적 수사가 필요한 경우가 있는데, 지나치게 곧이곧대로 구는 성향이 그런 상황에서는 약점이 될 수 있다는 점을 시사한다. 정직성이 모든 과제에서 무조건 유리한 덕목은 아니라는 것이다.

벤치마크는 신뢰할 수 있는가

같은 시기에 '딥 소프트웨어 엔지니어(deep software engineer)'류의 새로운 코딩 평가가 주목받았다. 기존 코딩 벤치마크가 모델 학습 데이터에 이미 노출돼 점수가 부풀려졌다는 비판, 이른바 '오염(contamination)' 문제 때문이다. 새 평가는 기존 코드 저장소를 손대지 않고 과제를 처음부터 새로 설계해 이 문제를 줄이려 했다. 이 평가에서는 경쟁사 오픈AI(OpenAI)의 GPT-5.5가 비용·정확도 양면에서 앞선 결과를 보이기도 했다. 종합 점수에서 우위인 모델과 특정 영역에서 우위인 모델이 갈리는 셈이라, 실제 작업에서는 과제 성격에 따라 도구를 바꿔 쓰는 편이 합리적이다.

비유로 이해하기

벤치마크 오염은 시험 문제가 사전에 유출된 상황과 같다. 답을 외운 학생이 만점을 받아도 그 점수가 실력을 뜻하지는 않는다. 그래서 평가 기관들은 본 적 없는 새 문제로 시험지를 다시 만든다. 모델을 고를 때 공개된 점수 하나만 보면 안 되는 이유가 여기에 있다.

02 · 속도1.5개월 주기 — 모델 출시는 왜 이렇게 빨라졌나

한 분석에 따르면 새 모델이 나오는 간격은 한때 6~12개월이었으나 최근에는 평균 1.5개월 안팎으로 좁혀졌다. 오픈AI의 GPT-5.5가 4월 23일에 나온 데 이어, 후속 버전 GPT-5.6의 출시가 임박했다는 정황이 여럿 포착됐다. 내부 시스템 로그에 다음 버전을 가리키는 흔적이 잠깐 나타났다 사라지는 식이다. 예측 시장에서는 6월 안에 공개될 확률을 높게 본다. 같은 6월에는 구글의 차세대 제미나이(Gemini)와 앤트로픽의 또 다른 신모델까지 비슷한 시기에 겹칠 것이라는 관측이 나온다.

예전 (~2024) 6~12개월에 1회 긴 간격 한 번 ↑ 동일한 1년의 시간 폭 ↓ 지금 (2026) 약 1.5개월에 1회 5.2 5.4 5.5 5.6?
한 모델에서 다음 모델까지의 간격은 한때 6~12개월이었으나, 2026년에는 1.5개월 안팎으로 좁혀졌다. 같은 1년이라도 출시 횟수가 여러 배로 늘어난 셈이다. (오픈AI의 GPT 계열을 예시로 표시)

이 가속은 단순한 마케팅 경쟁이 아니다. 막대한 연산 자원, 더 효율적인 학습 기법, 그리고 수많은 사용자가 실제로 쓰면서 남기는 피드백이 맞물려 개선의 순환이 빨라진 결과다. 사용자 입장에서 실무적인 교훈은 분명하다. 특정 모델에 코드와 작업 흐름을 깊게 고정하기보다, 모델을 교체하기 쉽게 설계해 두는 편이 낫다. 다음 달이면 더 나은 선택지가 나올 가능성이 높기 때문이다.

03 · 자본9,650억 달러와 데이터센터 — 자본의 규모

모델 공개와 같은 날, 앤트로픽은 시리즈 H(Series H) 투자 라운드로 650억 달러를 조달하며 9,650억 달러의 기업 가치를 인정받았다고 발표했다. 한국 돈으로 환산하면 1,400조 원을 넘는다. 회사가 밝힌 연환산 매출(run-rate revenue)은 470억 달러 수준으로, 코딩 보조 도구의 인기가 성장을 견인했다. 이 가치 평가는 경쟁사를 앞지르는 규모이며, 회사는 기업공개(IPO)도 준비 중인 것으로 알려졌다.

'연환산 매출'이란? 가장 최근의 월 매출에 12를 곱해 1년치로 환산한 추정 지표다. 빠르게 성장하는 기업의 현재 속도를 가늠하는 데 쓰이며, 실제 회계연도 매출과는 다르다.

천문학적 숫자는 한 회사에 그치지 않는다. 비슷한 시기에 메타(Meta)는 인스타그램·페이스북·왓츠앱에 유료 구독제를 전 세계로 확대했다. 인스타그램 플러스와 페이스북 플러스는 월 3.99달러, 왓츠앱 플러스는 월 2.99달러이며, 스토리 노출 강화, 익명 스토리 조회, 강화된 반응 기능, 프로필 꾸미기 등을 제공한다. 별도로 더 높은 연산이 필요한 작업에 쓰는 인공지능 전용 상위 요금제(월 7.99~19.99달러)도 시험에 들어갔다. 광고에 절대적으로 의존하던 매출 구조를 다각화하려는 움직임이다. 인공지능 인프라에 들어가는 비용이 가파르게 오르면서, 구독이라는 새로운 수익원으로 이를 충당하려는 것으로 풀이된다.

주목할 발언도 있었다. 메타 경영진이 남는 그래픽처리장치(GPU, 인공지능 연산을 담당하는 핵심 칩)를 외부에 빌려줄 수 있다는 뜻을 내비치면서, 클라우드 사업 진출 가능성이 거론됐다. 메타는 클라우드 사업을 하지 않으면서도 데이터센터를 대규모로 지어 왔기에, 주요 인공지능 기업들과 견줄 만한 연산 자원을 이미 보유하고 있다. 그 자원을 다른 수익원으로 돌릴 수 있다는 신호로 읽혔다.

$183B 2025년 9월 $380B 2026년 2월 $965B 2026년 5월 약 8개월 만에 5배 이상
앤트로픽의 기업 가치는 2025년 9월 약 1,830억 달러에서 2026년 5월 9,650억 달러로 뛰었다. 인공지능 분야로 자본이 얼마나 빠르게 몰리는지를 보여주는 단면이다. (단위: 10억 달러)

이 모든 흐름의 바탕에는 데이터센터 수요가 있다. 미국에서는 이미 가동 중인 데이터센터에 더해 건설 중이거나 계획 단계인 시설이 빠르게 늘고 있다. 인공지능이 일상으로 들어오면서 연산 수요가 폭증하고 있다는 신호다. 반도체 공급망에 자리한 기업들이 수혜를 보는 구조이지만, 이 수요가 주가에 이미 반영됐는지 아니면 앞으로의 증설까지 충분히 반영하지 못했는지는 단정하기 어렵다.

비유로 이해하기

연산 자원(GPU와 데이터센터)은 인공지능 시대의 전력망이자 발전소에 해당한다. 발전 용량을 더 많이 쥔 쪽이 더 많은 일을 처리하고 더 많이 팔 수 있다. 메타가 모델 성능 경쟁에서 1등이 아니더라도 막강한 '발전 용량'으로 수익을 낼 수 있다고 보는 이유가 여기에 있다.

04 · 에이전트에이전트가 화면을 직접 만지기 시작했다

최근 인공지능의 무게중심은 '대답하는 비서'에서 '직접 일하는 대리인(agent)'으로 옮겨 가고 있다. 이 변화가 5월 말 여러 제품에서 동시에 드러났다.

오픈AI의 코딩 도구 코덱스(Codex)는 윈도우(Windows)에서 '컴퓨터 사용(computer use)' 기능을 제공하기 시작했다. 이미 맥(Mac)에서 쓸 수 있던 기능이 윈도우로 확장된 것이다. 사용자가 시키면 인공지능이 마우스와 키보드를 실제로 조작해 그림판으로 그림을 그리거나, 브라우저를 열어 클릭하고 입력하는 작업을 스스로 수행한다.

비유로 이해하기

지금까지의 인공지능이 "이렇게 하세요"라고 설명서를 읽어 주는 안내원이었다면, 컴퓨터 사용 기능은 인공지능에게 직접 마우스와 키보드를 쥐여 주는 일이다. 가정·사무용 컴퓨터의 다수가 윈도우라는 점을 떠올리면, 이 확장은 개발자가 아닌 일반 사무직에게도 자동화를 처음으로 체감하게 만들 수 있다.

앤트로픽은 클로드 코드(Claude Code)에 '동적 워크플로우(dynamic workflows)'라는 연구 시험 기능을 함께 공개했다. 수백 개의 보조 에이전트(sub-agent)를 동시에 돌려, 대규모 코드 이전(migration)처럼 손이 많이 가는 복잡한 작업을 한 번에 처리하는 방식이다. 이런 작업은 연산을 막대하게 소모한다. 한 번 돌리면 수백만 단위의 토큰(token, 인공지능이 글을 처리하는 최소 단위)을 몇 분 만에 쓰기도 한다. 비용은 들지만, 사람이 며칠에 걸쳐 할 큰 작업을 짧은 시간에 끝낼 수 있다는 것이 장점이다.

코드를 자동으로 짜는 흐름, 이른바 '바이브 코딩(vibe coding)'은 모바일 앱 영역까지 넘어왔다. 구글(Google)은 5월 개발자 행사에서 자사의 인공지능 개발 도구(AI Studio)로 브라우저에서 곧바로 네이티브 안드로이드(Android) 앱을 만드는 기능을 선보였다. 복잡한 개발 환경 설정 없이 명령어 입력만으로 작동하는 앱의 뼈대를 만들고, 휴대전화에 바로 설치해 시험할 수 있다. 앱 제작의 진입 장벽이 크게 낮아지면서, 짧은 기간에 수많은 앱이 쏟아지는 환경이 만들어졌다. 품질이 낮은 결과물도 많아지겠지만, 물량이 늘어나는 만큼 쓸 만한 앱도 함께 늘어날 것이다.

코딩 분야의 경쟁도 다층으로 벌어졌다. 코드 편집 도구 커서(Cursor)는 가성비를 앞세운 자체 코딩 모델(Composer 2.5)로 좋은 평가를 받았고, xAI는 코딩 전용 에이전트(Grok Build)를 베타로 내놓으며 같은 시장에 발을 들였다. 최상위 모델에 견줄 수준은 아니지만, 코딩 도구 경쟁의 저변이 넓어졌음을 보여준다.

05 · 생성목소리·음악·영상 — 멀티모달 생성의 일상화

글과 이미지를 넘어, 인공지능이 만들어 내는 것의 범위가 빠르게 넓어지고 있다.

감정까지 옮기는 더빙

음성 합성 기업 일레븐랩스(ElevenLabs)는 새로운 더빙 모델(Dubbing v2)을 공개했다. 가장 큰 변화는 원본 화자의 감정과 연기를 번역된 음성에 그대로 옮겨 담는다는 점이다. 기존 방식은 음성을 먼저 글로 옮긴 뒤 다시 합성해 억양과 감정이 평평해지는 한계가 있었다. 새 모델은 원본 음성의 연기 자체를 학습해, 90개 이상의 언어로 톤과 호흡, 강세를 살린다. 영상의 입 모양과 분위기까지 자연스럽게 맞추는 수준까지 나아가, 다국어 콘텐츠 제작의 마지막 수작업 단계를 줄이고 있다.

비유로 이해하기

예전 더빙이 악보의 음표(가사)만 보고 새로 노래를 부르는 것이었다면, 새 더빙은 원래 가수의 '감정이 실린 연주'를 듣고 그 느낌까지 다른 언어로 따라 부르는 것이다. 무엇을 말하는지뿐 아니라 어떻게 말하는지가 함께 건너간다.

같은 기업이 음악 생성 모델(Music v2)도 함께 내놨다. 다만 음악 영역에서는 이미 강력한 전용 서비스들이 있어, 아직 그 수준에는 미치지 못한다는 평가가 많다. 한편 영상 생성에서는 xAI의 모델(Grok Imagine)이 사용자 블라인드 투표 기반 순위(Artificial Analysis Video Arena)에서 상위권에 올랐다. 720p 해상도에 음성까지 함께 생성하며, 가격이 저렴하고 속도가 빠른 점이 강점으로 꼽힌다. 다만 실제 사용 후기에서는 최상위 경쟁 모델을 압도할 정도는 아니라는 신중한 평가도 있어, 순위와 체감 품질이 항상 일치하지는 않는다.

영상을 '문장'처럼 고쳐 쓰다

구글의 멀티모달 모델(Gemini 계열)을 활용한 창의적 사례도 쏟아졌다. 사진 위에 경로를 그리면 그 경로를 따라가는 드론 촬영 영상을 만들어 내거나, 평범한 사물 사진을 카드·소품처럼 바꾸고, 영상의 배경을 통째로 다른 장면으로 교체하는 식이다. 가장 인상적인 활용은 번역이었다. 다른 언어로 말하는 영상을 입력하면 음성과 입 모양까지 한꺼번에 바뀐, 마치 처음부터 그 언어로 촬영한 듯한 영상이 나온다. 음성·영상·텍스트를 한 모델이 함께 다루기에 가능한 일이다.

비유로 이해하기

지금까지 영상 편집이 필름을 자르고 붙이는 물리적 작업이었다면, 멀티모달 편집은 영상을 한 편의 '문장'처럼 다루는 일에 가깝다. "배경을 경기장으로 바꿔 줘", "영어로 말하게 해 줘"라고 쓰면 그 의미대로 영상이 다시 쓰인다.

사람처럼 대화하는 음성

음성 대화 분야에서는 한 음성 인공지능 스타트업(Sesame)이 아이폰(iPhone) 앱을 공개했다. 39개국에서 무료로 쓸 수 있으며, 이름을 가진 여러 음성 상담역과 전화 통화하듯 자연스럽게 대화할 수 있다. 말 중간의 추임새와 맥락 유지가 매끄럽고, 대화 도중 웹 검색 결과를 실시간으로 끌어와 답하기도 한다. 한국어 대화의 자연스러움도 이전보다 크게 개선됐다. 영어 회화 연습 같은 일상적 용도로 쓰기에 충분한 수준이다.

06 · 하드웨어칩과 운영체제 — 하드웨어 지형의 재편

소프트웨어의 변화는 그것을 떠받치는 하드웨어의 재편을 동반한다. 5월 말 두 거인이 각자의 영역 바깥으로 발을 내디뎠다.

엔비디아, PC 칩 시장으로

그래픽 칩의 대명사인 엔비디아(NVIDIA)가 PC용 중앙처리장치(CPU) 시장에 본격 진출한다. 마이크로소프트(Microsoft)와 함께 "PC의 새로운 시대"라는 예고를 동시에 띄웠고, 6월 1일 대만 컴퓨텍스(Computex 2026) 기조연설에서 노트북용 칩(N1·N1X)을 공개할 것으로 알려졌다. 이 칩은 20개의 코어와 6,144개의 연산 단위(CUDA 코어)를 갖춘 ARM 구조 기반으로, 자사의 고성능 소형 컴퓨터에 쓰던 통합 칩을 노트북용으로 변형한 것이다. 칩 자체는 엔비디아가 만들고, 델·에이수스·레노버 등 제조사가 이를 탑재한 윈도우 노트북을 내놓는 구조다.

비유로 이해하기

그동안 노트북은 두뇌(CPU)와 그래픽 담당(GPU)을 서로 다른 회사에서 따로 들여와 조립하는 경우가 많았다. 엔비디아의 통합 칩은 이 둘을 한 지붕 아래 묶는 시도다. 애플이 자체 칩(M 시리즈)으로 두뇌와 그래픽을 통합해 효율을 끌어올린 것과 같은 방향이다. CPU를 외부에 의존하지 않고 자기 생태계로 끌어들이려는 전략이다.

애플, 시리를 다시 짓다

애플(Apple)의 연례 개발자 행사(WWDC 2026)가 6월 8일 열린다. 핵심은 음성 비서 시리(Siri)의 전면 재설계다. 떠다니는 원형 아이콘 대신 대화형 화면을 갖춘, 챗봇에 가까운 형태로 바뀐다. 카메라로 사물을 비추며 묻는 시각 인식 기능, 화면 상단에서 바로 호출하는 방식 등이 더해질 전망이다.

주목할 점은 그 두뇌다. 애플은 자체 모델의 성능이 부족하자 구글의 제미나이(Gemini) 모델을 라이선스해 시리에 결합하는 것으로 알려졌다. 사용자 데이터는 애플의 보안 연산 환경(Private Cloud Compute)에서 처리된다. 동시에 사용자가 챗GPT(ChatGPT)나 클로드(Claude) 등 제3자 인공지능을 기본 엔진으로 선택할 수 있는 확장 체계도 도입될 것으로 보인다. 자체 개발과 외부 모델 활용 사이에서 애플이 택한 현실적 절충이다.

로봇은 라보나 킥을 한다

물리적 움직임을 다루는 로봇 분야의 진전도 화제였다. 현대자동차가 인수한 보스턴 다이내믹스(Boston Dynamics)의 인간형 로봇 아틀라스(Atlas)가 축구 영상에서 다리를 교차해 공을 차는 고난도 기술(라보나 킥)을 선보였다. 실제 선수의 동작 데이터를 학습한 뒤 강화학습으로 다듬은 동작이며, 컴퓨터 그래픽 합성 없이 실제 로봇이 수행했다. 한 연구 기관이 공개한 저글링 로봇 역시 빠른 속도로 공의 궤적을 예측하며 패턴까지 바꿔 가며 안정적으로 저글링을 이어 갔다. 균형과 예측이 요구되는 정교한 동작을 로봇이 해내는 단계에 이르렀음을 보여준다.

07 · 윤리교황의 회칙 — 기술이 윤리의 영역으로

기술의 영향력이 커질수록 그것을 둘러싼 질문도 무거워진다. 5월 25일, 교황 레오 14세(Pope Leo XIV)가 인공지능을 주제로 한 첫 회칙을 바티칸에서 발표했다. 회칙은 가톨릭 교회가 가장 시급한 사회 문제에 대해 내놓는 권위 있는 교서다. 제목은 라틴어로 마니피카 후마니타스(Magnifica Humanitas), '장엄한 인류'라는 뜻이며, 부제는 인공지능 시대에 인간을 어떻게 지킬 것인가에 관한 것이다.

교황이 던진 핵심 표현은 "인공지능은 무장 해제되어야 한다"였다. 이는 기술을 거부하자는 뜻이 아니라, 기술이 인간을 지배하지 못하게 하자는 의미다. 회칙은 핵무기 군축에 빗대어, 인공지능이 지배와 배제의 도구로 전락하지 않도록 군사적·경제적 이해관계에서 떼어 내고, 더 엄격한 국가적·국제적 규제 아래 두어야 한다고 촉구했다. 기술이 사회에 해를 끼친 뒤에 윤리를 적용하는 것이 아니라, 설계 단계에서부터 책임을 분명히 해야 한다는 것이 일관된 논지다. 속도를 늦추자는 요구가 진보에 반대하는 것이 아니라 인류를 향한 책임 있는 돌봄이라는 점도 강조됐다.

이 발표가 특히 주목받은 이유는 발표 자리에 인공지능 기업 앤트로픽의 공동 창립자가 함께해 연설했다는 점이다. 성직자나 신학자가 아닌 인물이 이런 자리에 초청된 것은 이례적이었다. 그는 연구자만으로는 인공지능의 윤리적 경계를 정할 수 없다고 인정하며, 야망과 경쟁, 재정적 압박 같은 유인에서 자유롭지 않은 개발 현장을 향해 "우리가 실패할 때 그것을 짚어 줄, 정보에 밝은 비판자가 필요하다"고 말했다. 산업 내부에서도 외부의 도덕적 견제가 필요하다는 인식이 공유되고 있음을 보여주는 장면이었다.

핵 기술이 국가 단위로만 다룰 수 있는 힘이었던 것과 달리, 오늘날의 인공지능은 누구나 손에 쥘 수 있다. 공개된 모델과 응용 프로그래밍 인터페이스(API)를 통해 개인도 강력한 기능을 직접 활용한다. 그만큼 강력하고 그만큼 책임도 분산된다는 점이, 이 회칙이 짚은 시대의 특징이다.

맺음 — 다음 달의 달력

2026년 5월 말의 한 주를 일곱 갈래로 나눠 살폈지만, 흐름은 6월에도 멈추지 않는다. 6월 1일 컴퓨텍스에서 엔비디아의 PC용 칩이, 6월 8일 애플 행사에서 새 시리가 공개되고, 같은 달 안에 오픈AI·구글·앤트로픽의 새 모델이 잇따라 나올 것으로 점쳐진다. 달력이 곧 기술 발표 일정으로 채워지는 셈이다.

이 글이 보여주는 것은 인공지능이 더 이상 한 가지 층위의 이야기가 아니라는 점이다. 모델은 더 똑똑하고 더 정직해지려 경쟁하고, 자본은 전례 없는 규모로 몰리며, 에이전트는 화면을 직접 만지고, 생성 기술은 목소리와 영상으로 일상에 스며들고, 하드웨어 지형이 재편되며, 그 모든 것을 향해 윤리적 질문이 동시에 던져지고 있다. 변화가 빠를수록, 무엇이 가능해졌는지를 차분히 짚어 두는 일의 가치도 함께 커진다.

2026년 5월 31일 작성 · 공개된 1차 자료와 보도를 교차 확인해 정리함. 수치와 일정은 발표 시점 기준이며 이후 달라질 수 있음.