지난 3월 인공지능 회사 앤트로픽에서 한 직원의 실수로 사내 비밀 프로젝트 문서가 외부로 유출됐다. 코드명 카피바라로 불리던 이 프로젝트의 정체는 한 달 뒤 회사가 공식 인정하면서 드러났다. 해킹 전문 인공지능 ‘미토스’였다.
미토스는 소프트웨어의 보안 결함을 찾아내고, 그 결함을 실제로 공격할 수 있는 도구까지 자동으로 만들어내는 시스템이다. 결함을 찾는 일과 공격 도구를 만드는 일은 별개의 작업이며, 그동안은 후자가 훨씬 어려운 영역으로 여겨졌다. 보안 전문가들이 양쪽을 모두 마치는 데 평균 2년 2개월이 걸리던 작업을 미토스는 약 20시간 만에 끝낸다.
원리는 비교적 단순하다. 인터넷에는 지금까지 발견된 약 33만 건의 보안 결함 정보가 공개되어 있다. 본래 개발자 학습용으로 정리된 자료다. 미토스는 이 데이터를 학습하고, 소프트웨어 회사들이 보안 패치를 배포할 때마다 수정 전후의 코드를 비교해 어떤 부분이 약점이었는지 스스로 파악한다. 보안 결함이라고 하면 거창해 보이지만 실제로는 결제 직전 본인 확인 절차가 빠져 있거나, 환불 시 결제자와 계좌 주인이 같은지 확인하지 않는 식의 사소한 빈틈인 경우가 많다. 사람 눈에는 잘 보이지 않는 이런 누락이 미토스에게는 곧바로 잡힌다.
앤트로픽은 일반 공개 대신 ‘글래스윙’이라는 이름의 프로그램을 통해 약 50개 빅테크 기업에만 미토스를 시험용으로 제공해왔다. 참여 기업들은 시험 결과 미토스가 토큰을 무제한 사용할 수 있는 환경에서 사실상 모든 시스템을 뚫어냈다고 보고했다. 이 사실이 외부에 알려지자 국제통화기금과 유럽중앙은행이 우려를 표명했고, 한국에서도 4월 중순 과학기술정보통신부와 금융위원회가 은행권과 긴급회의를 가졌다.
해킹용 인공지능 자체가 새로운 개념은 아니다. 마이크로소프트는 2007년부터 자사 윈도 점검에 자동화 도구를 사용해왔고, 미국 국방부는 2016년 컴퓨터끼리 공격과 방어를 겨루는 대회를 열기도 했다. 그 우승작은 사상 첫 자동 공방 기계로 평가받아 스미스소니언 박물관에 전시됐는데, 핵심 기술은 한국인 유학생이 개발한 것이었다. 작년 열린 대규모 언어모델 기반 해킹 대회의 우승팀도 한국인이 주축이었다. 관련 기술력 자체는 한국도 충분히 보유하고 있다는 의미다.
다만 공격과 방어 사이에는 구조적인 시간 차이가 존재한다. 공격 측은 인공지능을 한 번 작동시키면 결과가 나온다. 방어 측은 결함 발견 후 보고서 작성, 결재, 예산 확보, 솔루션 배치까지 통상 수 주에서 수개월이 걸린다. 보안 학계에서는 이를 ‘시간의 비대칭성’이라 부른다.
한국은 여기에 고유한 환경이 더해진다. 2006년부터 시행된 망분리 정책에 따라 정부와 공공기관, 금융권의 업무용 컴퓨터는 인터넷과 분리되어 운영된다. 외부 침입은 차단되지만 일단 내부에 침투가 발생할 경우 신속한 대응이 쉽지 않다. 코로나 시기 재택근무를 위해 일부 망을 연결했던 정부 행정 시스템 ‘온나라’가 2022년부터 3년 가까이 침투당했던 사실이 작년 공식 확인된 바 있다. 정부는 작년에야 전산 데이터를 기밀, 민감, 공개의 세 등급으로 분류하는 체계를 마련했다.
미토스가 등장한 뒤 다른 기업들의 움직임도 빨라졌다. ChatGPT 개발사 OpenAI는 자사도 비슷한 시스템을 보유하고 있다고 발표했고, 국내 한 보안 기업은 같은 시험 환경에서 미토스보다 더 많은 결함을 찾아냈다고 공개했다. 인공지능이 보안 분야에서 보조 도구가 아니라 직접 행위자로 자리 잡고 있다는 신호다. 앤트로픽이 자체 발간한 보고서에 따르면 보안 분석가의 약 절반, 컴퓨터 프로그래머의 약 4분의 3이 인공지능에 의한 업무 대체 영향권에 들어 있다.
기술의 무게가 한쪽으로 옮겨가고 있다. 미토스 유출은 그 이동이 어디까지 진행됐는지 보여주는 한 장면이다. 앞으로 비슷한 시스템이 계속 등장할 것이라는 점에는 전문가들 사이에 큰 이견이 없다. 보안이라는 단어가 의미하는 풍경 자체가 바뀌는 중이다.