jacobhan.me

기술 분석 · AI 의사결정 시스템

팔란티어와 온톨로지
뉴로-심볼릭 AI가 의사결정의 본질을 바꾼다

한 시간에 수 테라바이트가 쏟아지는 전장에서 인간은 결정할 수 없다. 위성·드론·정찰기·휴민트의 정보를 통합하고, 이상 징후를 가려내고, 어디에·몇 시에·어떤 무기로 때릴지를 메뉴판처럼 제시하는 시스템이 이미 가동되고 있다. 그 핵심은 화제의 거대 언어 모델(LLM, Large Language Model)이 아니다. 2400년 전 아리스토텔레스가 제안한 온톨로지(ontology)가 LLM과 결합한 뉴로-심볼릭(neuro-symbolic) AI다. 이 글은 팔란티어(Palantir) 시스템의 내부 구조를 출발점으로, 왜 다시 온톨로지인지, 그것이 향후 3~5년의 산업 판도를 어떻게 흔들지를 정리한다.

2026.05.20 · 약 25분 분량


1. 정보 폭발과 의사결정의 한계

위성 한 대가 지구를 한 바퀴 도는 데 걸리는 시간은 약 90분이다. 미국이 운용하는 정찰·통신·기상 위성, 무인기, 고고도 정찰기, 항공모함 전투단, 인간 정보망(HUMINT, Human Intelligence) 그리고 신호 정보망에서 한 시간 동안 쏟아져 들어오는 데이터는 수 테라바이트 단위다. 이 정보를 사람이 직접 읽고 판단하는 것은 불가능하다.

그러나 현대 군사 작전과 산업 운영의 본질은 동일하다. 주어진 정보로부터 다음 한 수를 결정하는 것이다. 어디에, 몇 시에, 어떤 무기로 때릴 것인가. 어떤 종목에, 얼마나, 언제 들어갈 것인가. 다음 분기 가격을 얼마로 올리면 수요는 어떻게 변하는가. 정보의 양은 폭증했고 의사결정 속도는 단축되어야 하는데, 인간의 작업 기억은 그대로다.

이 간극을 메우는 시스템이 이미 작동하고 있다. 사람이 결정하는 것이 아니라, AI가 의사결정 지원(decision support)을 수행하고 사람은 최종 버튼만 누르는 구조다. 그 대표 주자가 미국 팔란티어 테크놀로지스(Palantir Technologies)다.

비유

요리사와 거대한 식자재 창고

당신이 50명분의 코스 요리를 30분 안에 완성해야 하는데, 식자재 창고에는 매 초마다 새로운 식재료가 트럭으로 들어온다고 하자. 식재료가 어디 있는지조차 모르는 상태에서는 요리가 불가능하다. 누군가 미리 식재료를 종류별로 분류해 라벨을 붙이고, "이 재료들로는 이런 코스를 만들 수 있다"는 메뉴판까지 제시해 줘야 한다. 의사결정 지원 시스템이란 바로 이 "메뉴판"을 만들어 주는 보조 셰프다. 최종 선택은 여전히 헤드 셰프의 몫이다.

2. 지능이란 무엇인가 — 인공지능을 이해하기 위한 네 가지 축

인공지능은 한자 그대로 "인공(人工)으로 만든 지능(知能)"이다. 인공이 무엇인지는 직관적이다. 사람이 만든 것이다. 어려운 것은 "지능"이다. 우리 자신이 지능을 가지고 있다고 확신하지만, 그것이 어떻게 작동하는지는 잘 모른다.

지능을 한자로 풀면 단순하다. 아는 능력(知能)이다. 더 확장하면, 지식을 다룰 수 있는 능력이다. 그렇다면 사람이 만든 인공물 — 안경, 마이크, 옷, 컴퓨터 — 에 아는 능력이 들어가면 그것이 인공지능이다.

현대 AI 연구에서는 지능을 네 가지 축으로 본다.

지능의 네 가지 축

인류 호모사피엔스는 멸종한 다른 호모 종들보다 집단 규모가 컸고, 그래서 언어가 발달했다. 표현 능력이 발달했다는 뜻이다. 깨달음을 공유하면 다음 세대는 그 위에서 출발할 수 있다. 이를 지식의 복리 효과라고 부른다. 호모사피엔스가 살아남은 가장 유력한 이유로 학계에서 제시되는 것이 바로 이 효과다.

현재 챗GPT(ChatGPT)나 클로드(Claude) 같은 LLM은 이 네 축 가운데 학습과 추론에 강하고, 표현은 텍스트 생성으로 보조하며, 계획·의사결정은 절반 정도밖에 지원하지 못한다. 그리고 결정적으로 지식을 명시적으로 표현하는 기능이 약하다. 무엇을 근거로 그렇게 판단했는지 설명하지 못한다는 뜻이다.

반면 팔란티어의 강점은 그 반대다. 표현·추론·의사결정 지원에 강하고 학습이 약하다. 그래서 두 진영이 결합한다. 학습은 LLM이, 표현·추론·계획은 온톨로지 기반 시스템이 맡는다.

3. 팔란티어의 본질 — Gotham, Foundry, 그리고 AIP

팔란티어 시스템은 크게 세 축으로 구성된다.

제품군주된 용도맡는 기능
Gotham 국방·정보 기관 다출처 첩보 통합, 표적 분석, 작전 의사결정 지원
Foundry 제조·금융·의료 등 민간 기업 데이터 통합, 운영·재무 시뮬레이션, 경영 의사결정 지원
AIP (Artificial Intelligence Platform) Gotham·Foundry 위에 얹는 AI 계층 LLM 연동, 자연어 인터페이스, 자율 에이전트 오케스트레이션

Gotham과 Foundry는 동일한 엔진 위에 만들어졌다. 다양한 데이터 소스를 수집하고 의미 구조로 변환한 뒤, 그 위에서 추론과 의사결정 지원을 수행한다. 두 시스템이 가장 먼저 검증된 곳은 국방이었고, 그 뒤를 의료·제조·금융이 따라가고 있다.

그런데 이 구조에는 중요한 빈자리가 있었다. 학습이다. 팔란티어는 자체적으로 LLM 같은 대규모 학습 모델을 보유하지 않는다. 이 빈자리를 채우기 위해 2024년 11월, 팔란티어는 앤트로픽(Anthropic), 아마존웹서비스(AWS, Amazon Web Services)와 손잡고 클로드 모델을 AIP 위에서 사용할 수 있도록 통합했다. 통합 환경은 미국 국방정보시스템국(DISA, Defense Information Systems Agency)의 인증 등급(IL6, Impact Level 6) 환경에서 운용된다.

그러나 이 협력 구도는 2026년 들어 흔들리고 있다. 앤트로픽이 자사 정책상 대규모 국내 감시(mass domestic surveillance)와 자율 무기(autonomous weapons) 용도의 사용을 금지하는 가드레일을 두고 있는데, 미국 국방부는 이 제약이 작전 수행에 부적합하다고 보고 2026년 3월 앤트로픽을 공급망 위험(supply-chain risk)으로 지정했다. 앤트로픽은 이에 대해 미 행정부를 상대로 소송을 제기하고 지정 정지를 요구했다. 다만 팔란티어는 통합 구조가 깊어 단기간에 클로드를 빼낼 수 없으며, 다른 LLM도 병행 통합하는 방향으로 가고 있다고 밝혔다.

비유

두 사람이 한 사무실에서 일하는 구조

팔란티어를 회계법인 본사라고 하자. 본사는 모든 거래 장부를 통합·정리하고, 분석 보고서를 만들어 의뢰인에게 의사결정 옵션을 제시한다. 그런데 본사에는 외국어 회의록을 자동으로 요약해 주는 통역사가 없다. 그래서 외부의 우수한 통역사 사무실(앤트로픽의 클로드)과 책상을 같이 쓰는 형태로 통합 운영해 왔다. 그런데 통역사 사무실이 "특정 종류의 회의 내용 요약은 거절합니다"라는 사내 규정을 강하게 적용하기 시작했고, 본사 큰 고객은 "그럼 다른 통역사를 알아보겠다"고 반응한 것이다. 그러나 책상과 의자, 자료함이 이미 한 몸처럼 짜여 있어서 통역사를 갈아 끼우는 일도 단순하지 않다.

4. 온톨로지 — 2400년 된 미래 기술

팔란티어 시스템의 중심에는 온톨로지가 있다. 온톨로지는 팔란티어가 발명한 것이 아니다. 기원전 4세기, 아리스토텔레스가 제안한 개념이다.

라파엘로의 아테네 학당(The School of Athens)에는 그리스 철학사의 주요 인물이 한 화폭에 모여 있다. 중앙에 플라톤과 아리스토텔레스가 있다. 플라톤은 손가락을 하늘로 향하고 있다. 이상(理想)을 가리킨다. 그는 이상주의자였고, 국가는 완벽한 철인이 다스려야 한다고 보았다. 그리고 제자들에게 글을 읽거나 쓰지 못하게 했다. 토론과 사유만이 완벽한 지식에 이른다고 믿었기 때문이다.

제자인 아리스토텔레스는 다른 손짓을 한다. 손바닥을 아래로 향하고 있고, 왼손에는 윤리학(Ethica)을 들고 있다. 이상은 존재하지 않는다, 완벽한 인간은 없다, 세상은 윤리로 다스려야 한다는 메시지로 해석된다. 아리스토텔레스는 스승의 가르침을 거슬러 글을 썼고, 자신이 깨달은 것을 후대에 전달하기 위한 체계적 방법을 고민했다.

그 시기 그리스 자연철학은 이미 원자(atom, 아톰)라는 개념에 도달해 있었다. 세상의 모든 물질은 더 이상 자를 수 없는 단위 원소로 구성되어 있다는 주장이다. 아리스토텔레스는 이 발상을 지식의 세계로 옮긴다. 지식도 잘게 쪼개 나가면 더 이상 쪼갤 수 없는 단위 지식이 있을 것이고, 세상의 모든 지식은 단위 지식이 서로 연결되어 있는 거대한 그물망일 것이라는 가설이다. 그는 이 그물망을 온톨로지라 명명하고, 그 위에서 사유하는 방식을 추론(reasoning)이라 명명했다. 우리가 오늘날 사용하는 추론, 논리(logic), 명제(proposition) 같은 단어가 모두 그리스어에 뿌리를 둔다.

21세기 팔란티어가 사용하는 온톨로지는 그 발상을 디지털화한 것이다. 본질적인 발상은 2400년 전 것이고, 본격적인 컴퓨터 과학 연구만 따져도 약 40년 역사다. 그러나 온톨로지만으로는 꽃을 피우지 못했다. 학습 능력이 부족했기 때문이다. 거기에 LLM이 결합하면서 비로소 본격적인 상용화가 시작됐다.

단위 지식, 술어 논리, 지식 그래프

온톨로지의 기본 단위는 술어 논리(predicate logic)로 표현되는 단위 지식이다. 예컨대 "어떤 사람 P는 종업원이다", "기업 A는 법적 존재다", "P는 기업 A를 위해 일한다" 같은 문장이다. 영어 문법으로 보면 "주어(subject) — 술어(predicate) — 목적어(object)"의 세 요소가 모인 짧은 문장이다. 이 단위 지식이 점점 늘어나서 서로 연결되면 다음과 같은 그림이 만들어진다.

인물 P 종업원 사람 기업 A 기업 법적 존재 서울-뉴욕 항공편 비행기 교통수단 ~의 인스턴스 ~이다 ~의 인스턴스 ~이다 ~을 위해 일한다 ~의 인스턴스 ~이다 ~을 예약한다 ~이다

단위 지식이 화살표로 연결된 지식 그래프. 노드는 개체, 엣지에는 관계의 의미가 부여된다.

이 구조의 핵심은 관계에 의미가 부여되어 있다는 점이다. 일반적인 데이터베이스에서 두 개체 사이의 관계는 단순한 외래 키(foreign key)에 지나지 않지만, 온톨로지에서는 "~의 인스턴스이다", "~을 위해 일한다", "~을 예약한다", "~을 소유한다" 같은 의미가 화살표 위에 명시된다. 이 의미가 있어야 추론이 가능하다. 이를 저장하는 데이터베이스를 그래프 데이터베이스(graph database)라 하고, 가장 높은 수준의 형태는 추론까지 가능한 추론 가능한 온톨로지(reasonable ontology)다.

비유

책장에 꽂힌 책 vs. 책 사이의 인용 관계

도서관의 책장은 분류 번호와 제목으로 책을 정리한다. 책 A와 책 B가 서로 옆에 꽂혀 있다는 사실만으로는 둘의 관계를 알 수 없다. 반면 학술 논문 네트워크에서는 "논문 A가 논문 B를 인용한다", "논문 B가 논문 A의 반론이다", "논문 C는 둘을 종합한다"는 식으로 관계 자체에 의미가 부여된다. 이 관계망을 따라가면 한 분야의 지적 계보가 드러난다. 일반 데이터베이스는 책장에 가깝고, 온톨로지는 인용 네트워크에 가깝다.

5. 같은 정보, 다른 의미 — 온톨로지가 데이터베이스보다 강한 이유

왜 의미적 관계가 중요한지 단순한 사고 실험으로 보자.

다음과 같은 세 사람이 있다고 하자.

여기까지의 정보는 일반 데이터베이스의 행(row)에 들어가는 값과 다르지 않다. 엑셀의 한 셀에 채워지는 숫자와 문자열이다. 그런데 다음 관계가 추가된다고 해 보자.

인물 X에 대한 인상은 한순간에 바뀐다. 35세에 연예인과 결혼해 자녀를 두고 상장 기업까지 이끄는 가정적이고 능력 있는 인물이라는 인상이 만들어진다. 각 인물의 속성 데이터(나이, 키, 직업)는 단 한 글자도 바뀌지 않았다. 바뀐 것은 오직 인물과 인물 사이의 의미적 관계뿐이다.

여기에 또 다른 인물 W가 등장하고, 알고 보니 X와 내연 관계임이 드러난다고 해 보자. 인상이 다시 흔들린다. 가정적이라는 평가는 사라진다. 또 다른 인물 V가 등장하고, V도 X와 내연 관계이며 동시에 W와도 내연 관계임이 드러난다고 해 보자. 인상은 다시 무너진다. 그러나 X·Y·Z·W·V 각각의 속성 데이터는 여전히 바뀐 것이 없다.

통찰

그리고 온톨로지에는 단순 관계뿐 아니라 제약 조건(constraint)도 들어간다. 가령 "결혼한 남자는 다른 결혼한 여자와 동시에 결혼할 수 없다(일대일 카디널리티, one-to-one cardinality)" 같은 규칙이 있다. 또 "연인 관계의 한쪽이 남성이면 다른 한쪽은 여성이어야 한다"는 식의 도메인-치역 제약(domain-range restriction)도 있다. 이런 규칙이 깨지는 데이터가 들어오면 시스템은 이상 징후로 표시한다.

국방 데이터에 이 구조를 적용하면 다음과 같다. 인공위성이 찍은 사진, 인간 정보망(휴민트)이 보고한 메모, 드론 영상, 정찰기 레이더 신호, 항공모함 전투단의 전술 데이터, 통신 감청. 각각은 따로 떨어져 있는 퍼즐 조각이다. 사람이 이 조각이 어떻게 연결되는지 다 짜 맞출 수 없다. AI가 각 데이터에서 의미 있는 조각을 뽑아내 같은 온톨로지 안에 통합하고, 모순이나 이상 징후를 감지한다.

6. 전쟁의 신 — 다출처 정보 융합과 의사결정 지원

이 구조가 가장 먼저 성숙한 곳은 미국 국방이다. 미 국방부는 모든 군종(육·해·공·우주·사이버)의 센서와 무기·지휘 체계를 데이터 차원에서 연결하는 거대한 사업을 추진하고 있다. 명칭은 JADC2(Joint All-Domain Command and Control, 합동 전 영역 지휘통제)이며, 동맹국까지 포함한 확장판은 CJADC2(Combined JADC2)로 불린다. 팔란티어는 이 사업에 깊이 관여해 왔다.

이 시스템이 동작하는 방식을 단순화하면 다음과 같다.

데이터 소스 의미 통합 의사결정 지원 위성 영상 드론 센서 정찰기 레이더 휴민트 보고 통신 감청 항모 전술망 시맨틱 데이터 패브릭 VLM·LLM이 의미 조각 추출 온톨로지로 통합·정합 제약 위반·이상 징후 감지 표적 우선순위 교전 시뮬레이션 근거 제시·설명 에이전트 자율 행동 인간 최종 결정

다출처 정보가 시맨틱 데이터 패브릭으로 통합된 뒤, 의사결정 지원 산출물로 분기된다. 최종 결정은 여전히 인간이 내린다.

위성 한 대가 찍어 올리는 영상을 사람이 모두 판독할 수 없다. 그래서 시각 언어 모델(VLM, Vision Language Model)이 1차로 영상을 읽고, 의미 있는 변화 — 예컨대 "북한 방사포 진지의 문이 열렸다", "특정 항만에 새로운 컨테이너가 적재됐다", "특정 위치에 사람의 활동 흔적이 늘었다" — 만 추려낸다. 추려낸 사실은 온톨로지의 형태로 변환되어 다른 출처의 정보(휴민트, 통신 감청, 드론)와 의미적으로 결합된다.

그 결과로 시스템은 사용자에게 메뉴판을 제시한다. "A 지점에 오전 3시에 정밀 유도탄으로 타격할 때 예상 효과와 위험은 다음과 같다. B 지점은 다음과 같다. C 지점은…" 그리고 결정적으로, 각 옵션 옆에는 왜 그렇게 판단했는지의 근거가 붙는다. 어떤 위성이 언제 찍은 영상의 어떤 픽셀 변화가, 어떤 휴민트 보고와 어떤 통신 감청 패턴과 어떻게 연결되는지가 사슬처럼 제시된다.

설명 가능성 — LLM만으로는 도달할 수 없는 지점

LLM의 가장 큰 한계가 여기서 드러난다. LLM은 학습된 가중치에 기반해 다음 토큰을 확률적으로 생성하는 모델이다. 출력에 대해 "왜 그 단어를 골랐는가"를 인간이 이해 가능한 형태로 추적하기가 매우 어렵다. 사실상 블랙박스다. 검색 증강 생성(RAG, Retrieval-Augmented Generation) 같은 기법으로 일부 근거 문서를 띄워 보여줄 수는 있지만, 그것이 모델 내부의 모든 추론을 설명해 주지는 않는다.

반면 온톨로지 기반 추론은 설명 가능한 AI(XAI, Explainable AI)의 본령이다. 결론에 도달하기까지 거친 단위 지식과 추론 규칙을 명시적으로 보여줄 수 있다. 의료에서 어떤 진단을 권고했다면 어떤 환자 데이터, 어떤 가이드라인, 어떤 유사 사례에서 그 권고가 도출되었는지 사슬 형태로 제시된다. 군사에서도 동일하다.

비유

두 가지 비서

비서 A는 똑똑하지만 결과만 알려준다. "오늘 회의는 오후 3시에 잡으시는 게 좋겠습니다." 왜냐고 물으면 "전반적으로 그게 좋아 보였습니다"라고 답한다. 비서 B는 결과와 함께 근거 사슬을 제시한다. "오후 3시 회의가 가장 적절합니다. 이유는 (1) 박 부장이 오전 12시까지 외부 일정이 있고, (2) 김 이사 비행기가 오후 2시 도착이며 본사까지 50분 걸리고, (3) 회의실 A·B·C 중 A만 3시에 비어 있기 때문입니다." 사장이 "박 부장 외부 일정이 취소됐다"는 새 정보를 주면, 비서 B는 즉시 다시 계산해 다른 안을 제시할 수 있다. 비서 A는 그러지 못한다. 비서 A가 LLM, 비서 B가 온톨로지 기반 시스템이다.

7. 좌뇌와 우뇌 — 심볼릭과 뉴럴, 두 진영의 화해

인공지능의 역사는 두 학파 사이의 긴 경쟁사다.

한쪽은 심볼릭(symbolic) 접근이다. 세상의 모든 지식을 기호와 논리식으로 표현할 수 있다는 입장이다. 1960~80년대의 전문가 시스템(expert system), 시맨틱 웹(Semantic Web), 그리고 온톨로지 연구가 이 계보에 속한다. 언어학자 노암 촘스키(Noam Chomsky)가 이론적 뿌리에 있다고 자주 언급된다.

다른 한쪽은 뉴럴(neural) 접근, 즉 신경망과 기계학습이다. 인간 뇌의 작동 방식을 수학적으로 모사해 데이터로부터 패턴을 학습하는 방식이다. 명시적 규칙을 사람이 짜 넣는 대신, 알고리즘에 데이터를 충분히 주면 스스로 패턴을 발견한다. 딥러닝(deep learning), 합성곱 신경망(CNN, Convolutional Neural Network), 변환기(Transformer)가 이 계보다. 2024년 노벨 물리학상을 받은 제프리 힌튼(Geoffrey Hinton)이 대표 인물이다.

두 학파는 오랫동안 서로의 한계를 지적해 왔다. 심볼릭 진영은 "신경망은 왜 그렇게 작동하는지 설명할 수 없다"고 비판했고, 뉴럴 진영은 "심볼릭 시스템은 현실 세계의 모호한 데이터를 처리하지 못한다"고 비판했다. 둘 다 옳았다.

흥미롭게도 인간의 뇌는 이 두 방식을 모두 사용한다. 흔히 말하는 좌뇌(언어·논리)와 우뇌(직관·암묵지)의 통속적 구분이 그것이다. 실제 신경과학적으로 좌·우 반구의 기능이 그렇게 깔끔하게 나뉘는 것은 아니지만, 비유적으로는 유용하다. 인간은 명시적 규칙과 직관적 패턴 인식을 동시에 사용한다.

AI도 마침내 그 단계로 가고 있다. 두 진영의 결합이 뉴로-심볼릭 AI(neuro-symbolic AI)다. 학습과 패턴 인식은 LLM·VLM 같은 신경망이 맡고, 지식 표현·추론·제약 관리는 온톨로지가 맡는다. 그리고 그 통합 위에서 자율 행동을 수행하는 단위가 AI 에이전트(agent)다.

구분심볼릭 AI뉴럴 AI
지식 표현명시적 기호·관계가중치(암묵적)
학습 방식규칙 작성 / 추출대규모 데이터로부터 패턴 발견
설명 가능성높음낮음(블랙박스)
모호한 입력약함강함
연산 자원주로 CPU, 가벼움대규모 GPU, 무거움
대표 시스템전문가 시스템, 시맨틱 웹, 온톨로지딥러닝, LLM, VLM

앨런 튜링과 의식의 문제

AI 학파를 넘어, "기계가 정말로 생각할 수 있는가"라는 질문은 더 깊은 철학적 문제다. 인공지능의 아버지로 불리는 앨런 튜링(Alan Turing)이 1950년 논문 Computing Machinery and Intelligence에서 던진 질문이다. 그는 답한다. "기계는 우리와 다른 방식으로 생각할 수 있다. 우리는 생물학적으로 생각하지만, 기계는 수학적으로 생각할 것이다. 다른 방식으로 생각한다고 해서 생각하지 않는다고 단정할 수 있는가."

튜링 본인의 삶에 비추어 보면 이 구절은 단순한 기술 철학이 아니다. 그는 동성애자였고, 당시 영국에서 그것은 처벌 대상이었다. 그가 받은 강제 치료(화학적 거세)는 결국 그를 자살로 몰았다. "네가 여자를 사랑한다고 해서 내가 남자를 사랑하는 것이 사랑이 아니라고 단정하지 말라"는 외침이 같은 문단 아래 흐른다.

현대 AI 연구자들 사이에서는 의식(consciousness)이라는 것이 새로운 형태로 출현할 수 있다는 가설을 진지하게 다룬다. 그것이 인간의 의식과 동일하느냐는 질문 자체가 무의미할 수 있다는 입장이다. 다만 한 가지는 분명하다. 시스템이 자기 출력의 근거를 설명할 수 있을 때, 사람은 그 시스템에게 더 많은 신뢰와 권한을 부여한다. 그래서 다시 온톨로지다.

8. 기계학습의 본질 — 분류와 차원

여기서 잠깐 LLM의 작동 원리도 짚어 두자. 본질은 매우 단순하다. 두 부류(A 또는 B)로 나누는 문제를 푸는 것이다.

주식이 오를 것인가(A) 떨어질 것인가(B). 앞에 오는 차가 나를 칠 것인가(A) 아닌가(B). 이 위치에 다음 돌을 두면 이길 것인가(A) 질 것인가(B). 모든 의사결정 문제는 결국 A·B의 선택으로 환원된다.

그 선택을 내리기 위해 시스템은 입력의 특징(feature)을 추출한다. 한 사람의 사진이라면 키, 몸무게, 머리 색깔, 표정, 자세, 배경, 의상, 인종이 모두 특징이다. 각 특징은 하나의 차원(dimension)이다. 키만 보면 1차원, 키와 몸무게를 같이 보면 2차원, 거기에 인종까지 더하면 3차원이다.

2차원 평면 위에 사람들을 점으로 찍어 두고 두 그룹으로 나누는 직선을 긋는다고 상상해 보자. 학교 수학 시간에 배운 분리선 찾기 문제다. 차원이 3차원이 되면 직선 대신 면을 찾아야 하고, 차원이 늘어날수록 그 경계는 더 복잡한 초평면(hyperplane)이 된다. 기계학습은 이 분리 경계를 데이터로부터 자동으로 찾아내는 일이다.

현재 주류 LLM은 천 단위에서 수만 단위에 이르는 임베딩 차원을 사용한다. 인간이 직관적으로 다룰 수 있는 차원의 한계는 3차원이지만, 수학적으로는 차원을 늘릴수록 더 미세한 패턴을 잡을 수 있다. 다만 차원을 늘리는 만큼 연산량이 폭증한다. 그래서 그래픽처리장치(GPU, Graphics Processing Unit)가 필요해지고, 그 GPU를 거의 독점적으로 공급하는 엔비디아(NVIDIA)가 현재 시장을 가져가고 있다.

한편 변환기(Transformer)라는 신경망 구조가 2017년 등장한 이후 LLM의 규모는 급격히 커졌다. 발표자는 "1년에 100배"라는 표현을 썼는데, 학계의 보수적인 추정치(예: Epoch AI의 분석)로 보아도 2018~2024년 사이 최첨단 학습 연산량은 매년 4~5배가량 증가했다. 누적으로는 같은 기간에 수십만 배에서 백만 배 수준으로 늘었다. 정확한 수치에는 이견이 있지만, 지난 5년간 모델 학습 규모가 전례 없는 속도로 팽창했다는 점은 분명하다.

비유

2차원 지도와 3D 입체 모델의 차이

도시를 평면 지도로만 보면 길이 어디서 어떻게 휘어 있는지만 알 수 있다. 입체 모델로 보면 어느 길이 어느 길 위로 지나가는지, 어느 건물이 어느 건물 그림자에 들어가는지도 알 수 있다. 차원이 늘어난다는 것은 데이터를 더 풍부하게 본다는 뜻이다. LLM이 수천 차원의 임베딩 공간에서 단어를 배치한다는 것은, 인간이 직관적으로 잡지 못하는 미세한 의미 차이까지 좌표상의 거리로 표현한다는 뜻이다.

9. 시맨틱 데이터 패브릭과 에이전트 오케스트레이션

이쯤에서 팔란티어 시스템의 내부 구조를 한 번 더 정리해 보자. 핵심 개념은 시맨틱 데이터 패브릭(semantic data fabric)이다. 직역하면 "의미적 데이터 직물"이다. 천을 짤 때 씨실과 날실이 서로 엮여 한 장의 옷감이 되듯, 서로 다른 출처의 데이터가 의미적 관계로 엮여 하나의 일관된 의미 공간을 만든다는 발상이다.

과거에는 다른 접근이 시도되었다. 빅데이터 분석의 시대다. 회사 내부의 모든 데이터를 한 통(데이터 레이크, data lake)에 다 부어 넣으면, 거기서 마법처럼 인사이트가 나올 것이라는 기대였다. 거의 모든 대기업이 시도했고, 거의 모두 실패했다. 이질적인 데이터는 그냥 모아 둔다고 통합되지 않는다.

팔란티어가 선택한 방식은 정반대다. 모든 데이터를 한 곳으로 옮기지 않는다. 데이터는 원래 있던 곳에 두고, 각 소스에서 의사결정에 필요한 의미 조각만 추출해 온톨로지로 통합한다. 통합된 의미 공간 위에 의사결정 시뮬레이션과 자율 에이전트가 동작한다.

이 위에 최근 추가된 층이 에이전트 오케스트레이션(agent orchestration)이다. 한 가지 일을 수행하는 자율 에이전트를 여러 개 만들고, 그들이 서로 협업하도록 조율하는 구조다. 한 에이전트는 시황 뉴스를 24시간 모니터링하고, 다른 에이전트는 공시 자료를 파싱하며, 또 다른 에이전트는 애널리스트 보고서를 정리한다. 그 위의 통합 에이전트가 결과를 종합해 일일 보고서를 만든다. 마치 회사의 비서실·전략기획실·리스크 관리팀이 협업해 CEO에게 데일리 브리핑을 올리듯이.

이 에이전트 군집이 의미 있게 동작하려면 두 가지가 필수다. 첫째, 각 에이전트가 추출한 정보를 같은 의미 공간에서 결합할 수 있어야 한다. 그것이 온톨로지다. 둘째, 에이전트끼리 자연어로 협상하고 작업을 나눌 수 있어야 한다. 그것이 LLM이다. 둘이 결합되어야 시스템이 작동한다.

10. 비용의 경제 — GPU와 CPU, 그리고 시장 판도

심볼릭 진영과 뉴럴 진영의 결합은 단순히 성능 문제만이 아니다. 비용 구조가 다르다.

LLM은 GPU 위에서 동작한다. 거대한 행렬 곱셈을 병렬로 처리해야 하기 때문에 GPU의 수천 개 코어가 필요하다. 그래서 추론 한 번에 드는 전기·하드웨어 비용이 비싸다. 반면 온톨로지 기반 추론은 대부분 CPU(Central Processing Unit) 위에서 동작한다. 단위 지식 간의 그래프 탐색과 논리 추론은 순차적 분기가 많은 작업이고, 이 경우 CPU가 더 적합하다.

구조에 따라 다르지만, 일반적으로 동일한 질의에 대해 온톨로지 기반 시스템은 LLM 기반 시스템보다 한 자릿수 이상 적은 컴퓨팅 비용으로 답을 낼 수 있다. 자주 답해야 하는 정형 질의는 온톨로지에 맡기고, 자연어 이해와 새로운 패턴 탐지가 필요한 부분만 LLM에 맡기는 분업이 합리적이다.

현실적 함의

고빈도 매매와 의사결정의 자동화

의사결정 시스템의 극단적 사례는 금융이다. 미국의 헤지 펀드와 퀀트 운용사들이 사용하는 고빈도 매매(HFT, High-Frequency Trading)는 초당 수만 회에서 수백만 회의 거래를 수행한다. 이 속도는 일반 소프트웨어와 범용 CPU로는 도달할 수 없는 영역이다.

그래서 일부 운용사는 자기 매매 알고리즘 자체를 FPGA(Field-Programmable Gate Array) 칩이나 전용 ASIC(Application-Specific Integrated Circuit, 특정 용도 집적 회로)에 직접 회로로 구현해 사용한다. 알고리즘이 곧 반도체가 되는 것이다. 이런 칩 위에서 시장 데이터를 받아 즉시 매매 신호를 내보내고, 그 결과를 다시 측정해 다음 주문을 낸다. 인간의 개입은 사실상 정책 설정과 사후 검토 단계에만 있다.

이 흐름이 군사·산업·금융을 거쳐 의료·행정으로 확장되고 있다. 시스템이 의사결정 옵션을 만들고, 인간은 그 가운데 한 가지를 고르는 구조다. 그러나 옵션이 합리적이라는 점을 인간이 검증할 수 있어야 하고, 그러려면 시스템이 자기 추론을 설명할 수 있어야 한다. 이것이 온톨로지가 다시 부상하는 시장의 이유다.

11. 향후 3~5년, 그리고 한국의 자리

요약하면 다음과 같다.

  1. 정보 폭발 속에서 인간이 직접 결정할 수 없는 영역이 빠르게 늘고 있다. AI 의사결정 지원 시스템이 필수가 되고 있다.
  2. 의사결정 지원이 성립하려면 결과뿐 아니라 근거를 사용자에게 제시할 수 있어야 한다. 설명 가능성이 핵심이다.
  3. LLM 단독으로는 설명 가능성을 보장하지 못한다. 명시적 지식 표현 체계인 온톨로지가 결합되어야 한다.
  4. 온톨로지는 2400년 전 아리스토텔레스의 발상에 뿌리를 두지만, 본격적인 산업 적용은 LLM과 결합한 뉴로-심볼릭 구조에서 비로소 가능해졌다.
  5. 군사에서 검증된 이 구조는 제조·금융·의료·재난 안전·범죄 예방으로 확장되고 있다.
  6. 비용 면에서 GPU 기반 신경망보다 CPU 기반 심볼릭 처리가 훨씬 가볍다. 두 진영의 분업이 산업 표준이 될 가능성이 크다.

한국에 시사하는 바는 분명하다. 첫째, 주권 AI(Sovereign AI)는 LLM 모델 하나만 자체 구축한다고 완성되지 않는다. 자국의 데이터·산업·규제 맥락을 반영한 주권 온톨로지(sovereign ontology)가 함께 구축되어야 한다. 한국의 산업 데이터, 법령, 행정 절차, 군사·안보 체계를 자국 언어와 자국 의미 체계로 표현한 온톨로지 없이 외산 시스템에만 의존하면, 결정적 순간에 의사결정의 근거를 통제할 수 없게 된다.

둘째, 두 진영의 기술 — LLM과 온톨로지 — 을 동시에 보유한 기업·연구기관이 경쟁 우위를 갖는다. 일부는 LLM에만, 일부는 온톨로지에만 집중해 왔지만, 시장이 요구하는 것은 둘의 결합이다.

셋째, 향후 3~5년의 시장 판도는 에이전트 시장에서 갈릴 가능성이 높다. 단일 모델의 성능 경쟁은 이미 후반전에 와 있고, 다음 무대는 여러 에이전트가 의미 공간 위에서 협업해 산업 업무를 자동화하는 영역이다. 그 무대 위에서 온톨로지는 무대 바닥의 기반 구조처럼 깔린다. 무대 위 배우들이 LLM 에이전트들이라면, 그들이 같은 의미를 공유하고 같은 대본 위에서 움직이게 해 주는 무대 바닥이 온톨로지다.

강한 자가 살아남는 것이 아니라, 살아남은 자가 강한 것이다. 오랫동안 빛을 보지 못했던 온톨로지가 LLM 시대에 다시 부상하는 것도 같은 이치다. 잘 풀리지 않던 옛 발상이 새로운 도구와 만나면 비로소 본래의 잠재력을 드러낸다.

2400년 전의 발상이 21세기 인공지능의 한 축으로 되살아나는 장면은, 기술이 직선적으로 발전한다는 통념과 어긋난다. 기술은 오래된 발상과 새로운 도구가 만나는 지점에서 굴절된다. 다음 굴절점은 어쩌면 또 다른 옛 발상 위에서 일어날지 모른다.


참고 — Palantir Technologies 공식 발표(2024년 11월), 미 국방부 JADC2/CJADC2 관련 공개 자료, Anthropic-Palantir-AWS 협력 발표, 2026년 3월 미 국방부의 Anthropic 공급망 위험 지정 및 관련 소송 보도, 그리고 인공지능 학계의 뉴로-심볼릭 연구 흐름을 종합해 정리.