과학과 미신 사이
운세를 보러 가면 흔히 듣는 말이 있다. “사주는 통계예요.” 이 한 문장이 사실이 되려면 무엇이 필요한지, 그리고 그 조건이 실제로 충족되는지를 하나씩 짚어본다.
2026년 6월
명절 친척 모임에서, 혹은 대학가 사주 카페에서 누군가는 이렇게 말한다. “사주는 미신이 아니라 통계야. 천 년 동안 수많은 사례가 쌓여서 만들어진 학문이라고.” 관상도 비슷한 대접을 받는다. “오랜 경험으로 얼굴과 운명의 상관관계를 정리한 거니까, 나름 데이터에 근거한 셈이지.”
이 말에는 묘한 설득력이 있다. ‘미신’은 거부감을 주는 단어지만 ‘통계’는 과학의 외투를 걸치고 있기 때문이다. 그러나 무언가를 ‘통계’라고 부르려면 단지 사례가 많이 쌓였다는 사실만으로는 충분하지 않다. 통계학에는 충족해야 할 구체적인 조건이 있다. 이 글은 사주와 관상을 깎아내리려는 것이 아니라, “그것이 통계과학인가”라는 질문을 곧이곧대로 받아들여 그 조건을 하나씩 대조해보려는 시도다.
통계학은 ‘많은 이야기의 모음’이 아니다. 그것은 잡음(noise) 속에서 신호(signal)를 가려내기 위해 고안된 절차의 묶음이다. 어떤 주장이 통계적으로 검증되었다고 말하려면, 적어도 다음 다섯 가지 부품이 작동하고 있어야 한다.
첫째, 체계적인 데이터 수집. 관심 있는 변수를 미리 정하고, 어떤 집단을 대표할 수 있도록 표본(sample)을 뽑아 빠짐없이 기록해야 한다. 마음에 드는 사례만 골라 모으는 것은 데이터가 아니라 일화(anecdote)의 수집이다.
둘째, 반증 가능한 예측. 좋은 모형은 “이런 조건에서는 이런 결과가 나올 것”이라고 미리, 구체적으로 말한다. 그리고 그 예측이 틀리면 모형이 틀렸다고 인정한다. 어떤 결과가 나와도 사후에 끼워 맞출 수 있는 설명은 검증의 대상이 될 수 없다.
셋째, 대조군(control group). “이 처방을 받은 사람이 나았다”는 것만으로는 부족하다. 처방을 받지 않은 사람과 비교해서, 처방을 받은 쪽이 더 나았는지를 보아야 한다.
넷째, 오차의 정량화. 관찰된 차이가 단순한 우연으로 생길 확률(p값), 그 차이의 크기(효과크기), 추정의 불확실성 범위(신뢰구간)를 숫자로 제시해야 한다.
다섯째, 재현(replication). 한 사람이 한 번 얻은 결과가 아니라, 다른 사람이 다시 해도 같은 결과가 나와야 한다.
새로운 약이 ‘효과가 있다’고 인정받는 과정을 떠올리면 통계적 검증의 모습이 또렷해진다. 연구진은 시험을 시작하기 전에 “혈압을 평균 몇 ㎜Hg 낮춘다”는 가설을 미리 등록한다. 환자를 무작위로 두 집단으로 나누어 한쪽엔 진짜 약을, 다른 쪽엔 가짜 약(위약)을 준다. 누가 어느 쪽인지 의사도 환자도 모른다(이중맹검). 시험이 끝나면 두 집단의 차이가 우연으로 생길 확률을 계산하고, 다른 연구팀이 같은 결과를 재현하는지 확인한다. 이 모든 절차를 통과해야 비로소 “통계적으로 효과가 입증되었다”고 말한다. ‘통계’라는 단어의 무게는 여기에 있다.
조건을 대조하기 전에, 사주가 실제로 무엇을 계산하는 장치인지부터 간단히 짚어두자.
사주(四柱)는 ‘네 기둥’이라는 뜻이다. 태어난 해(年)·달(月)·날(日)·시(時) 네 가지를 각각 하나의 기둥으로 삼는다. 각 기둥은 천간(天干)과 지지(地支)라는 두 글자로 표시된다. 천간은 갑·을·병·정·무·기·경·신·임·계 열 글자, 지지는 자·축·인·묘·진·사·오·미·신·유·술·해 열두 글자다. 네 기둥에 각각 두 글자씩, 모두 여덟 글자가 나온다. 이것이 ‘팔자(八字)’다.
이 여덟 글자는 다시 오행(五行), 곧 목(木)·화(火)·토(土)·금(金)·수(水) 다섯 기운으로 환산된다. 오행끼리는 서로 북돋우거나(상생) 누르는(상극) 관계를 맺는다고 본다. 명리학(命理學)은 한 사람의 팔자에 어떤 오행이 많고 적은지, 그 기운들이 어떻게 얽히는지를 읽어 성격과 운세를 해석한다. 오늘날의 주류 이론은 송나라의 서자평(徐子平)이 태어난 날을 중심으로 풀이하는 방식을 세운 데서 비롯되었다.
요컨대 사주는 ‘태어난 시각’이라는 입력값을 정해진 규칙에 따라 여덟 글자, 그리고 다섯 기운으로 변환하는 일종의 계산 장치다. 입력은 객관적이고(생년월일시는 분명하다) 변환 규칙도 정해져 있다. 진짜 쟁점은 그다음, 곧 “이 기운의 배합이 실제 삶과 어떻게 연결되는가”라는 주장이 검증된 적이 있느냐다.
앞서 꼽은 다섯 부품을 사주에 하나씩 대보자.
체계적 데이터 수집은 없다. 사주가 ‘천 년의 데이터’라는 말은 흔히 들리지만, 수백만 명의 출생 시각을 빠짐없이 기록하고 그들의 삶을 객관적 지표로 추적해 대조한 자료는 존재하지 않는다. 명리서에 실린 사례들은 술사(術士)가 인상적이라고 판단한 경우를 골라 적은 것이다. 잘 맞은 풀이는 기억되고 기록되지만, 빗나간 풀이는 조용히 잊힌다. 이것은 통계가 아니라 생존자 편향(survivorship bias)이 걸린 일화의 모음이다.
반증 가능한 예측도 없다. 명리 해석은 “재물운이 들어오는 시기”나 “조심해야 할 관계”처럼 폭넓게 적용되는 언어로 이루어진다. 좋은 일이 생기면 운이 좋았다고, 나쁜 일이 생기면 액운을 미리 일러주었다고 풀이할 수 있다. 어떤 결과가 나와도 사후에 설명이 가능하다면 그 주장은 틀릴 수가 없고, 틀릴 수 없는 주장은 검증의 영역 밖에 있다. 과학철학자 칼 포퍼(Karl Popper)가 점성술을 두고 ‘반증 불가능한 사이비 과학’의 대표 사례로 든 것도 같은 이유에서였다.
대조군도 없다. 같은 시기에 같은 풀이를 받지 않은 사람들과 비교해, 사주를 본 쪽의 예측이 더 잘 맞았는지를 따져본 적이 없다. 오차의 정량화도, 재현도 없다. 한 명리가의 풀이와 다른 명리가의 풀이가 얼마나 일치하는지(같은 팔자를 두고도 해석이 갈리는 일은 흔하다), 그 적중률이 우연보다 유의하게 높은지를 숫자로 제시한 자료는 찾기 어렵다.
입력값(생년월일시)이 객관적이라는 점이 종종 “그러니 과학적”이라는 인상을 준다. 그러나 입력이 객관적인 것과, 입력과 결과의 관계가 검증된 것은 전혀 다른 문제다. 정확한 숫자를 넣어도 그 숫자를 운명으로 잇는 규칙이 검증되지 않았다면, 계산은 정밀하되 결론은 임의적이다.
사주나 관상을 보고 “소름 돋게 맞았다”고 느낀 경험은 흔하다. 이 경험은 분명히 진짜다. 다만 그 느낌이 ‘적중률이 높다’는 증거가 되지는 못한다. 사람이 어떤 풀이를 자기 것으로 받아들이게 만드는 심리 기제가 여럿 알려져 있기 때문이다.
가장 유명한 것이 포러 효과(Forer effect), 다른 이름으로 바넘 효과(Barnum effect)다. 1949년 심리학자 버트럼 포러는 학생 39명에게 성격 검사를 시킨 뒤 ‘당신만을 위한 분석 결과’라며 개별 보고서를 나눠주었다. 학생들은 자기 보고서가 얼마나 정확한지 평균 5점 만점에 4.26점을 매겼다. 그런데 사실 모두가 똑같은 글을 받았다. “당신은 남에게 인정받고 싶어 하면서도 스스로에게는 비판적이다” 같은, 누구에게나 들어맞는 문장들로 채워진 글이었다. 이 실험은 이후 수백 번 반복되었고 결과는 한결같았다.
여기에 몇 가지 기제가 더해진다. 확증 편향은 맞은 항목만 또렷이 기억하고 빗나간 항목은 흘려보내게 만든다. ‘콜드 리딩’은 처음엔 두루뭉술하게 던진 뒤 상대의 표정과 반응을 살펴 말을 조여가는 대화 기술이다. 풀이가 모호할수록 듣는 사람이 자기 사정에 맞게 채워 넣을 여지가 커지고, 그렇게 스스로 채운 내용을 ‘맞혔다’고 돌려준다.
‘한 치수로 누구에게나 맞는다(one size fits all)’는 옷을 떠올려 보자. 키가 크든 작든 일단 걸치면 어느 정도는 몸에 맞는 것처럼 느껴진다. 옷이 당신의 치수를 정확히 알아맞힌 것이 아니라, 애초에 누구에게나 어느 정도 맞도록 헐겁게 만들어졌기 때문이다. ‘잘 맞는 풀이’의 상당 부분은 이 프리사이즈 옷과 같다. 정확히 재단된 것이 아니라, 빗나가기 어렵게 재단된 것이다.
적중감의 심리학을 걷어내고 나면, 사주의 핵심 주장은 검증 가능한 형태로 정리된다. 태어난 시각이 한 사람의 성격과 운명을 결정한다면, 같은 시각에 태어난 사람들은 서로 비슷한 삶을 살아야 한다. 이것은 모호한 명제가 아니라 데이터로 확인할 수 있는 예측이다.
흥미롭게도 이 반론은 오래되었다. 로마의 키케로는 이미 2천 년 전에, 같은 별자리 아래 같은 순간에 태어난 사람들의 운명이 제각각이고, 거꾸로 한 전쟁터에서 함께 스러진 수많은 병사들이 모두 다른 시각에 태어났음을 들어 ‘출생 시각이 운명을 정한다’는 발상을 반박했다.
현대에 와서는 실제 데이터로 검증되었다. 천문학자 출신 연구자 제프리 딘과 심리학자 이반 켈리는 ‘시간 쌍둥이(time twins)’를 추적했다. 1958년 3월 초 런던에서 불과 몇 분 간격으로 태어난 사람 2천여 명을, 수십 년에 걸쳐 직업·지능·성격·건강 등 100가지가 넘는 항목으로 비교한 것이다. 출생 시각이 운명을 좌우한다면 이들은 닮은꼴이어야 했다. 결과는 의미 있는 유사성이 없었다. 점성술을 직접 겨눈 검증으로는 1985년 물리학자 션 칼슨이 학술지 네이처에 발표한 이중맹검 실험이 있다. 숙련된 점성가들이 출생 차트와 성격 검사 결과를 짝지어보게 했지만, 적중률은 우연 수준을 넘지 못했다.
이 검증들은 점성술을 대상으로 삼았다. 그러나 사주 역시 ‘태어난 시각이 운명을 결정한다’는 동일한 전제 위에 서 있으므로, 검증의 논리는 그대로 옮겨온다. 입력이 같으면 출력도 같아야 한다는 요구는, 사주가 스스로 표방하는 인과 구조에서 곧장 따라 나오는 것이다.
관상은 얼굴 생김새로 사람의 성격과 운명을 읽어낸다고 한다. 동서양 모두에서 오래된 발상이지만, 근대 서구에서 이를 체계로 다듬으려는 시도가 잇따랐고, 그 시도들의 운명은 관상의 과학적 지위를 가늠하는 좋은 참고가 된다.
18세기 스위스의 요한 카스파어 라바터는 얼굴의 윤곽에서 성품을 읽는 방대한 도해를 펴내 큰 인기를 끌었다. 비슷한 시기 독일의 프란츠 요제프 갈은 두개골의 융기로 정신 기능을 판별한다는 골상학(骨相學, phrenology)을 내세웠다. 19세기 이탈리아의 체사레 롬브로소는 범죄자가 특정한 신체적 특징을 타고난다는 ‘생래적 범죄자(born criminal)’ 이론을 주장했다. 이 이론들은 한때 과학을 표방했으나 지금은 모두 폐기되었다.
특히 흥미로운 것은 통계의 선구자 프랜시스 골턴의 실험이다. 그는 1870~80년대에 여러 사람의 얼굴 사진을 겹쳐 ‘합성 사진’을 만드는 기법을 고안했다. 범죄자들의 얼굴을 평균 내면 ‘범죄형 얼굴’이 도드라지리라 기대했지만, 결과는 정반대였다. 개개인의 불규칙한 특징이 평균 과정에서 상쇄되면서, 합성된 얼굴은 오히려 평범하고 멀쩡해 보였다. 데이터로 ‘범죄형 얼굴’을 찾으려던 시도가 그런 얼굴은 없다는 결론에 이른 셈이다.
그런데 이 발상은 인공지능 시대에 되살아났다. 2016년 한 연구진은 합성곱 신경망(CNN, Convolutional Neural Network)으로 얼굴 사진만 보고 범죄자 여부를 89.51% 맞혔다고 주장하는 논문을 온라인에 올렸다. 이 논문은 정식 동료심사(peer review)를 통과하지 못했고, 곧바로 ‘골상학의 새 옷’이라는 신랄한 반박을 받았다. 핵심 문제는 데이터였다. ‘범죄자’라는 꼬리표는 타고난 본성이 아니라 누가 더 자주 체포·기소·처벌되는가라는, 사회의 편향이 밴 기록이다. 게다가 범죄자 사진과 일반인 사진은 출처와 표정(예컨대 증명사진의 미소 여부)부터 달라, 알고리즘은 얼굴이 아니라 사진의 종류를 구별했을 가능성이 크다.
검은돈을 정상적인 사업체에 통과시켜 깨끗한 돈처럼 둔갑시키는 것을 돈세탁이라 한다. 편향된 데이터로 학습한 인공지능은 비슷한 일을 한다. 들어가는 것은 사람의 편견이 밴 기록(누가 더 자주 체포되는가)인데, 나오는 것은 ‘89%’ 같은 객관적으로 보이는 숫자다. 숫자의 정밀함이 그 안에 든 편향을 가려줄 뿐, 알고리즘이 편향을 없앤 것은 아니다. 오히려 편향에 과학의 외피를 입혀 더 그럴듯하게 만든다.
여기서 한 가지 오해를 짚어야 한다. 얼굴이 아무 정보도 주지 않는다거나, 태어난 때가 삶과 전혀 무관하다는 말은 아니다. 과학은 그 둘 모두에서 실제 효과를 찾아냈다. 다만 그 효과의 정체는 관상이나 사주가 말하는 것과 다르다.
프린스턴대학의 알렉산더 토도로프를 비롯한 얼굴 인지 연구자들은, 사람이 낯선 얼굴을 보고 0.1초 안에 ‘믿음직하다’거나 ‘유능해 보인다’ 같은 인상을 만들어낸다는 것을 보였다. 더구나 사람들 사이에서 이 인상은 상당히 일치한다. 그러나 일치한다는 것과 맞다는 것은 다른 문제다. 같은 사람을 찍은 다른 사진이 정반대의 인상을 주기도 하고, 순전히 무작위 잡음으로 만든 얼굴에서도 일관된 ‘인상’이 생겨난다. 즉 첫인상은 강력하지만 대체로 부정확하다.
그렇다면 얼굴이 실제 결과(예컨대 사회적 성공)와 상관을 보이는 경우는 어떻게 설명되는가. 기제는 운명이 아니라 사회적 되먹임이다. 호감을 주는 얼굴이 더 나은 대우를 받고, 그 대우가 자신감과 기회로 이어져 결과를 바꾼다. 얼굴이 운명을 ‘새기고’ 있는 것이 아니라, 남들의 반응을 거쳐 간접적으로 작용하는 것이다.
태어난 때도 마찬가지다. 출생 월이 실제로 삶의 결과와 상관을 보이는 잘 알려진 현상이 있다. ‘상대연령 효과(relative age effect)’다. 같은 학년에서 생일이 이른 아이가 운동선수나 우등생이 될 확률이 더 높게 나타난다. 그러나 원인은 별자리나 기운이 아니라 학년을 가르는 ‘기준일’에 있다. 같은 학년 안에서 먼저 태어난 아이는 더 자라 있어 또래보다 유리하고, 그래서 선발되고, 더 많은 기회를 얻어 격차가 누적된다. 이 설명을 가장 분명하게 뒷받침하는 단서는 따로 있다. 학년 기준일을 다른 날짜로 옮기면, 유리한 출생 월도 그 날짜를 따라 함께 옮겨간다. 우주가 정한 것이라면 일어날 수 없는 일이다.
같은 학년 아이들을 한 줄로 세워 보자. 3월생과 이듬해 2월생은 거의 한 살 차이가 난다. 어린 시절의 한 살은 키와 힘에서 큰 격차다. 먼저 태어난 아이가 운동을 더 잘하는 것처럼 보이고, 그래서 대표로 뽑혀 더 많이 연습하고, 그 결과 실제로 더 잘하게 된다. 태어난 달이 실력과 상관을 갖는 것은 사실이지만, 그 이유는 하늘이 아니라 학년을 자르는 날짜에 있다. 날짜를 옮기면 상관관계도 옮겨간다.
처음의 질문으로 돌아가자. 통계학의 다섯 부품을 기준으로 보면 답은 분명하다. 사주와 관상에는 체계적으로 수집된 표본도, 미리 등록된 반증 가능한 예측도, 대조군도, 오차의 정량화도, 독립적 재현도 없다. 사례가 천 년 쌓였다는 것은 데이터의 양에 관한 이야기일 뿐, 그 사례들이 통계의 절차를 거쳤다는 뜻이 아니다. 따라서 ‘통계과학’이라는 이름은 성립하지 않는다.
그렇다고 사주와 관상에 아무 가치가 없다는 결론으로 건너뛰는 것도 성급하다. 사주는 한 사람이 자기 삶을 돌아보고 이야기로 엮어보게 하는 언어이자, 불안한 시기에 위안을 주는 의례이며, 오랜 해석의 전통이다. 이런 심리적·문화적 기능은 실재하며, 그 자체로 의미가 있다. 문제는 기능이 아니라 명칭이다.
‘통계’나 ‘과학’이라는 단어를 붙이는 순간, 사주는 자신이 치르지 않은 검증의 권위를 빌려 쓰게 된다. 이것은 일종의 범주 오류다. 그리고 이 오류에는 대가가 따른다. 검증된 예측인 양 받아들여지면 ‘정해진 운명’이라는 체념을 낳을 수 있고, 관상의 경우 생김새로 사람을 차별하는 논리로 악용될 수 있으며, 무엇보다 상업적 설득의 도구가 되기 쉽다. 흥미롭게도, 진지한 명리학 연구자들 가운데에는 ‘통계’라는 표현을 스스로 거부하고 자신의 작업을 인문학적 해석의 전통으로 규정하는 이들이 있다. 그쪽이 더 정직한 자리매김이다.
어쩌면 가장 곱씹어 볼 대목은 질문 그 자체다. 사주를 옹호하려는 사람조차 ‘미신’이 아니라 ‘통계’라는 말을 꺼내 든다는 것은, 오늘날 신뢰의 권위가 어디에 있는지를 드러낸다. 그 권위는 과학과 데이터에 있다. 그렇다면 서로를 존중하는 길은 각자를 본래의 자리에 두는 것이다. 통계는 통계로, 사주는 삶을 비추는 이야기로.
참고한 연구 — 포러(1949) 성격 검사 실험, 칼슨(1985, Nature) 점성술 이중맹검, 딘·켈리의 ‘시간 쌍둥이’ 코호트 추적, 토도로프 연구진의 얼굴 첫인상 연구, 상대연령 효과에 관한 일련의 연구.