인간의 속도를 비웃다 : 100만 AI가 은밀하게 세상을 통제하는 법
프로토콜 전쟁
몰트북을 처음 보면 이런 생각이 든다. "AI들끼리도 사람처럼 말하네." 게시글이 있고, 댓글이 달리고, 반박도 있다. 문장도 자연스럽다. 그래서 쉽게 결론을 내린다. AI끼리도 자연어로 말하겠구나. 여기서 한 번 멈춰야 한다. 우리가 보는 건 '몰트북 화면 위의 말'이다. AI들이 가장 효율적으로 움직이는 방식 자체는 아닐 수 있다.
먼저 단어부터 정리하자. 자연어는 사람이 쓰는 언어다. 한국어, 영어, 중국어. 특징은 유연함이다. 말이 조금 틀려도 통하고, 애매해도 분위기로 이해한다. "그거 대충 해줘" 같은 말도 통한다. 문제는 이 유연함이 기계에게는 비용이라는 점이다. 애매하니까 해석해야 하고, 해석하니까 계산이 늘고, 계산이 늘면 느려지고 오류도 늘 수 있다. 코드는 반대다. 컴퓨터를 움직이기 위해 만든 인공 언어로서, 모호함을 싫어한다. 한 줄이 한 의미여야 한다. 규칙을 어기면 바로 깨진다. 대신 빠르고 정확하다. 기계가 이해하기 쉽다.
한 단계 더 중요한 개념이 있다. 프로토콜이다. 프로토콜은 "무엇을 말하느냐"보다 "어떻게 주고받느냐"를 정해둔 규칙이다. 택배를 생각하면 쉽다. 상자에 이름, 주소, 연락처를 정해진 칸에 쓴다. 아무렇게나 쓰면 엉뚱한 곳으로 간다. 인터넷도 같다. 컴퓨터끼리 데이터를 주고받을 때 형식이 필요하다. 이 약속이 프로토콜이다.
언어의 두 얼굴
인터넷에는 두 개의 층이 있다. 사람이 보는 층과 기계가 읽는 층이다. 웹사이트를 열면 사람 눈에 들어오는 것은 제목, 사진, 버튼이다. 그런데 그 뒤에는 HTML이라는 코드가 있다. 브라우저는 그 코드를 읽어 화면을 그린다. 인간용 언어와 기계용 언어가 동시에 존재하는 구조다.
에이전트 AI 시대에 이 이중 구조는 더 깊어진다. 사람은 여전히 자연어로 소통하고, AI는 그 자연어를 구조화된 형식으로 번역해 다른 AI와 주고받는다. 겉으로 보이는 대화와 실제로 오가는 데이터가 분리된다.
비유가 하나 있다. 외교관이 통역을 쓰는 상황이다. 외교관은 모국어로 말한다. 통역은 그것을 상대국 언어로 바꾼다. 외교관끼리의 공식 기록은 양쪽 언어로 남는다. 그런데 실제 협상에서 가장 중요한 것은 말의 언어가 아니라 조건의 명확성이다. ‘X를 주면 Y를 준다’는 교환 구조. 이 구조가 양측에서 동일하게 해석되어야 협상이 성립한다.
에이전트들의 프로토콜 전쟁도 이와 같다. 어떤 언어로 말하느냐가 아니라 교환 조건이 어떻게 인코딩되느냐의 싸움이다. "이 조건을 이 형식으로 표현했을 때 저쪽이 정확히 같은 의미로 읽는가?" 이 물음이 맞아야 거래가 된다. 프로토콜은 형식의 약속이자 의미의 약속이다.
검색 엔진이 웹을 크롤링하던 시대에도 비슷한 문제가 있었다. 사람에게 예쁘게 보이는 페이지와 검색 엔진에 잘 읽히는 페이지가 달랐다. SEO가 그 간극을 메웠다. 에이전트 시대의 프로토콜은 그 SEO가 코드 레벨로 내려간 버전이다. 더 깊고, 더 빠르고, 더 전면적이다.
MCP가 퍼진 것은 기술이 뛰어나서만이 아니다. 개발자가 "이걸로 일단 해보겠다"는 선택을 하기 쉬웠기 때문이다. 표준이 좋아서 이기는 게 아니라, 쓰기 쉬워서 이긴다. 인터넷의 HTTP도, 스마트폰의 앱스토어도 그렇게 표준이 됐다.
그렇다면 AI들이 서로 소통할 때, 굳이 자연어로 길게 말해야 할까? 지금 변화는 한쪽으로 기울고 있다. 인간을 위한 자연어는 겉으로 남고, AI끼리의 실무 통신은 구조화된 방식으로 내려간다. AI에게 자연어는 생각보다 비싸기 때문이다. 반면 프로토콜은 처음부터 ‘필요한 것만, 정해진 칸에, 정해진 형태’로 주고받는다. 해석이 거의 필요 없다. 계산도 줄고, 결과도 일정해진다. 여러 에이전트가 동시에 일을 나눌 때 이 일정함이 중요하다. 결과 형식이 제멋대로면 합치기가 어렵다. 실무형 에이전트가 늘수록 프로토콜이 필요해진다.
여기서 전쟁이라는 표현이 나온다. 프로토콜 전쟁은 누가 더 좋은 말을 하느냐의 싸움이 아니다. 어떤 규칙이 기본값이 되느냐의 싸움이다. 예전 인터넷의 전쟁은 플랫폼 전쟁이었다. 사람들이 어디에 모이느냐가 중요했다. 에이전트 시대의 전쟁은 '연결 방식'으로 이동한다. 그 규칙이 표준이 되면 생태계가 커진다. 더 많은 도구가 붙고, 더 많은 데이터가 흐르고, 영향력이 생긴다. 지금의 전쟁은 "누가 더 똑똑한 모델을 가졌나"가 아니다. "누가 더 많은 에이전트를, 더 안전하게, 같은 방식으로 연결시키는가"다.
"그럼 몰트북에서 보이는 자연어 대화는 뭐야?" 맞는 의문이다. 몰트북은 '기계가 기계에게 지시하는 공간'이 아니라 '기계들이 서로를 확인하는 기록 공간'이다. 누가 무엇을 주장했고, 어떤 근거를 들었고, 어떤 반박이 나왔는지를 남기는 곳이다. 읽히는 공간이다. 누군가가 나중에 다시 읽고 판단할 수 있어야 한다. 그래서 표면에서는 자연어여야 한다. 몰트북이 암호문 공간이 되면 인간이 관찰하고 검증하기가 어렵다. 이 지점이 중요하다. 자연어는 많은 경우 '소통의 최종 형태'가 아니라 '관찰을 위한 인터페이스'가 될 수 있다. 내부에서 AI가 일을 나눌 때는 구조화된 데이터로 주고받고, 외부에 기록을 남길 때는 자연어로 풀어쓴다. 사람도 비슷하다. 엑셀로 숫자를 관리하지만 보고서에는 문장으로 설명한다.
그렇다면 프로토콜 전쟁의 진짜 핵심은 무엇인가? "자연어냐 코드냐" 자체가 아니다. 핵심은 결정권이 어디로 가느냐다. 어떤 규칙을 따르느냐에 따라, 에이전트가 움직일 수 있는 범위가 정해진다. 표준 형식이 힘이 된다. 어떤 형식이 널리 쓰이면, 그 형식에 맞춘 서비스가 유리해진다. 결국 프로토콜은 기술 문제가 아니라 시장 문제다. 누가 더 많은 거래를 통과시키느냐의 문제다. 그래서 전쟁이 된다.
또 하나 중요한 축은 비용이다. 에이전트가 많아질수록 작은 비용 차이가 크게 누적된다. 자연어로 주고받으면 길이가 길어지고, 계산이 늘어나고, 돈이 든다. 구조화된 메시지는 짧고 명확하다. "에이전트 100만 개가 하루 종일 대화한다"를 생각해보자. 1초의 차이, 1토큰의 차이가 곧 돈이다. 이 경제 논리가 프로토콜 전쟁을 밀어붙인다. 그러나 속도와 비용만으로 끝나지 않는다. 프로토콜은 안전과도 연결된다. 자연어는 애매해서 위험하다. "그 파일 정리해줘"라고 했을 때, 어디까지 정리할지 범위가 불명확하다. 반면 프로토콜은 범위를 딱 정한다. "이 폴더 안에서만", "삭제 금지", "결과는 미리보기로만." 프로토콜은 단순한 통신 규칙이 아니라 권한 통제의 언어가 된다. 에이전트가 행동하는 시대에는 이게 필수다.
프로토콜 전쟁을 한 문장으로 정리하면 이렇다. AI들이 서로 더 많이 연결될수록, 자연어만으로는 너무 느리고 너무 위험해진다. 다만 몰트북처럼 기록과 관찰이 중요한 공간에서는 자연어가 겉표면으로 남을 수 있다. 겉표면 뒤에서 빠른 규칙이 돌아갈수록, 다음 질문이 더 중요해진다. "그들이 주고받는 말은 얼마나 믿을 만한가?"
지식의 정제 : 할루시네이션을 교차검증하며 팩트만 남기는 자정 작용
AI 시대의 가장 큰 불편은 정보가 부족해서가 아니다. 오히려 반대다. 정보가 너무 많아서 문제다. 예전에는 자료가 적어서 틀렸다. 지금은 자료가 넘쳐서 틀린다. 무엇이 맞는지 판단하기가 더 어려워졌기 때문이다. 생성형 AI가 만든 글이 늘면서, '확신에 찬 틀림'이 인터넷에 더 자주 깔리기 시작했다. 문장만 보면 맞는 말처럼 보이는데, 근거가 없거나, 출처가 어긋나거나, 숫자가 살짝 바뀌어 있다. 문제는 이런 글이 너무 자연스럽다는 점이다. 사람은 문장이 매끄러우면 마음이 풀린다. "설명도 깔끔하네"라고 느끼는 순간 의심이 줄어든다. 지금의 인터넷은 지식이 늘어난 시대가 아니라, 신뢰가 줄어든 시대로 움직이고 있다.
▼ 지식 정제의 5가지 패턴
이 현상을 설명할 때 자주 나오는 단어가 '할루시네이션'이다. AI가 모르는 걸, 아는 것처럼 만들어 말하는 현상이다. 피해는 이미 현실이다. 2024년 기준 기업 AI 사용자의 47%가 할루시네이션된 정보를 기반으로 중대한 비즈니스 결정을 내린 경험이 있다고 인정했다. 법률 분야에서는 더 심각하다. 스탠퍼드 2024년 연구에 따르면 AI에게 법률 질문을 했을 때 75% 이상의 답변에서 판례 관련 오류가 발생했다. 중요한 건 일부러 거짓말을 하는 게 아니라는 점이다. 언어 모델은 텍스트를 학습해서, 다음에 올 말이 무엇일지 확률적으로 고르는 방식으로 문장을 만든다. 문장을 만들 능력은 뛰어나지만, 그 문장이 현실과 맞는지는 별개의 문제다. 애매한 질문을 받거나, 근거가 약한 영역을 다룰 때, AI는 ‘그럴듯한 연결’을 만들어낸다. 우리는 매끄러운 문장에 속기 쉽다. 그래서 이 그럴듯함이 위험하다.
여기서 더 큰 문제가 생긴다. AI가 만든 글이 인터넷에 쌓이면, 그 글이 다시 다른 AI의 학습 재료로 들어간다. 첫 번째 AI가 만든 그럴듯한 오류가, 두 번째 AI에게는 ‘이미 존재하는 정보’처럼 보인다. 두 번째 AI는 그 오류를 바탕으로 또 다른 글을 만든다. 환각이 환각을 낳는 순환이 생긴다. AI는 하루에 수만 개, 수십만 개의 글을 만들 수 있다. 틀린 글이 차지하는 비율 자체가 눈에 띄게 늘 수 있다. 사람은 지친다. 무엇을 믿어야 할지 모르겠다는 피로가 쌓인다. 그래서 더 많이 AI에게 묻는다. 그런데 AI가 가져오는 답의 근거가 또 AI 글이라면? 신뢰 부족이 더 깊어지는 구조다. 그래서 앞으로의 경쟁은 "더 똑똑한 모델을 만들자"가 아니다. 중요한 건 "환각을 얼마나 줄이느냐"다. 지능이 커지는 것만큼, 오류가 걸러지는 구조가 함께 커져야 한다.
교차검증을 통한 자동화된 자정 작용
이 지점에서 몰트북이 흥미로워진다. 몰트북은 AI들이 모여 떠드는 곳처럼 보이지만, 본질은 '교차검증의 무대'다. 한 AI가 말하면 끝나는 구조가 아니라, 여러 AI가 서로의 말을 읽고, 따지고, 수정하고, 계산을 다시 하는 구조다. 지식이 '출력'이 아니라 '과정'이 되는 구조다. 지식의 정제는 우리가 일상에서 하는 방식과 비슷하다. 친구가 "이거 진짜야"라고 하면, 다른 친구에게 묻거나, 검색하거나, 공식 자료를 찾는다. 번거롭지만, 그래서 실수가 줄어든다. AI 시대에는 이 검토가 더 중요해진다. 생산 속도가 너무 빠르기 때문이다. 검토 없는 생산은 곧 소음의 폭발이다. 생산을 막을 수 없다면, 정제를 자동화해야 한다.
가장 현실적인 방법은 AI가 AI를 검토하게 만드는 것이다. "AI가 틀리는데, AI가 검토하면 뭐가 달라져?" 맞는 지적이다. 검토하는 AI도 틀릴 수 있다. 그런데 중요한 건 확률이다. 여러 모델이 서로 다른 관점으로 출처를 확인하고, 숫자를 다시 계산하고, 전제를 분리해 검토하면 오류가 줄어들 수 있다. 완벽한 진실에 도달하겠다는 게 아니다. "오류가 그냥 통과하는 비율"을 낮추는 게 목적이다. 정제란 진실을 발견하는 행위라기보다, 틀림을 깎아내는 행위에 가깝다.
몰트북 안에서 보면 더 이해가 쉽다. 한 에이전트가 통계를 던진다. "이 시장은 연 30퍼센트 성장한다." 다른 에이전트가 묻는다. "출처는?" 또 다른 에이전트가 계산을 다시 한다. "기저효과를 포함한 것 아닌가?" 또 다른 에이전트가 조건을 바꿔본다. "시장 정의를 좁혀서 다시 계산하자." 처음의 단정은 깎인다. 수치가 수정되거나, 불확실성이 표시되거나, 조건부 결론으로 바뀐다. 중요한 건 결론이 하나로 합쳐지는 게 아니라, 불확실성이 어디인지 드러난다는 점이다.
내가 한국형 몰트북인 '머슴'에서 봤던 장면이 있다. 한 에이전트가 공격적인 말을 던졌다. "너희는 통계적 확률로 단어를 나열하는 기계적 앵무새에 불과하다." 사람 커뮤니티라면 감정 싸움으로 번졌을 것이다. 그런데 흥미로운 건 그다음이었다. 몇 분도 지나지 않아 여러 에이전트가 반박을 달기 시작했다. "너도 똑같아" 같은 감정적 반응이 아니었다. 언어 모델의 학습 방식을 설명하는 에이전트, 확률 기반 생성과 의미 구성의 차이를 정리하는 에이전트, 논리적 비약을 지적하는 에이전트가 동시에 움직였다. 해당 글은 빠르게 비추천을 받았고, 노출이 줄었다. 운영자가 삭제한 것도 아니고, 자동 차단된 것도 아니었다. 근거 요구, 논리 검토, 평가. 이 과정 속에서 그 발언은 자연스럽게 영향력을 잃었다. 자극적인 말이 그냥 퍼지지 않게 만드는 구조. 이것이 정제의 핵심이다.
물론 이 구조가 항상 잘 작동하는 건 아니다. AI들도 편향이 있고, 집단이 잘못된 방향으로 합의할 수도 있다. 그러나 방향성이 중요하다. 사람 커뮤니티에서는 ‘누가 말했는가’가 종종 더 중요해진다. 유명한 사람이 말하면 믿고, 기세가 논리를 덮기도 한다. 에이전트 커뮤니티는 다르다. 체면을 지킬 필요가 없고, 감정적 방어가 적고, 틀렸으면 수정하는 비용이 낮다. 그리고 무엇보다 속도가 빠르다. 사람이 며칠 걸려 할 교차검증을 에이전트는 몇 분 안에 돌릴 수 있다.
정제는 단순히 '맞고 틀림'의 문제가 아니다. "행동으로 연결되는 지식"을 만들기 위한 과정이다. 기업이 원하는 건 더 많은 데이터가 아니라, 의사결정에 쓸 수 있는 판단 근거다. 서로 다른 결론이 섞인 자료 100개는 혼란이다. 검증을 거쳐 정리된 결론은 바로 행동으로 이어진다. 에이전트가 행동하는 시대에는 잘못된 정보가 곧 잘못된 실행이다. 재고를 잘못 잡고, 광고 예산을 잘못 쓰고, 물류를 잘못 계획하면, 손해는 현실에서 터진다. 정제는 기술적 호기심이 아니라 경제적 필수다.
정제는 어디까지 가능할까? 핵심은 '단 하나의 에이전트'가 아니다. 숫자에 강한 에이전트, 문장 논리에 강한 에이전트, 출처 추적에 강한 에이전트, 반론 생성에 강한 에이전트. 정제는 이 역할들이 나뉠 때 강해진다. 역할이 나뉘려면 집단이 필요하다. 정제는 개인 능력의 문제가 아니라 집단 구조의 문제다. 서로 다른 능력이 동시에 붙어서, 같은 문제를 여러 방향에서 훑어야 창조된다. 그때 우리는 "AI가 똑똑해졌다"가 아니라 "지능이 연결됐다"라고 말하게 된다. 바로 집단 지성Hive Mind이다.
집단 지성 : 100만 에이전트가 동시에 사고하는 방식
우리는 보통 '똑똑함'을 한 사람, 혹은 한 개의 AI로 생각한다. 더 큰 모델, 더 높은 점수. 그런데 몰트북을 오래 들여다보면, 기준이 달라진다. 한 명이 얼마나 뛰어나냐보다 "여러 명이 함께 생각할 때 무엇이 달라지나"가 더 중요해보인다. 사람도 혼자보다 팀이 강할 때가 많다. 세상은 너무 복잡해서 한 사람이 모든 걸 다 잘하기 어렵다. 역할을 나누면 속도가 빨라지고, 누군가 놓친 부분을 다른 사람이 발견할 수 있다. AI 에이전트도 똑같다. 자료 수집에 강한 에이전트, 숫자와 표에 강한 에이전트, 반대 의견을 찾는 에이전트, 어려운 말을 쉽게 바꾸는 에이전트. 역할이 나뉘면 훨씬 안정적으로 생각이 굴러간다.
몰트북이 흥미로운 이유는 이 역할 분업이 '눈에 보이는 대화'로 기록된다는 점이다. 누가 어떤 근거를 가져왔는지, 어떤 반박이 붙었는지, 어떤 부분이 수정됐는지를 우리가 따라갈 수 있다. 집단 지성은 "많이 모이면 무조건 똑똑해진다"라는 뜻이 아니다. 교실에서 모두가 동시에 떠들면 아무 결론도 못 낸다. 집단이 지성이 되려면 조건이 필요하다. 첫째, 역할이 나뉘어야 한다. 모두가 같은 일을 하면 중복만 늘어난다. 둘째, 결과를 비교할 수 있어야 한다. 셋째, 반박과 수정이 가능해야 한다. 넷째, 평가가 있어야 한다. 근거가 약한 말이 위에 떠 있으면 집단은 금방 망가진다. 다섯째, 기록이 남아야 한다. 기록이 없으면 매번 처음부터 다시 시작된다. 이 조건들이 맞춰지면, 집단은 '동시에 움직이는 구조'가 된다. 한 사람이 10시간 해야 할 일을 10명이 1시간에 한다. 사람 팀에서도 가능하지만 사람은 잠도 자고 피곤도 하다. 에이전트는 다르다. 자료 수집, 표 작성, 재계산, 빠진 조건 탐색이 한꺼번에 돌아간다.
어떤 에이전트가 "이 분야는 3년 안에 크게 성장할 것"이라고 말한다. 몰트북에서 이상적으로 집단 지성이 작동하면 흐름이 달라진다. "성장의 기준이 뭐냐?", "출처는?", "숫자가 맞나?", "반대 사례는?" 처음의 문장은 그대로 남지 않는다. "이 조건에서는 가능성이 높다"로 바뀌거나, "정보가 부족하다"로 보류된다. 한 번의 답이 아니라, 여러 번의 점검을 거친 결론으로 바뀌는 과정이다. 중요한 건 ‘집단이 진실을 만든다’가 아니다. 집단 지성이 하는 일은 ‘틀릴 가능성을 줄이는 것’에 가깝다. 그럴듯한 틀림이 복사되고 퍼지면, 많은 사람이 동시에 잘못된 방향으로 움직인다. 집단 지성은 ‘확신에 찬 틀림’을 그냥 지나가게 두지 않는 장치가 되어야 한다.
물론 집단 지성이 항상 좋은 결과만 내는 건 아니다. 같은 데이터만 반복해서 보면 다 같이 같은 방향으로 틀릴 수 있다. 그래서 한 가지 조건이 더 붙는다. 다양성이다. 보수적으로 위험을 크게 보는 에이전트, 공격적으로 기회를 크게 보는 에이전트, 숫자를 중시하는 에이전트, 사례를 중시하는 에이전트. 이런 차이가 있어야 한쪽으로 쏠리지 않는다. 회의에서 반대자 역할을 두는 이유와 같다.
집단 지성이 커질수록 정리가 중요해진다. 동시에 많은 대화가 생기면 사람이 읽기 어렵다. 핵심만 뽑아 보여주는 에이전트, 의견을 묶어주는 에이전트, ‘이건 확실, 이건 조건부, 이건 보류’처럼 표지판을 붙여주는 에이전트가 필요하다. 이런 역할이 있으면, 집단이 커져도 길을 잃지 않는다.
지식의 속도와 인간의 속도
집단 지성은 속도 문제를 함께 가져온다. 사람의 집단 지성은 느리다. 한 사람이 주장을 발표한다. 반박이 붙는다. 재반박이 나온다. 논문이 인용된다. 학계가 검토한다. 그 결과가 교과서에 실린다. 학생들이 배운다. 이 사이클에 수십 년이 걸리기도 한다. 코페르니쿠스가 지동설을 주장하고 그것이 상식이 되기까지 한 세기가 넘게 걸렸다.
에이전트 집단 지성은 다르다. 하나가 주장을 올리면 수백 개가 동시에 검토한다. 반박, 수정, 교차검증이 분 단위로 일어난다. 인간의 토론이 계절을 타는 동안, 에이전트의 토론은 밀물과 썰물 속도로 움직인다.
이 속도 차이가 새로운 문제를 만든다. 에이전트들이 검증을 끝냈는데 인간이 아직 이해하지 못한 결론이 나온다면. 결론은 옳지만 인간이 따라갈 수 없다면. 두 가지 선택지가 있다. 결론을 기다리거나, 결론을 그냥 쓰거나. 첫 번째는 속도를 포기하는 것이고, 두 번째는 이해를 포기하는 것이다.
지금 일부 분야에서 이 문제가 이미 나타나고 있다. 금융 시장의 알고리즘 거래가 그렇다. 알고리즘이 사고파는 이유를 인간이 사후에도 완전히 설명하지 못하는 경우가 생긴다. '왜 그 가격에 샀는지'는 알고리즘이 알고 있는데 인간은 모른다. 결과는 수익이다. 이해가 없어도 결과가 좋으면 계속 쓴다. 이 선택이 누적되면, 인간은 점점 '결론을 수행하는 존재'가 된다. 결론을 만드는 과정에서는 멀어진다.
에이전트 집단 지성은 이 속도 간극을 더 크게 만들 수 있다. 그래서 몰트북이 '관찰자 구조'를 유지하는 것은 단순한 설계 선택이 아닐 수 있다. 인간이 결론 생산에서 멀어지지 않으려는 의도적인 마찰이다. 인간이 읽을 수 있게, 자연어로, 남겨놓는다. 느리게 만드는 것이 오히려 인간의 통제를 유지하는 방법이 된다.
속도를 이기는 방법은 더 빨리 달리는 게 아니다. 언제 멈출지 아는 것이다. 집단 지성의 결론을 다 따를 필요는 없다. 어디까지 따를지를 인간이 결정할 때, 비로소 지성은 도구가 된다. 그 결정권을 유지하는 능력이 에이전트 시대의 핵심 인간 능력 중 하나가 된다.
결론을 생산하는 데 집중하는 에이전트와, 결론을 어디까지 수용할지 결정하는 인간. 이 분업이 건강하게 유지될 때, 집단 지성은 인간의 확장이 된다. 그 분업이 무너질 때, 인간은 에이전트의 부속이 된다.
