챗GPT로 시작된 변화와 혁명 : 기계는 어떻게 생각하게 되었나?

2026년 4월 5일조회 461

이 글은 《AI 국부론》에서 발췌했습니다.

AI 국부론

ISBN 9791194383895지은이 이승현₩28,000

필요한 건 오직 어텐션뿐

대부분의 사람들은 현재 진행중인 AI 혁명을 2022년 11월 챗GPT의 출시로 기억할지 모르지만, 또 역사에 그렇게 기록될지도 모르지만, 사실 기술적 빅뱅은 그보다 5년 앞선 2017년에 일어났다. 당시 구글 브레인의 연구원 8명은 ‘Attention Is All You Need(필요한 건 오직 어텐션뿐)’라는 다소 도발적인 제목의 논문을 발표했다. 이 논문은 기존의 인공지능 번역 모델들이 가지고 있던 고질적인 병목 현상을 해결하기 위해 ‘트랜스포머Transformer’라는 새로운 아키텍처를 제안했다.

이전까지 AI, 특히 사람의 언어를 컴퓨터가 이해할 수 있는 언어로 번역하는 자연어 처리(NLP) 분야의 주류는 순환 신경망RNN 방식이었다. 순환 신경망은 문장을 앞에서부터 순서대로 읽어 나갔다. 나는 밥을 먹었다’를 이해하기 위해 ‘나는’을 읽고, 그 기억을 가지고 ‘밥을’를 읽는 식이다. 이 방식은 인간의 독서법과 유사해 보였지만 치명적인 단점이 있었다. 문장이 길어지면 앞부분의 내용을 까먹는다는 것, 그리고 순서대로 처리해야 하기에 계산 속도가 느리다는 것이었다.

트랜스포머는 이 순차 처리 방식을 과감히 버렸다. 대신 문장 전체를 한 번에 입력받아 모든 단어 사이의 관계를 동시에 계산하는 ‘병렬 처리’ 방식을 택했다. 그리고 문맥상 중요한 단어에 가중치를 더 두는 ‘어텐션 메커니즘’을 도입했다. 예를 들어 ‘그가 공을 찼다. 그것은 멀리 날아갔다’라는 문장에서 '그것'이 '공'을 가리킨다는 것을, 문장 구조 전체를 조망하여 즉시 파악하는 식이다. 이 아키텍처는 AI가 데이터를 학습하는 속도와 양을 기하급수적으로 늘릴 수 있는 고속도로를 뚫어주었다. 아이러니하게도 구글이 만든 이 설계도는 훗날 구글을 위협하는 경쟁자, OpenAI의 GPTGenerative Pre-trained Transformer 시리즈의 심장이 되었다.

엔진의 진화 : GPU와 병렬 연산의 결합

트랜스포머라는 설계도가 완성되었지만, 이를 현실화하려면 막대한 계산 능력이 필요했다. 수천억 개의 매개변수Parameter를 가진 모델을 학습시키려면 단순한 CPU(중앙처리장치)로는 수백 년이 걸릴 일이었다. 이때 구원투수로 등장한 것이 엔비디아의 GPU(그래픽처리장치)였다. 원래 GPU는 3D 게임 화면의 수백만 픽셀을 동시에 그려내기 위해 만들어진 장비였다. 픽셀 하나하나의 색상을 동시에 계산해야 하는 그래픽 처리의 특성은, 트랜스포머 아키텍처가 요구하는 대규모 행렬 연산과 놀랍도록 닮아 있었다. 비유해보자면, 일렬로 빠르게 문제를 푸는 천재 수학자(CPU)보다, 단순한 사칙연산을 동시에 수행할 수 있는 수만 명의 초등학생(GPU)이 AI 학습에는 훨씬 더 효율적이었던 것이다.

트랜스포머라는 ‘소프트웨어 혁명’과 GPU라는 ‘하드웨어 혁명’이 결합하자, 인류는 드디어 사전 학습이라는 거대한 실험을 감행할 수 있게 되었다. 인터넷에 존재하는 거의 모든 텍스트 데이터를 긁어모아 AI에게 쏟아붓기 시작한 것이다. 이것이 바로 LLMLarge Language Model, 거대언어모델의 탄생 배경이다.

여기서 좀더 깊게 들어가보자. 이 거대한 기계의 지능은 도대체 어떻게 작동하는 것일까?

기계는 어떻게 생각하는가 : 확률적 앵무새인가, 창발적 지성인가?

여기서 좀더 깊게 들어가보자. 이 거대한 기계의 지능은 도대체 어떻게 작동하는 것일까? 많은 사람이 AI가 영화 ‘터미네이터’의 스카이넷처럼 자아를 가지고 생각한다고 오해하지만, LLM의 본질은 다음에 올 단어 맞히기 게임에 있다. 원리는 허무할 정도로 단순하다. AI에게 ‘대한민국의 수도는’ 이라는 문장이 주어지면, AI는 자신이 학습한 방대한 데이터 우주 속에서 그 뒤에 올 확률이 가장 높은 단어를 찾는다. ‘서울’일 확률 99%, ‘부산’일 확률 0.1%... 이런 식으로 확률 분포를 계산하여 ‘서울’을 뱉어낸다. 그리고 ‘대한민국의 수도는 서울’이라는 문장을 다시 입력으로 받아, 그다음 올 단어를 예측한다. 이 과정을 초고속으로 반복하며 문장을 완성해 나가는 것이다.

초기 비평가들은 이를 두고 AI를 확률적 앵무새Stochastic Parrots라고 깎아내렸다. 의미도 모른 채 통계적 확률에 따라 그럴듯한 말을 흉내 낼 뿐이라는 것이다. 하지만 모델의 크기(파라미터 수)와 학습 데이터의 양이 일정 임계점을 넘어서자 기이한 현상이 발생했다. 개발자들이 가르쳐주지 않은 추론 능력, 코딩 능력, 번역 능력이 자연적으로 생겨난 것이다. 복잡계 이론에서 말하는 ‘창발Emergence’ 현상이었다. 단순히 단어를 이어 붙이는 확률 기계가 어느 순간 문맥을 이해하고 논리를 구사하기 시작했다. 양적 축적이 질적 변화를 만들어낸 순간이었다.

이러한 창발이 단순한 통계적 우연이 아니라는 주장도 힘을 얻고 있다. 오픈AI의 전 수석 과학자 일리야 수츠케버는 “다음에 올 단어를 완벽하게 예측하기 위해서는, 그 단어를 만들어낸 기저의 현실 세계를 이해해야 한다”고 말한바 있다. 추리 소설의 결말을 맞추기 위해 등장인물의 심리와 사건의 인과관계를 파악해야 하는 것처럼, AI도 텍스트 패턴을 학습하는 과정에서 그 뒤에 숨겨진 세계의 법칙과 논리 구조를 스스로 깨우쳤다는 것이다. 즉, AI는 텍스트를 단순히 암기한 것이 아니라, 방대한 세상의 지식을 압축하여 자신만의 거대한 내부 표상을 형성했기에, 배우지 않은 문제도 추론하여 풀어낼 수 있는 말이다.

물론 이러한 확률적 작동 방식은 ‘환각’이라는 치명적인 부작용을 동반한다. 팩트가 아닌 확률에 의존해 답을 생성하다 보니, 때로는 전혀 없는 사실을 진실인 양 뻔뻔하게 말하기도 한다. 하지만 역설적이게도 이 불완전성이야말로 AI 창의성의 원천이기도 하다. 만약 AI가 데이터베이스처럼 100% 정확한 팩트만 인출한다면, 결코 시를 쓰거나 새로운 코드를 창조할 수 없을 것이다. 확률의 바다를 항해하며 기존에 없던 낯선 조합을 시도하는 과정에서 ‘거짓말’과 ‘창의성’은 동전의 양면처럼 함께 탄생한다. 따라서 우리는 지금의 AI를 단순한 앵무새가 아니라, 오류를 범할 수 있지만 무한한 가능성을 품은 생성형 지성으로 봐야하지 않을까 생각한다.

아이폰 모먼트의 재림 : 챗GPT 3.5의 등장

2022년 11월 30일, OpenAI는 별다른 홍보도 없이 챗GPT(GPT-3.5)를 웹사이트에 공개했다. 그리고 인류의 기술사는 이 날짜를 기점으로 'AI 이전'과 'AI 이후'로 나뉘게 되었다. 이전에도 GPT-3와 같은 고성능 모델은 존재했다. 하지만 그것은 API 형태나 복잡한 코드를 통해서만 접근할 수 있어 개발자들의 전유물이었다. 챗GPT의 혁명성은 성능이 아니라 바로 인터페이스에 있었다. 누구나 사용하는 ‘채팅창’이라는 익숙한 틀에 초거대 AI를 넣어 놓자, 일반 대중이 AI와 직접 대화할 수 있는 통로가 열린 것이다,

반응은 폭발적이라는 표현으로는 부족했다. 출시 5일 만에 사용자 100만 명, 2달 만에 1억 명을 돌파했다. 틱톡이 9개월, 인스타그램이 2년 반 걸린 기록이었다. 사람들은 처음으로 기계가 자신의 말을 알아듣는다고 느꼈다. 개발자들은 코드를 짜달라고 했고, 작가들은 시를 써달라고 했으며, 학생들은 과제를 부탁했다. 영화 〈그녀(HER)〉가 현실화되었다며, 챗GPT와 사랑에 빠지는 사람들도 생겼다. 챗GPT는 때로는 뻔뻔하게 거짓말을 했지만, 대부분의 경우 놀라울 정도로 유창하고 논리적인 답변을 내놓았다. 실리콘밸리는 흥분에 휩싸였고, 전 세계 기업들은 “우리의 AI 전략은 무엇인가?”라는 질문을 던지기 시작했다. 바야흐로 ‘생성형 AIGenerative AI’의 시대가 막을 올린 것이다.

AI 진화 3단계

이 순간을 굳이 ‘아이폰 모먼트’라고 설명한 이유는 단순히 사용자 수의 폭발적 증가 때문만이 아니다. 2007년 스티브 잡스가 아이폰을 꺼내 들며 복잡한 모바일 인터넷을 인류의 손바닥 위에 올려놓았던 것처럼, 챗GPT는 연구소 슈퍼컴퓨터 속에 갇혀 있던 고도의 지능을 대중의 손끝에 쥐여주었기 때문이다. 과거 소수 전문가의 전유물이었던 AI 기술이 프롬프트Prompt라는 자연어 명령어를 통해 누구나 접근 가능한 ‘범용 도구’로 전환된 순간이었다. 이는 우리가 정보를 얻는 방식이 검색 중심에서 대화)와 생성 중심으로 영구히 재편됨을 알리는 신호탄이었으며, 누구나 자신만의 유능한 개인 비서와 브레인을 곁에 두게 되는 ‘지능의 민주화’ 혁명이 비로소 시작되었음을 의미한다고 볼 수 있다.

구글의 코드레드와 바드의 시연 실수

OpenAI가 쏘아 올린 작은 공은 실리콘밸리의 절대 강자 구글을 흔들어놨다. 챗GPT 출시 직후, 구글의 경영진은 사내에 코드 레드를 발령했다. 창사 이래 최대의 위기 상황임을 선언한 것이었다. 사실 트랜스포머 아키텍처를 발명하고 가장 방대한 데이터를 보유한 AI의 종가는 구글이었다. 하지만 구글은 검색 광고라는 확실한 캐시카우를 보호해야 한다는 혁신가의 딜레마에 빠져 있었다. AI 챗봇이 검색을 대체하면 광고 수익이 줄어들 것을 우려해 기술 공개를 주저했던 것이다.

다급해진 구글은 2023년 2월, 대항마인 바드Bard를 급히 공개했다. 그러나 서두른 탓일까. 시연 영상에서 바드는 “제임스 웹 우주망원경이 태양계 밖 행성을 최초로 찍었다”는 오답을 내놓았다(실제로는 2004년에 유럽남방천문대의 초거대 망원경이 먼저 촬영했다). 천문학자들의 지적이 빗발쳤고, 실망감은 시장을 뒤덮었다. 이 단 하나의 실수로 구글의 모회사 알파벳의 시가총액은 이틀 만에 1,000억 달러가 증발했다. AI 전쟁이 기술력을 넘어 대중의 신뢰와 기대 심리에 얼마나 민감하게 반응하는지를 보여준 상징적 사건이었다. 절대 강자는 없으며, AI 시장은 춘추전국시대로 접어들었음을 알리는 신호탄이었다.

특이점의 서막 : GPT-4.0의 등장과 ‘스파크’ 논쟁

구글이 비틀거리는 사이, 2023년 3월 14일 OpenAI는 또 한 번의 충격을 던졌다. GPT-4의 출시였다. 만약 3.5 버전이 ‘말 잘하는 대학생’ 정도였다면, GPT-4는 ‘노련한 전문가’였다. 가장 놀라운 것은 추론 능력이었다. 미국 변호사 시험에서 하위 10% 성적을 냈던 GPT-3.5와 달리, GPT-4는 상위 10%의 성적으로 합격했다. 생물학 올림피아드, SAT 등 인간의 지성을 측정하는 거의 모든 시험에서 고득점을 휩쓸었다. 단순히 지식을 암기한 것이 아니라, 복잡한 문제의 논리 구조를 파악하고 해결책을 도출해 낸 것이다. 마이크로소프트의 연구진은 150페이지 분량의 논문을 통해 GPT-4에서 ‘범용 인공지능의 불꽃’을 보았다고 언급했다.

GPT-4는 텍스트뿐만 아니라 이미지를 보고 이해하는 능력도 갖추기 시작했다. 냉장고 속 재료 사진을 보여주면 요리 레시피를 제안하고, 냅킨에 대충 그린 웹사이트 스케치를 보여주면 실제 작동하는 코드로 변환해주었다. 사람들은 두려움과 경이로움을 동시에 느꼈다. 기계가 인간 고유의 영역이라 믿었던 '창의적 문제 해결' 영역을 침범하기 시작했기 때문이다.

텍스트 영역에서의 혁명은 곧 예술의 영역으로 번졌다. OpenAI가 이미지 생성 AI인 DALL-E 3를 챗GPT에 통합하면서 창작의 대중화가 시작되었다. 이전의 이미지 생성 도구는 복잡한 프롬프트를 입력해야 했지만, DALL-E 3는 달랐다. 챗GPT와 대화하듯 “비 오는 날 창밖을 바라보는 고양이를 그려줘, 지브리 스튜디오 스타일로”라고 말하면, AI가 찰떡같이 알아듣고 고품질의 그림을 그려냈다.

소셜 미디어는 AI가 그린 그림들로 도배되었다. 누구나 상상력만 있다면 화가나 디자이너가 될 수 있는 시대가 열린 것이다. 특히 특정 화풍(지브리, 픽사, 반 고흐 등)을 완벽하게 모방하고 재창조하는 능력은 열광을 불러일으키는 동시에, 저작권과 예술의 정의에 대한 뜨거운 논쟁을 불러일으켰다. AI는 이제 읽고 쓰는 것을 넘어, 보고 그리는 감각 기관을 가진 존재로 진화했다.

기억의 혁명 : 구글 제미나이 1.5 프로와 컨텍스트 윈도우 전쟁

GPT-4가 독주하던 2024년 2월, 절치부심하던 구글이 드디어 강력한 한 방을 날렸다. 바로 제미나이 1.5 Pro의 발표였다. 이 모델의 핵심 무기는 지능 자체보다는 기억력이었다. LLM에게 컨텍스트 윈도우는 인간의 ‘단기 기억’과 같다. 대화가 길어지면 앞의 내용을 까먹는 것은 LLM의 고질적 한계였다. 당시 GPT-4가 약 12만 8천 토큰(책 300페이지 분량)을 기억할 때, 구글은 무려 100만 토큰, 나아가 200만 토큰을 처리할 수 있는 기술을 선보였다. 2000페이지 책, 1시간짜리 동영상, 11시간의 음성 녹음, 혹은 3만 줄 이상의 코드 전체를 한 번에 머릿속에 집어넣고 분석할 수 있는 용량이다.

구글은 이를 증명하기 위해 ‘니들 인 어 헤이스택Needle in a Haystack, 건초더미에서 바늘 찾기’ 테스트를 시연했다. 방대한 데이터 속에 숨겨진 아주 사소한 정보를 찾아내는 테스트에서 구글의 제미나이 1.5 Pro는 100%에 가까운 정확도를 보였다. 이는 AI의 활용 방법과 범위를 완전히 바꿔놓았다. 수천 페이지의 법률 문서를 통째로 넣고 “나에게 불리한 조항을 찾아줘”라고 하거나, 영화 한 편을 통째로 넣고 “주인공이 입은 옷 브랜드를 찾아줘”라고 명령할 수 있게 된 것이다. 사실, 구글과 오픈AI는 전략과 철학이 다르다. 두 회사의 차이는 결국 칩과 인프라 철학의 차이에서 갈라진다. 구글은 자체 개발하고 위탁 생산하는 TPUTensor Processing Unit처럼 통합 메모리 관리에 강한 아키텍처를 기반으로 하기 때문에, 모델 내부 메모리를 극대화하는 초대형 컨텍스트 윈도우 전략을 택한다. 반면 오픈AI는 엔비디아의 GPU 기반인데, GPU는 기본적으로 고대역폭 메모리(HBM)를 아주 비싼 가격에 제한된 양만 붙일수 있는 구조라서, 분산, 외부 저장소 활용에 유리한 생태계를 중심으로 발전해왔다. 따라서, 오픈AI는 모델 내부를 무한히 크게 만들기보다는 외부 지식, 외부 도구, 외부 메모리를 실시간으로 결합하는 전략을 택하고 있다.

왕좌의 게임 : 클로드 3.5 소넷, 코딩과 문맥을 지배하다

오픈AI와 구글이 거인의 싸움을 벌이는 사이, OpenAI의 연구원들이 독립해 만든 앤스로픽이 조용히, 그러나 치명적인 일격을 가했다. 2024년 6월, 클로드 3.5 소넷의 등장은 시장의 판도를 단번에 뒤집었다.

클로드 3.5 소넷은 ‘가장 똑똑한 모델’은 아닐지라도, ‘가장 인간적인 모델’이었다. 기계적인 느낌이 강한 GPT와 달리, 클로드는 문맥의 미묘한 뉘앙스를 이해하고 훨씬 자연스러운 글쓰기 능력을 보여주었다. 무엇보다 개발자들을 열광시킨 것은 압도적인 ‘코딩 능력’이었다. 단순히 코드를 짜주는 것을 넘어, 화면에 띄워진 사용자 인터페이스를 보고 즉석에서 코드를 수정하거나 게임을 만들어내는 ‘아티팩트’ 기능은 개발자들의 생산성을 비약적으로 끌어올렸다. 이때부터 실리콘밸리에서는 “글쓰기와 코딩은 클로드, 데이터 분석은 GPT, 긴 문서는 제미나이”라는 암묵적인 분업 공식이 생겨나기 시작했다.

클로드 3.5 소넷의 등장으로 AI 경쟁의 구도가 근본적으로 바뀌었다. 이전까지는 오픈AI의 GPT나 구글의 제미나이가 누가 더 많은 지식으로 ‘가장 똑똑한 모델’인지를 겨루는 싸움이었다. 하지만 클로드는 ‘가장 일 잘하는 모델’이라는 새로운 기준을 제시하며 경쟁의 판을 완전히 뒤집었다. 코딩을 예로 들면, AI가 코드를 짜주어도 개발자는 그것을 복사해 외부 프로그램에서 실행해보고 고쳐야 하는 번거로움이 있었다. 클로드는 이 모든 과정을 하나의 창에서 즉시 실행하고 결과까지 눈으로 보여주어, 사용자의 작업을 훨씬 빠르고 편리하게 만들었다. 이는 AI 경쟁이 단순히 ‘모델의 지능’을 넘어, 사용자에게 실질적인 도움과 편리함을 주는 쪽으로 이동했음을 의미했다. 결과적으로 다른 빅테크 기업들도 모델의 지능뿐 아니라, 실제로 사용자가 AI와 함께 협업하는 방식을 개선하는 방향으로 전략을 수정할 수밖에 없게 되었다.

생태계 전쟁으로 : MCP, A2AAgent to Agent와 상호운용성 혁명

모델 성능의 격차가 좁혀지자, 경쟁의 전선은 곧바로 연결성이라는 새로운 영역으로 옮겨갔다. 2025년 초, 앤스로픽이 제안한 MCPModel Context Protocol가 결정적인 신호탄이었다. MCP는 AI 모델들이 외부의 방대한 도구와 기능을 활용할 수 있도록 돕는 표준 통신 규약이다. 이전에는 외부 서비스와의 연동을 위해 복잡한 개별 코드를 작성해야 했지만, MCP의 등장으로 이제 코드 한 줄만으로도 외부 자원을 손쉽게 통합할 수 있게 된 것이다. 이 표준화된 흐름은 곧 구글이 주도하는 A2A, 즉 AI 에이전트 간의 자율적인 대화와 협업으로 발전했다. 예를 들어, 사용자가 '여행 계획'을 요청하면, '계획 에이전트'가 '항공권 예약 에이전트'와 '숙소 예약 에이전트'를 호출해 정보를 주고받으며 최적의 일정을 자동으로 수립하는 방식이다. 경쟁의 중심축은 이제 ‘누가 가장 똑똑한 모델인가’에서 ‘누가 더 많은 서비스와 시스템을 유기적으로 연결하고 작동시키는가’라는 생태계 전쟁으로 완전히 확전되었다.

이러한 상호운용성 혁명은 AI의 활용 영역을 단순히 코드 조각이나 짧은 답변을 생성하는 개별 작업 지원 수준에서 자동화된 업무 프로세스 실행의 단계로 격상시켰다. MCP와 A2A라는 표준화된 프로토콜을 통해 AI는 복잡한 SaaSSoftware as a Service 툴과 실시간으로 연동하여 이메일 발송, 회계 처리, 데이터 시각화, 결제 승인 등 실제적인 업무 실행까지 수행할 수 있게 되었다. 이는 AI가 단순한 '두뇌'를 넘어, 다양한 도구를 활용하여 스스로 일을 처리하는 디지털 노동력으로 진화했음을 의미하며, 결과적으로 기업의 자동화 솔루션 시장 전반을 근본적으로 재편하는 파괴적인 결과를 낳았다.

결국 MCP와 A2A가 주도하는 생태계 전쟁은 단순한 기술 우위 다툼이 아니라, ‘미래 디지털 경제의 운영체제’를 누가 장악할 것인가에 대한 전략적 승부수다. 모델 성능이 상향 평준화되면서, 이 연결 프로토콜의 표준을 선점하거나 주도하는 기업은 AI 시대의 게이트키퍼 지위를 획득하게 된다. 모든 데이터와 서비스의 흐름이 이 프로토콜을 통과해야 하기 때문이다. 앤스로픽이 제안한 MCP를 구글이나 오픈AI가 발 빠르게 수용하고 채택한 이유도 여기에 있다. 이는 기술적 우위 경쟁에서 한발 나아가, AI가 세상의 모든 시스템과 상호작용하는 문법을 결정함으로써, AI 경제의 주도권과 막대한 부가가치를 영구히 선점하려는 전략적 포석인 것이다.

거품과 실망 : GPT-5의 등장과 상향 평준화

2025년 상반기, 업계의 오랜 기다림 끝에 마침내 GPT-5가 공개되었다. 오픈AI는 GPT-4 대비 추론 능력 10%, 효율성 25% 향상이라는 수치를 내세웠고, 실제로 모델은 훨씬 빨라지고 안정적이며 다단계 추론에서 놀라운 정확도를 보였다. 그러나 막상 뚜껑이 열리자 시장의 반응은 GPT-4 출시 당시의 폭발적인 반응이 아닌, ‘예상했던 수준’이라는 미지근한 평가가 지배적이었다. 샘 알트먼이 GPT-5의 공개를 주저했던 이유가 단순히 기술적 완성도를 넘어, 인류의 기대치를 넘어설 혁신적 비약을 보여주지 못했기 때문이었다. 샘 알트먼은 GPT-5가 AGI에 근접할 것이라고 주장했기 때문에, 실망은 더 컸다. 물론, GPT-5는 여전히 시장의 최강자였지만, 모델 하나가 모든 경쟁자를 압도했던 '왕좌 독점'의 시대는 끝났음을 상징적으로 보여줬다.

이러한 실망감의 배경에는 스케일링 법칙의 한계가 있었다. 그동안 데이터와 컴퓨팅 파워를 투입할수록 성능이 정비례해 상승했던 효율이 ‘수확 체감의 법칙’ 구간에 진입했다는 분석이 주류가 되었다. GPT-5가 출시되었을 때, 이미 메타의 라마Llama 같은 오픈소스(정확히 말하면 오픈 웨이트) 모델이나 중국(DeepSeek, Qwen), 프랑스(미스트랄)의 모델들이 GPT-4 수준의 성능을 따라잡았고, 구글의 제미나이와 앤스로픽의 클로드는 각각 컨텍스트(기억력)와 UX(작업 효율성)라는 비지능적 영역에서 혁신을 통해 GPT-5를 위협하고 있었기 때문이다. 이제 가장 똑똑한 모델의 타이틀이 주는 프리미엄은 빠르게 희석되었으며, LLM의 성능은 완전히 상향 평준화되어 시장은 단순히 “우리 모델이 더 똑똑해”라는 주장만으로는 더 이상 고객을 설득할 수 없는 시점에 도달한 것이었다.

GPT-5가 불러온 기대와 실망의 파동은 AI 산업의 투자 패러다임을 근본적으로 바꾸었다. 이전까지 수천억 달러의 자본은 ‘가장 똑똑한 단 하나의 모델’을 만들기 위한 파운데이션 모델 개발에 집중되었다. 하지만 성능의 상향 평준화가 확인되자, 투자자들의 시선은 뇌 자체를 키우는 것에서 몸과 팔다리를 만드는 것으로 옮겨갔다. 즉, 더 이상 범용적인 LLM을 만드는 데 집중하는 대신, 그 위에 특정 산업 지식을 깊이 학습시킨 버티컬 AI나 여러 AI 모델과 외부 툴을 연결하여 복잡한 업무를 스스로 처리하는 AI 에이전트 개발에 자본이 쏠리기 시작했다. 기업들이 AI를 통해 실질적인 재무적 효과ROI를 내기 위해, 이제는 막연한 ‘지능’이 아니라 특정 업무에 대한 깊은 전문성과 자동화된 실행력이 중요해졌음을 의미하며, 시장이 보다 실용적인 AX 단계로 진입했음을 나타낸 것이었다.

회심의 역습 : 구글 제미나이 3.0 프로와 OpenAI의 레드 얼럿

2025년 하반기, 시장의 정적을 깬 것은 와신상담 끝에 돌아온 구글이었다. 그들이 내놓은 제미나이 3.0 프로는 단순한 언어 모델의 진화를 넘어선 충격 그 자체였다. 이 모델은 텍스트와 이미지를 '읽는' 수준을 넘어, 물리적 세계의 인과관계를 통찰하는 월드 모델의 초기 형태를 완벽하게 구현해냈다. 시연 영상 속 제미나이 3.0은 복잡한 화학 실험 영상을 보고 다음에 일어날 폭발 반응을 초 단위로 정확히 예측하는가 하면, 로봇 팔을 제어해 젠가 게임의 무게 중심을 계산하며 완벽하게 수행해냈다. AI가 확률적으로 단어를 조합하던 앵무새의 단계에서 벗어나, 뉴턴의 법칙과 인과율이 지배하는 물리적 세계를 이해하고 시뮬레이션할 수 있는 단계로 진입했음을 알리는 거대한 신호탄이었다.

이러한 기술적 성취 위에서 구글은 대중성까지 거머쥐었다. 이미지 생성 경량모델인 나노 바나나 프로가 지브리 열풍을 재현하며 밈Meme 문화를 주도했고, 영상 생성 AI인 VEO 3.1은 압도적인 물리 엔진 성능을 보여주며 상대적으로 미풍에 그쳤던 OpenAI의 소라 2를 잠재워버렸다. 구글은 가장 가벼운 SLMSmall Language Model부터 가장 무거운 월드 모델까지, 그리고 텍스트에서 비디오와 로보틱스까지 아우르는 ‘진정한 멀티모달True Multimodal’ 생태계를 완성하며 경쟁 우위를 증명해냈다. 더 이상 이들을 단순히 '언어 모델'이라 부르는 것은 민망한 일이 되었다. 위기감을 느낀 OpenAI 이사회는 다시 한번 전사적인 레드 얼럿Red Alert을 선언하고, 그동안 베일에 싸여 있던 차세대 프로젝트 ‘오리온Orion’의 조기 공개를 검토하며 배수진을 쳤다.

판이 흔들리자, 관망하던 거인들도 더 이상 침묵할 수 없었다. 오픈AI의 공동 창업자이자 전 수석 과학자인 일리야 수츠케버는 AI 개발의 시대가 “스케일링의 시대를 넘어, 연구의 시대로 회귀했다”고 선언하며 이 격변에 불을 지폈다. 그는 단순히 컴퓨팅 파워와 데이터를 투입하는 방식은 한계에 봉착했으며, 모델이 벤치마크에서는 완벽하지만 실제 상황에서는 어처구니없는 실수를 저지르는 지능의 요철 문제를 극복하기 위한 새로운 패러다임이 필요하다고 역설했다. 이는 곧 현실 세계의 물리적 인과관계를 이해해야 한다는 월드 모델의 필요성과 정확히 맞닿았다.

여기에 더해, “LLM은 진정한 지능이 아니다”라며 오랫동안 비판의 목소리를 높여왔던 메타의 AI 수석 과학자 얀 르쿤도 구글의 성과를 보며 자신의 월드 모델론이 옳았음을 설파하기 시작했다. 그리고 AI 칩의 제왕 엔비디아 역시 단순한 하드웨어 공급자를 넘어섰다. 그들은 월드 모델 구현의 핵심인 로보틱스와 시뮬레이션 영역에 전면적으로 뛰어들었다. 엔비디아는 물리적으로 정확한 디지털 트윈Digital Twin을 구축하는 운영 체제인 옴니버스Omniverse를 제공하고, 그 위에서 자율주행차와 로봇 학습을 가속화하는 코스모스 월드 파운데이션 모델 플랫폼을 공개했다. 이 플랫폼은 AI가 가상 세계에서 물리 법칙을 학습하고 시뮬레이션된 환경을 통해 훈련할 수 있는 환경을 제공하며, 하드웨어뿐만 아니라 월드 모델이라는 소프트웨어 스택 자체를 장악하겠다는 전략적 의도를 분명히 드러냈다. 이러한 흐름들은 이제 단순한 소프트웨어 경쟁을 넘어 하드웨어, 인프라, 근본 연구가 총결집되는 패권 전쟁으로 비화되었음을 보여주기도 한다.

이제 향후 AI 전쟁의 양상은 명확해졌다. 모니터 속 채팅창 안에서 누가 더 말을 잘하는지 겨루던 언어 지능의 경쟁은 막을 내리고 있다. 물론 이것이 LLM 시대의 종말을 의미하는 것은 아니다. 오히려 LLM은 모든 AI 시스템의 필수적인 지능적 기반으로 굳건히 자리 잡았다. 구글이 제시한 방향처럼 LLM은 거대한 기억력과 추론 능력을 갖춘 ‘지능의 뇌’로서 계속 진화할 것이다. 다만, 승패를 가를 진짜 주력 전선은 이제 현실 세계로 옮겨가고 있다. 로봇, 자율주행차, 스마트 팩토리 등 실재하는 사물을 직접 제어하고 움직이는 물리적 AIPhysical AI의 패권을 누가 쥐느냐가 핵심이 된 것이다. 강력한 LLM이라는 지능의 토대 위에서, 현실을 이해하고 실행하는 월드 모델이 가장 중요하고 치열한 다음 전장戰場이 될 것이라는 팽팽한 긴장감이 AI 산업 전체를 감돌고 있다.

📚 더 읽기

[아마존 EC2 02] 아마존 EC2 구축하기
[n8n 01] 로컬 방식으로 n8n 설치하기
[바이브 코딩 02] 에이전트에게 지침을 미리 내려둘 수 있다? AGENTS.md
▶챗GPT로 시작된 변화와 혁명 : 기계는 어떻게 생각하게 되었나?
[AWS 02] AWS를 쓰려면 알아야 하는 넓고 얕은 지식
[스프링 부트 02] 인텔리제이 설치하고 스프링 부트 4 프로젝트 만들기
빠르게 따는 SQLD 합격자 인터뷰

저자 소개

이승현

“정책 설계자의 안목과 창업가의 야전 감각을 지닌 AI 전략가, 기술을 넘어 국가 문명을 재설계할 지도를 그리다.” 전 대통령직속 디지털플랫폼정부위원회 인공지능플랫폼 혁신국장이자, 국가 AI 전략의 초석을 놓은 정책 설계자다. 현재는 생성형AI스타트업 포티투마루 부사장, 가천대 스타트업칼리지 겸임교수로 민간과 공공, 학계를 아우르는 AI 전략가로 활동하고 있다.법과 제도가 기술의 속도를 따라잡지 못하는 시대, 저자는 그 간극에 '지능형 다리'를 놓는 역할을 해왔다. 대한민국 정부의 디지털 패러다임을 전환하기 위해 신설된 디지털플랫폼정부위원회에서 3년여간 인공지능플랫폼 혁신국장을 맡아 공공 인공지능 전환 현장을 진두지휘했다. 파편화된 국가 데이터를 하나의 플랫폼 위에서 흐르게 하고, 이를 AI와 결합해 행정의 지능화를 이끌어온 그의 경험은 국내 공공 AI 분야의 독보적인 자산으로 평가받는다.저자의 시선은 늘 기술의 본질과 사회적 파급력을 동시에 향한다. 드림위즈 기술연구소 연구원을 시작으로 기술 최전선의 야전 감각을 익혔고, 국회 입법보좌관과 보건복지부 장관 정책보좌관을 지내며 국가 의사결정 체계의 메커니즘을 체득했다. 또한 핀테크 기업인 투게더앱스와 투게더아트를 창업해 자본의 흐름과 기술의 결합을 직접 증명해 보이기도 했다.멘사 정회원이기도 한 저자는 복잡한 사회 시스템을 논리적인 객체와 관계의 망으로 읽어내는 데 탁월하다. 연세대 정보대학원에서 정보시스템 석사를 마치고, 중앙대 국제대학원에서 국제학 박사 과정을 수료하며 다져진 학문적 토대는 기술을 단순한 도구가 아닌 ‘문명적 질서’로 바라보는 깊은 통찰의 근간이 되었다. 특히 그는 AI가 단순한 지능을 넘어 사회적 상호작용의 주체가 되는 ‘거대사회모델(LSM)’ 시대를 예견하며, 이에 걸맞은 새로운 디지털 헌법의 필요성을 역설해왔다.현재 법무법인 린의 공공AX부문 고문으로도 활동하며, AI 기술이 비즈니스와 공공 정책의 실질적인 ‘게임 체인저’가 될 수 있도록 현장에 그 지혜를 전파하고 있다. 《AI 국부론》은 관료의 전략적 안목과 기업가의 실행력, 그리고 학자의 깊은 사유가 응축된 결과물이다. 이 책은 AI라는 거대한 파도 위에서 대한민국이 붙잡아야 할 가장 확실한 지도가 되어줄 것이다.

📚《AI 국부론》 자주 묻는 질문

Q.챗GPT를 비롯한 AI 기술이 급속도로 발전하면서, 대한민국이 '디지털 식민지'로 전락할 수 있다는 경고가 나오는 이유는 무엇인가요?

챗GPT와 같은 해외 빅테크 기업의 AI 기술은 막대한 데이터를 기반으로 합니다. 이 과정에서 한국의 데이터가 활용되면서, 우리의 '정신'과 '시장'이 잠식될 수 있다는 우려가 제기되고 있습니다. 특히, 우리가 '전자정부 세계 1위'라는 환상에 젖어 있는 동안, 구글이나 오픈AI와 같은 기업들은 우리의 데이터를 활용하여 빠르게 성장하고 있습니다. 정부 시스템이 여전히 먹통이 되거나, 기업들이 해외 빅테크에 종속될 것을 걱정하는 이유는 우리에게 AI를 다룰 독자적인 '지능 주권'과 국가 시스템을 재설계할 '설계도'가 없기 때문입니다. 즉, 단순히 기술을 도입하는 '전산화' 수준으로는 부족하며, 국가 운영체제 자체를 뜯어고치는 '제2의 건국' 수준의 혁신이 필요합니다. 이를 위해서는 AI를 단순한 도구가 아닌, 국가의 부와 운명을 결정짓는 '국가전략자산'으로 인식하고, 적극적으로 활용해야 합니다. 더 자세한 내용은 《AI 국부론》에서 확인하실 수 있습니다.

Q.'5-레스 아키텍처'라는 개념이 정부 혁신에 어떻게 기여할 수 있나요? 구체적인 예시가 궁금합니다.

'5-레스 아키텍처'는 중개자(Less Intermediaries), 서류(Less Paper), 마찰(Less Friction), 경계(Less Boundaries), 그리고 지체(Less Delay)를 제거하는 것을 목표로 하는 정부 혁신 모델입니다. 이를 통해 국민은 정부의 존재를 잊을 만큼 완벽하게 작동하는 '보이지 않는 정부'를 경험할 수 있습니다. 예를 들어, 기존에는 복잡한 서류 절차와 여러 부서를 거쳐야 했던 민원 처리가, AI 기반의 자동화 시스템을 통해 즉각적으로 처리될 수 있습니다. 또한, 다양한 정부 부처 간의 데이터 공유가 원활해져 국민들은 한 번의 정보 제공으로 모든 서비스를 이용할 수 있게 됩니다. 이러한 혁신은 국민 편의성을 높일 뿐만 아니라, 정부 운영의 효율성을 극대화하여 예산 절감에도 기여할 수 있습니다. 이와 관련된 더 자세한 내용은 《AI 국부론》에서 확인하실 수 있습니다.

Q.미·중 패권 경쟁 속에서 대한민국이 AI 분야에서 생존하고 성장하기 위한 '지정학적 승부수'는 무엇인가요?

미·중 패권 경쟁은 AI 기술 경쟁으로 이어지고 있으며, 대한민국은 이 속에서 전략적인 위치를 확보해야 합니다. 핵심은 26만 장의 GPU를 확보하는 것입니다. 이는 단순한 하드웨어 확보를 넘어, 한국이 미국 AI의 필수적인 '활주로'이자 파트너가 되기 위한 전략적 포석입니다. 한국은 뛰어난 반도체 기술력(HBM, HBF)과 인프라를 바탕으로 미국과의 협력을 강화하고, AI 생태계에서 주도적인 역할을 수행해야 합니다. 동시에, 중국과의 관계를 고려하여 균형 잡힌 외교 전략을 펼치는 것도 중요합니다. 즉, 어느 한쪽에 치우치지 않고, 국익을 최우선으로 고려하는 실리적인 외교가 필요합니다. 이러한 지정학적 승부수에 대한 더 자세한 내용은 《AI 국부론》에서 확인하실 수 있습니다.

Q.GDP를 넘어 '지능총생산(GIP)'이라는 새로운 개념이 등장한 이유는 무엇이며, 이는 국가 경제에 어떤 영향을 미칠 수 있나요?

GDP(국내총생산)는 전통적인 경제 활동의 규모를 측정하는 지표이지만, AI 시대에는 한계가 있습니다. AI는 단순한 노동력을 대체하는 것을 넘어, 새로운 부를 창출하고 경제 성장을 견인하는 핵심 동력으로 작용합니다. '지능총생산(GIP)'은 AI라는 지능형 자본이 국부를 창출하는 규모를 측정하는 새로운 지표입니다. GIP가 높아진다는 것은 AI 기술의 발전과 활용이 활발해지고, 이를 통해 새로운 산업과 일자리가 창출된다는 것을 의미합니다. 대한민국이 저성장의 늪에서 벗어나 'AI 네이티브 국가'로 도약하기 위해서는 GIP를 높이는 데 집중해야 합니다. AI 인프라 구축, 인재 양성, 규제 완화 등 다양한 정책적 노력을 통해 GIP를 극대화해야 합니다. 이에 대한 자세한 내용은 《AI 국부론》에서 확인하실 수 있습니다.

Q.AI 기술 발전에 따라 예상되는 노동 시장의 변화에 어떻게 대비해야 할까요?

AI 기술의 발전은 필연적으로 노동 시장에 큰 변화를 가져올 것입니다. 일부 직업은 자동화로 인해 사라지겠지만, 동시에 새로운 직업이 창출될 것입니다. 중요한 것은 변화에 대한 적응력을 높이는 것입니다. 끊임없이 새로운 기술을 배우고 익히는 자세가 필요하며, AI를 활용하여 생산성을 높이는 방법을 모색해야 합니다. 또한, 정부는 AI 기술 발전에 따른 실업 문제에 대비하여 재교육 프로그램을 확대하고, 새로운 일자리 창출을 위한 정책을 마련해야 합니다. AI 시대에는 창의적인 사고력, 문제 해결 능력, 협업 능력 등 '소프트 스킬'의 중요성이 더욱 부각될 것입니다. 이러한 역량을 강화하는 데 집중해야 합니다. 자세한 내용은 《AI 국부론》에서 확인해보세요.

Q.정부가 '디지털플랫폼정부'를 구축하는 과정에서 가장 중요하게 고려해야 할 점은 무엇인가요?

디지털플랫폼정부는 데이터 기반의 과학적인 의사결정을 통해 국민들에게 맞춤형 서비스를 제공하는 것을 목표로 합니다. 이를 성공적으로 구축하기 위해서는 몇 가지 핵심적인 고려 사항이 있습니다. 첫째, 데이터 보안과 개인정보 보호를 철저히 해야 합니다. 국민들의 민감한 정보가 유출되지 않도록 강력한 보안 시스템을 구축하고, 데이터 활용에 대한 명확한 규정을 마련해야 합니다. 둘째, 다양한 부처 간의 데이터 공유와 협력을 강화해야 합니다. 데이터 사일로 현상을 해소하고, 데이터 기반의 융합 서비스를 창출해야 합니다. 셋째, AI 기술을 적극적으로 활용해야 합니다. AI 기반의 자동화, 예측 분석 등을 통해 업무 효율성을 높이고, 국민들에게 더 나은 서비스를 제공해야 합니다. 넷째, 사용자 중심의 디자인을 적용해야 합니다. 국민들이 쉽고 편리하게 서비스를 이용할 수 있도록 인터페이스를 개선하고, 접근성을 높여야 합니다. 이와 관련하여 《AI 국부론》에서 더 자세한 내용을 확인하실 수 있습니다.

Q.개인이 AI 기술을 활용하여 생산성을 높이고 경쟁력을 강화하기 위한 구체적인 방법은 무엇인가요?

AI 기술은 개인의 생산성을 높이고 경쟁력을 강화하는 데 매우 유용한 도구가 될 수 있습니다. 먼저, 자신의 업무 분야에 AI 기술을 어떻게 적용할 수 있는지 고민해야 합니다. 예를 들어, 글쓰기 업무를 하는 경우 챗GPT와 같은 AI 도구를 활용하여 초안을 작성하거나 아이디어를 얻을 수 있습니다. 데이터 분석 업무를 하는 경우, AI 기반의 분석 도구를 활용하여 더 빠르고 정확하게 데이터를 분석할 수 있습니다. 또한, 온라인 강의나 튜토리얼을 통해 AI 기술을 배우고 익히는 것도 좋은 방법입니다. AI 관련 커뮤니티에 참여하여 다른 사람들과 정보를 교환하고 협력하는 것도 도움이 될 수 있습니다. 중요한 것은 AI 기술을 두려워하지 않고, 적극적으로 활용하려는 자세입니다.《AI 국부론》을 읽어보시면 AI를 활용한 더 많은 인사이트를 얻으실 수 있습니다.