[생존 AI 교양 04] AI는 언어를 어떻게 이해하는가?

2026년 6월 28일조회 6

이 글은 《생존을 위한 최소한의 AI 교양》에서 발췌했습니다.

생존을 위한 최소한의 AI 교양

ISBN 9791124516119지은이 조남호₩25,000

AI는 언어를 어떻게 이해하는가?

우리가 인공지능과 대화하며 느끼는 경이로움의 이면에는, 아주 차갑고 냉정한 수학적 계산이 자리잡고 있습니다. AI는 우리가 던지는 질문의 '의미'를 이해하는 것이 아니라, 다음에 올 가장 적절한 '숫자'를 계산할 뿐이죠. 이 거대한 계산기가 어떻게 인간의 복잡한 언어를 흉내내게 되었는지, 그 여정을 따라가보겠습니다.

▸ AI가 확률에 집착하는 앵무새가 된 까닭

인간의 언어는 본질적으로 '모호함'의 바다입니다. 모든 대화에는 '의도'라는 것이 숨어있죠. 우리가 "잘하는 짓이다"라고 말할 때, 그것은 칭찬이 아닙니다. 그런데 컴퓨터는 0과 1의 세계에서 살기 때문에, 이런 비꼬는 말을 쉽게 이해하지 못합니다.

초기 AI 연구자들은 모든 문법 규칙을 직접 입력하려 했습니다. 그러나 언어는 살아있는 생물처럼 매 순간 변했고, 예외는 규칙보다 많았습니다. 결국 연구자들은 발상을 바꿉니다. "언어를 이해시키려 하지 말고, 통계적으로 예측하게 하자"는 전략이었죠.

초기의 거대언어모델이 하는 일은 단순했습니다. 앞에 나온 단어들을 보고, 다음 칸에 올 확률이 가장 높은 단어를 골라내는 것이죠. '학교에' 다음에는 '가다'가 올 확률 70%, '있다'가 올 확률 20%처럼 점수를 매기는 방식입니다. 그래서 학계는 AI를 '확률적 앵무새Stochastic Parrot'라고 부르기 시작했습니다. 뜻도 모른 채 주인과 대화하며 보상을 바라는 앵무새처럼, AI도 그저 데이터의 바다에서 배운 확률의 노래를 부르고 있을 뿐이라는 냉소적인 비판이었습니다.

하지만 이 앵무새가 단순한 흉내쟁이를 넘어 진정한 대화 상대로 진화하려면, 단어를 단순한 텍스트가 아닌 '의미'로 분석할 수 있는 특별한 장치가 필요했습니다.

▸ 단어에도 이웃이 있다 : 워드 투 벡터가 발견한 언어의 사회성

확률 계산을 하려면 단어를 숫자로 바꿔야 합니다. 처음에는 단어마다 고유번호를 붙였습니다. 그런데 1번 '사과'와 2번 '바나나' 사이에는 아무런 수학적 관계가 없었습니다. 컴퓨터 눈에는 '사과'와 '자동차'가 '사과'와 '바나나'만큼이나 무관해보였던 겁니다. 이 문제를 해결하며 등장한 것이 바로 워드 투 벡터Word2Vec입니다.

이 기술은 '단어의 의미는 그 단어 자체가 아니라, 함께 어울리는 이웃들에 의해 결정된다'는 언어학적 발견에 주목했습니다.

• '왕'이라는 단어 주변에는 늘 '궁궐', '왕관', '권력'이 등장합니다.

• '왕비' 주변에도 '궁궐', '왕관', '우아함'이 등장하죠.

연구자들은 이 '이웃들의 목록'을 바탕으로 단어를 좌표 평면 위에 점으로 찍기 시작했습니다. '왕'과 '왕비'는 비슷한 이웃을 가지니 서로 가까이 배치되고, '왕'과 '냉장고'는 이웃이 전혀 다르니 멀리 떨어집니다.

이것이 바로 '임베딩Embedding'의 시작입니다. 이제 컴퓨터는 단어를 '기호'가 아닌, 좌표 공간의 '거리'로 인식합니다. 왕과 왕비는 서로 당기는 힘, 벡터Vector가 강한 관계가 되고, 왕과 냉장고는 아주 먼 관계가 되는 것이죠.

임베딩에서는 방향과 거리, 관계에 따라 찾으려는 결과값을 추론하고 연산할 수 있도록 해줍니다.

그래서 이런 유명한 수식이 탄생했습니다: 왕 - 남자 + 여자 = 왕비. 우연이 아닙니다. 공간 위에서 '남자'에서 '여자'로 가는 방향과 거리를 '왕'의 좌표에 적용했더니, 바로 그 자리에 '왕비'가 있었던 겁니다. 단어들이 맺는 사회적 관계가 수학적인 지도로 변한 순간이었습니다. 이렇게 단어들이 공간에서 차지하는 좌표를 우리는 '임베딩'이라고 부릅니다. 임베딩과 이 수식을 이용하면, "왕이 남자가 아니고 여자라면 뭐라고 부르지?"라고 물어보면, "여왕입니다."라고 AI가 답하게 되는 거예요.

▸ 1,536차원의 우주 : 영화 〈인터스텔라〉의 그 장면을 떠올려보세요

초기의 임베딩은 2차원이나 3차원 공간에서 이루어졌습니다. 그런데 인간의 언어는 너무나 입체적입니다. '사과'라는 단어 하나에도 과일, 스마트폰 기업, 아담의 사과, 용서, 청사과, 단맛, 신맛 등 수많은 맥락이 얽혀있습니다. 2D 지도에 이 모든 정보를 담으려 하니, 정보가 겹치고 뭉개지는 문제가 생겼죠.

그래서 현대의 AI, 특히 GPT-4 같은 모델은 이 지도의 차원을 대폭 늘렸습니다. 무려 1,536차원으로 말이죠. 영화 〈인터스텔라〉의 주인공 쿠퍼가 블랙홀 속 테서렉트에 갇혔을 때를 떠올려보세요. 그 고차원의 공간에서 쿠퍼는 딸 머피의 방을 시간대별로, 각도별로 동시에 내려다봅니다. 3차원에서는 불가능했던 일이 4차원에서는 가능했죠. 그런데 AI가 사용하는 공간은 1,536차원입니다. 상상하기조차 어렵습니다.

'사과'라는 단어 하나가 AI에게 던져졌을 때, AI는 그 단어를 1,536가지 서로 다른 관점에서 바라봅니다. 1번 차원에서는 '식물성인가?', 2번 차원에서는 '스마트폰인가?', 3번 차원에서는 '어떤 맛이 나는가?'를 따지는 식이죠. 차원이 늘어날수록 단어들 사이의 미세한 맥락 차이는 겹치지 않고 정교하게 구분됩니다. 덕분에 AI는 우리가 '사과'라고 말할 때 그것이 '미안함'인지 '과일'인지 구분하는 정밀한 눈을 갖게 됩니다.

▸ 기억의 우주를 항해하는 나침반 : 벡터 데이터베이스

1,536차원의 우주에는 너무나 많은 별(데이터)이 떠 있습니다. AI가 필요한 정보를 찾기 위해 이 방대한 우주를 매번 처음부터 끝까지 뒤질 수는 없죠. 그래서 필요한 것이 벡터 데이터베이스입니다.

벡터 데이터베이스는 우리가 저장하는 정보를 임베딩의 형태로 저장해 둔 것이라고 보면 됩니다.

전통적인 데이터베이스가 별의 이름을 가나다순으로 정리한 '목록표'라면, 벡터 DB는 1,536차원 우주에 떠 있는 별들의 위치를 기록한 '항성 지도'입니다. 기존 데이터베이스 검색은 '사과'라는 정확한 글자가 포함된 문서를 찾아야 하지만, 벡터 DB는 '빨갛고 아삭하며 뉴턴에게 영감을 준 것'이라는 설명으로 좌표를 찾고, 그 근처에 있는 데이터들을 보여줍니다. 마치 '식초와 겨자 넣어서 차갑게 먹는 면 음식'이라고 설명하면 '냉면', '초계국수'와 같은 결과를 알려주는 것처럼요.

우리가 AI와 나누는 대화는 결국 숫자로 그려진 거대한 지도 위를 함께 걷는 일입니다. 이 차가운 숫자의 공간이 역설적으로 인간의 가장 복잡한 언어적 맥락을 가장 정교하게 담아내고 있죠.

📚 더 읽기

저자 소개

조남호

삼성SDS에서 26년 넘게 일해온 베테랑 엔지니어다. 삼성전자 물류시스템 개발 및 삼성디스플레이 생산관리시스템 구축 프로젝트를 이끌었고, 지금은 연구개발 부서에서 기술 전략과 교육, AI 에반젤리스트로 활동하고 있다. 국내 IT 분야 최고 권위의 자격인 정보관리기술사를 보유한 그는, 복잡한 시스템의 본질을 꿰뚫어 보는 안목과 현장에서 단련된 실무 감각을 겸비한 보기 드문 전문가다.이런 이력을 바탕으로 그는 지금, AI가 단순한 도구를 넘어 스스로 생각하고 움직이는 시대, 이른바 ‘에이전틱 워크플로우’ 시대를 준비하고 있다. 여러 AI가 서로 협력해 일할 수 있도록 돕는 ‘하네스 엔지니어링’이라는 새로운 방법론을 국내에 알리는 일에도 앞장서고 있다.그가 바라보는 기술은 차가운 논리의 나열이 아니다. 기술은 사람의 마음을 움직이는 하나의 이야기여야 한다고 믿는, ‘스토리텔러 엔지니어’다. 여러 매체와 블로그를 통해 AI 기술의 흐름을 기록하며, 전문가가 아닌 일반 독자도 AI와 IT를 쉽게 이해할 수 있도록 꾸준히 글을 써왔다. 기술을 대중의 언어로 풀어내되 깊이는 결코 놓치지 않는다는 것, 이것이 그가 지켜온 원칙이다. 이러한 신념은 후학을 길러내는 일로도 이어진다. 삼성 청년 소프트웨어 아카데미에서 IT 분야로 첫발을 내딛는 젊은 개발자들을 위해 여러 차례 멘토링과 강연을 해왔다.차갑고 어렵게만 느껴지는 IT 기술을 ‘인문학적 기술론’이라는 따뜻한 언어로 풀어내는 그의 시선은 이 시대가 필요로 하는 새로운 안내자의 역할을 하고 있다.“26년간 삼성SDS 현장에서 한국 IT의 뼈대를 만들어온 개발자이자 기획자. 행정안전부·NIA 자문위원, 구글 제미나이 우수 앰배서더. 이 모든 화려한 이력보다 더 전하고 싶은 건 단 하나입니다. 낯선 AI가 여러분의 든든한 친구가 될 수 있다는 것. 이 책은 그 증명입니다.”

📚《생존을 위한 최소한의 AI 교양》 자주 묻는 질문

Q.AI 시대에 챗GPT 외에 알아야 할 필수적인 교양 지식이 있나요?

AI 시대에 챗GPT 사용법을 아는 것은 중요하지만, 그것만으로는 충분하지 않습니다. 챗GPT가 어떻게 작동하는지 원리를 이해하고, 더 나아가 AI 기술의 발전 방향과 그것이 우리 사회에 미칠 영향에 대한 넓은 안목을 갖추는 것이 진정한 'AI 교양'이라 할 수 있습니다. 예를 들어, 챗GPT가 내 말을 어떻게 이해하는지, AI 에이전트나 소버린 AI 같은 새로운 개념들이 무엇을 의미하는지 등을 알아야 합니다. 이러한 지식은 단편적인 사용법을 넘어 AI 시대를 살아가는 데 필요한 본질적인 통찰력을 제공하며, 빠르게 변화하는 기술 환경 속에서 도태되지 않고 앞서나갈 수 있는 기반이 됩니다. 《생존을 위한 최소한의 AI 교양》은 AI를 이해하기 위한 필수 뼈대 지식만을 담아, 단순히 사용법을 넘어 AI 시대의 본질적인 변화를 이해하고 미래를 대비할 수 있도록 돕는 데 초점을 맞추고 있습니다.

Q.AI의 작동 원리가 너무 어려울 것 같아서 접근하기 망설여져요. 쉽게 이해할 방법이 없을까요?

AI의 작동 원리는 복잡하게 들릴 수 있지만, 어렵고 딱딱한 기술 용어 대신 일상적인 비유와 흥미로운 스토리텔링을 통해 훨씬 쉽게 이해할 수 있습니다. 예를 들어, 책 《생존을 위한 최소한의 AI 교양》에서는 AI가 배우는 방식을 '수만 번 넘어지며 자전거 타기를 배우는 아이'에 비유하고, 수천억 개의 지식 조절 장치를 '정밀 오디오에 달린 수천억 개의 나사'에 비유하여 독자들이 직관적으로 AI의 학습 메커니즘을 파악할 수 있도록 돕습니다. 또한, 챗GPT의 핵심 기술을 만든 사람들의 이야기, 즉 열두 살에 집을 뛰쳐나와 공원에서 노숙하면서도 AI의 씨앗이 된 논문을 써낸 월터 피츠나 챗GPT의 뼈대를 만든 구글 연구원들의 에피소드 등을 통해 딱딱한 개념을 한 편의 영화처럼 기억에 새길 수 있습니다. 이처럼 기술의 역사와 개발 과정 속 인물들의 이야기를 통해 AI 원리를 이해하면, 단순히 개념을 외우는 것이 아니라 잊히지 않는 장면처럼 마음속에 각인될 것입니다.

Q.AI 에이전트, 소버린 AI 같은 최신 AI 트렌드를 알고 싶어요. 어떤 책을 읽어야 할까요?

AI 에이전트, 소버린 AI와 같은 최신 AI 트렌드는 단순히 기술적 개념을 넘어 미래 사회의 변화를 이해하는 데 필수적인 요소입니다. 이러한 개념들은 AI가 단순히 명령을 수행하는 도구를 넘어 자율적으로 목표를 설정하고 실행하는 주체로 발전하고 있음을 보여줍니다. 시중에는 많은 AI 관련 서적들이 있지만, 대부분 특정 기술의 사용법을 다루거나 사전처럼 모든 개념을 나열하는 경향이 있습니다. 하지만 우리는 이러한 트렌드를 단순히 나열하는 것을 넘어, 그 원리와 배경, 그리고 앞으로의 파급력을 이해해야 합니다. 《생존을 위한 최소한의 AI 교양》은 챗GPT의 원리부터 시작하여 AI가 혼자 일하는 미래, 즉 여러 AI가 협력하고 코딩 없이 말로 프로그램을 만들며, AI들끼리 대화를 주고받는 시대까지를 조망합니다. 이 책을 통해 독자들은 전 세계 AI 왕좌의 전쟁, 딥씨크 쇼크와 같은 사건들을 이해하고, 대한민국이 '우리만의 AI'를 가져야 하는 절박한 이유까지 깨달으며 AI 시대의 주요 흐름을 정확하게 파악할 수 있을 것입니다.

Q.AI 관련 책을 여러 권 읽었지만, 지식이 파편화되어 있다는 느낌이 들어요. 이 지식들을 하나로 꿰는 방법이 있을까요?

AI 관련 책을 여러 권 읽으셨음에도 지식이 파편화되어 있다고 느끼신다면, 이는 많은 독자들이 겪는 어려움 중 하나입니다. AI 분야는 워낙 넓고 빠르게 변화하기 때문에, 각각의 책들이 다루는 특정 개념이나 도구에만 집중하다 보면 전체적인 그림을 놓치기 쉽습니다. 이러한 파편화된 지식을 하나로 꿰기 위해서는 AI라는 거대한 세계의 '지도'를 제공하는 책이 필요합니다. 즉, AI의 핵심적인 원리와 발전 과정을 체계적으로 이해하고, 각 기술들이 어떻게 연결되어 있는지를 파악할 수 있도록 돕는 도구가 필요하죠. 《생존을 위한 최소한의 AI 교양》은 바로 이 지점에 초점을 맞춥니다. 이 책은 AI를 이해하기 위한 '필수 뼈대'만 남겨, 이미 AI 책을 읽어본 독자에게는 흩어진 지식을 하나로 꿰는 강력한 도구가 됩니다. 챗GPT의 원리부터 AI 혼자 일하는 미래까지, AI 시대의 큰 흐름과 핵심 개념들을 유기적으로 연결하여 전체적인 안목을 키워줄 것입니다.

Q.AI 시대에 인간은 무엇을 해야 하는지에 대한 고민이 많습니다. 이 책이 해답을 줄 수 있을까요?

AI 시대에 인간이 무엇을 해야 하는지에 대한 고민은 기술 발전과 더불어 중요한 화두가 되고 있습니다. AI가 단순 반복 업무를 넘어 창의적인 영역까지 확장되면서, 많은 사람들이 자신의 역할에 대해 의문을 품게 됩니다. 《생존을 위한 최소한의 AI 교양》은 이러한 고민에 대해 정직하게 마주하며, AI 혼자 일하는 미래에 인간이 지녀야 할 역할과 자세를 탐색합니다. 책은 여러 AI가 협력하여 일을 나누고, 코딩 없이 말로 프로그램을 만들며, AI들끼리 대화를 주고받는 시대가 도래할 것임을 보여줍니다. 이러한 미래 속에서 인간은 단순히 AI를 사용하는 것을 넘어, AI가 해결할 수 없는 영역, 즉 인간 고유의 창의성, 비판적 사고, 윤리적 판단, 그리고 복잡한 문제 해결 능력에 집중해야 함을 시사합니다. 이 책은 AI 기술의 원리와 동향을 깊이 있게 이해함으로써, AI가 인간의 역할을 대체하는 것이 아니라 보완하고 확장하는 미래를 준비하는 데 필요한 안목과 통찰력을 제공합니다.

Q.AI 관련 기술 용어들이 너무 어렵고 딱딱하게 느껴져서 쉽게 이해하고 싶은데, 도움이 될 만한 책이 있나요?

AI 관련 기술 용어들은 낯설고 복잡하게 느껴질 수 있어 많은 분들이 진입 장벽을 느낍니다. 하지만 용어 자체에 매몰되기보다는 그 배경에 담긴 원리와 의미를 파악하는 것이 중요합니다. 《생존을 위한 최소한의 AI 교양》은 이러한 어려움을 해소하기 위해 딱딱한 기술 용어를 일상적인 언어와 흥미로운 비유로 풀어 설명합니다. 예를 들어, AI가 글뿐 아니라 사진과 소리까지 이해하게 된 과정을 '텍스트의 감옥을 탈출한 눈과 귀 이야기'로 설명하고, 엉뚱한 답을 막기 위해 전용 도서관을 붙여주는 기술을 '기억의 한계를 넘어서는 법'으로 풀이하는 식입니다. 이러한 설명 방식은 독자들이 개념을 외워야 할 문제가 아니라, 자연스럽게 이해하고 기억할 수 있는 장면으로 만들어줍니다. 단순히 기술 용어를 나열하는 것이 아니라, 그 용어가 탄생하게 된 배경과 발전 과정을 스토리텔링 방식으로 전달하여 AI의 핵심 원리를 쉽게 체득할 수 있도록 돕는 것이 이 책의 강점입니다.

Q.AI 분야의 큰 그림과 흐름을 이해하고 싶은데, 어떤 책이 좋을까요?

AI 분야는 너무나 방대하고 빠르게 변화하기 때문에, 개별적인 기술이나 사용법에 매몰되기보다는 전체적인 큰 그림과 흐름을 이해하는 것이 중요합니다. 그래야만 AI 시대의 변화를 예측하고 능동적으로 대응할 수 있습니다. 《생존을 위한 최소한의 AI 교양》은 바로 이러한 'AI 시대의 지도'를 제공하는 데 초점을 맞춘 책입니다. 챗GPT의 원리라는 출발점에서 시작하여, AI 기술을 만든 사람들의 이야기, 전 세계 AI 왕좌의 전쟁, 그리고 AI 혼자 일하는 미래에 이르기까지 AI 발전의 주요한 맥락과 흐름을 일목요연하게 정리해줍니다. 구글의 다급한 반격, 딥씨크 쇼크, 엔비디아가 AI 제국이 된 이유, 그리고 대한민국이 '우리만의 AI'를 가져야 하는 절박한 이유와 같은 흥미로운 사례들을 통해 현재 AI 시장의 역동적인 상황을 이해할 수 있습니다. 이 책은 단순히 AI 기술을 설명하는 것을 넘어, AI가 만들어나갈 미래 사회의 청사진과 인간의 역할을 깊이 있게 다루며 AI 시대의 큰 그림을 읽어내는 안목을 길러줄 것입니다.