[생존 AI 교양 02] AI는 언어를 어떻게 배웠을까? 토큰과 파라미터의 비밀

2026년 6월 19일조회 201

이 글은 《생존을 위한 최소한의 AI 교양》에서 발췌했습니다.

생존을 위한 최소한의 AI 교양

ISBN 9791124516119지은이 조남호₩25,000

AI는 언어를 어떻게 배웠을까? 토큰과 파라미터의 비밀

요즘은 유튜브 레시피만 보면 누구나 손쉽게 요리를 할 수 있는 시대가 됐죠. 인기 레시피의 공통점은 '밀가루 한 줌'이 아니라 '종이컵으로 한 컵' 또는 '200그램'처럼 정확한 정량을 알려준다는 겁니다. 아무리 훌륭한 재료라도 단위를 모르면 아무 소용이 없는 것처럼, AI가 인간의 지식을 담는 단위를 어떻게 쪼개느냐, 그리고 그 그릇의 크기를 어떻게 결정하느냐는 매우 중요한 문제입니다. 이것이 바로 토큰과 파라미터에 관한 이야기입니다.

▸ AI가 우리 말을 씹어삼키는 단위 : 토큰이란 무엇인가

AI 성능을 이야기할 때면 '2백만 토큰의 컨텍스트 윈도우 덕분에 2000권 분량의 데이터를 한 번에 이해할 수 있다'는 말을 자주 접하게 됩니다. 그런데 막상 이게 무슨 뜻인지 정확히 이해하는 분은 많지 않습니다. '12개의 압력 노즐이 내부 압착 시스템을 통해 더 좋은 밥맛을 제공한다'는 전기밥솥 광고처럼 '무슨 의미인지는 모르지만 최신 기술이 들어간 밥솥인가 보다' 하면서 그냥 넘어갈 수도 있지만, AI 시대에는 토큰의 개념을 이해하지 못하면 새로운 AI 작동 원리를 이해하는 데 걸림돌이 될 수 있습니다.

컴퓨터가 인간의 언어를 다루려면 먼저 '텍스트를 숫자로 어떻게 바꿀 것인가'를 해결해야 합니다. 컴퓨터는 0과 1밖에 모르니까요. 기계에게 '안녕하세요'를 이해시키려면, 먼저 의미 있는 조각으로 쪼개고 각 조각에 고유한 번호를 붙여야 합니다. 이 조각 하나하나를 토큰이라고 부릅니다. 지하철 입장권이나 동전처럼 특정 목적으로 통용되는 교환 단위가 원래 토큰의 뜻인데, AI에서의 토큰도 정확히 그런 의미로 쓰입니다.

오늘날 대부분의 AI는 BPEByte Pair Encoding라는 알고리즘으로 텍스트를 쪼개 토큰으로 만듭니다. 자주 쓰이는 단어나 조합은 통째로 하나의 토큰이 되고, 드물게 쓰이는 단어는 여러 조각으로 나뉩니다. 예를 들어 영어에서 'Hello'는 하나의 토큰이지만, 생소한 단어인 'Tokenization'은 'Token'과 'ization'으로 쪼개집니다. 아예 낯선 단어라면 알파벳 한 글자씩, 혹은 바이트 단위까지 분해될 수 있습니다.

각 언어별로 토큰 사용량의 차이가 있고, 대부분 영어가 가장 효율적입니다.

토큰의 경제학도 중요합니다. AI에게 10개의 토큰을 처리하게 하는 것과 20개를 처리하게 하는 것은 단순히 2배의 차이가 아니라, 전력 소비도 2배로 늘어납니다. 영어는 평균적으로 단어 하나에 1~1.3개의 토큰으로 변환되지만, 한국어나 일본어, 중국어는 영어로 학습된 AI에서 훨씬 더 많은 토큰을 씁니다. 그래서 우리말에 최적화된 독자적인 AI 모델, 이른바 K-파운데이션Foundation Model AI가 필요한 이유도 결국 '적은 토큰으로 한국어를 정확히 이해하는 AI'를 만들기 위해서라고 볼 수 있습니다.

▸ AI의 단기 기억력을 결정하는 것 : 컨텍스트 윈도우

토큰의 개념을 이해했다면 '컨텍스트 윈도우'도 자연스럽게 이해할 수 있습니다. AI가 한 번에 처리할 수 있는 토큰의 최대 개수를 말하는데, 인간도 방금 나눈 대화는 기억하지만 한 시간 전 대화의 세부 내용은 잊어버리는 것처럼, AI도 컨텍스트 윈도우 안의 내용만 '지금 이 대화의 맥락'으로 인식합니다.

2019년에 등장한 GPT-2는 컨텍스트 윈도우가 고작 1,024 토큰이었습니다. A4지 한두 페이지 분량을 처리하면 한계에 달했죠. 그런데 2026년 현재는 1,000만 토큰을 넘는 컨텍스트 윈도우도 제공되고 있습니다. 법률 계약서 전체를 한 번에 검토하거나, 수백 페이지짜리 논문을 분석하거나, 장편 소설의 플롯 일관성을 점검하는 일도 가능해진 거죠.

인간의 뇌 구조를 본떠 만들어진 신경망을 근간으로 AI가 만들어졌기 때문에, 인간도 한참 대화를 하면서도 모든 것을 기억하지 못하는 것과 비슷합니다. 인간에게 망각이라는 것이 있는 것처럼, 컨텍스트 윈도우가 꽉 차면 비워내는 거예요. 챗GPT와 대화를 이어가다 AI가 앞서 나눈 이야기를 기억하지 못하거나 더 이상 처리하지 못하는 경우가 생긴다면, 바로 이 컨텍스트 윈도우의 한계 때문입니다.

▸ AI의 기억을 담는 그릇 : 파라미터란 무엇인가

토큰이 AI가 텍스트를 처리하는 '단위'라면, 파라미터는 AI가 학습한 지식을 저장하는 '그릇'입니다. 수학적으로는 신경망 내부의 연결에 할당된 가중치 값들의 집합이라고 할 수 있는데, 조금 더 쉽게 생각해봅시다.

머릿속에 수십억 개의 단어가 있다고 상상해보세요. 각 단어를 연결하는 뉴런들이 있고, 그 뉴런마다 두 단어가 얼마나 강하게 연관되어 있는지를 나타내는 숫자가 적혀 있습니다. 이 숫자들이 바로 파라미터입니다. AI는 수조 개의 텍스트를 학습하면서 이 숫자들을 끊임없이 조정하죠. '고양이'와 '털', '야옹'이 자주 함께 등장하면 이들을 연결하는 숫자가 강해지고, '고양이'와 '수력 발전'의 연결은 약해집니다. 그렇게 학습이 끝난 뒤, 그 결과물이자 기억의 총합이 파라미터 안에 압축되는 겁니다.

아주 정밀한 오디오를 상상해보세요. 출력되는 소리를 조절하는 나사가 10개뿐인 오디오와, 1,750억 개의 나사가 달린 오디오 중 어느 쪽이 소리가 더 깨끗할까요? 당연히 나사가 많을수록 잡음을 걸러내고, 아주 미세한 소리까지 잡을 수 있겠죠. AI에게 파라미터가 많다는 것은, 그만큼 세상을 아주 정밀하고 입체적으로 표현할 수 있는 조절 나사를 많이 가졌다는 뜻이에요.

GPT의 역사를 보면 파라미터 수가 얼마나 폭발적으로 늘어났는지 실감할 수 있습니다. 2018년 GPT-1의 먼 조상은 1억 1,700만 개의 파라미터를 가졌고, 2019년 GPT-2는 15억 개, 2020년 GPT-3는 1,750억 개에 달했습니다. 파라미터가 많을수록 더 많은 정보를 저장하고 단어 간 상관관계를 더 정밀하게 분석할 수 있습니다. 처음에는 '파라미터를 늘릴수록 AI가 똑똑해진다'는 것이 정설처럼 받아들여졌죠.

▸ 파라미터가 많으면 무조건 좋은가 : 규모의 한계

그렇다면 파라미터 수를 계속 늘리면 AI는 계속 똑똑해질까요? 안타깝게도 그렇게 단순한 문제가 아닙니다. 파라미터가 늘어날수록 학습과 추론에 필요한 컴퓨팅 비용도 함께 커집니다. 당장 결정을 내려야 하는 상황에서, 아는 게 너무 많아 고민이 길어진 나머지 시간 안에 답을 내지 못하는 경우와 비슷하죠. 그래서 이제는 '얼마나 큰 모델을 만들 수 있느냐'보다 '얼마나 효율적인 모델을 만들 수 있느냐'가 더 중요한 경쟁이 되고 있습니다.

이런 고민에서 나온 것이 바로 전문가 혼합Mixture of Experts, MoE 구조입니다. 신경망 안에 여러 '전문가 모듈'을 두고, 입력에 따라 필요한 전문가만 활성화하는 방식이죠. 예를 들어 중국의 저비용 고효율 AI로 알려진 딥시크는 총 6,710억 개의 파라미터를 가지고 있지만, 실제로 각 토큰을 처리할 때는 370억 개만 활성화됩니다. 종합병원에 수십 명의 전문의가 있지만 여러분을 치료할 때는 담당 전문의 한두 명만 투입되는 것과 같은 원리입니다.

아무리 넓고 큰 그릇(파라미터)이 있어도 좋은 재료(데이터)를 정확한 레시피와 단위(토큰)로 손질해서 담지 않으면 맛있는 요리가 될 수 없습니다. 좋은 AI를 만드는 출발점은 결국 좋은 데이터입니다.

📚 더 읽기

[챗GPT 02] 엑셀 in 챗GPT 설치하기
[AI 에이전트 02] 100만 AI가 은밀하게 세상을 통제하는 법
[생존 AI 교양 03] 프롬프트, AI 질문의 기술
▶[생존 AI 교양 02] AI는 언어를 어떻게 배웠을까? 토큰과 파라미터의 비밀
[오픈클로 03] 오픈클로로 주식 데이터 수집하기
[AI 에이전트 01] 이제 봇이 페이스북의 '좋아요'를 누른다
[챗GPT 01] 챗GPT 요금제 한도 확인하기

저자 소개

조남호

삼성SDS에서 26년 넘게 일해온 베테랑 엔지니어다. 삼성전자 물류시스템 개발 및 삼성디스플레이 생산관리시스템 구축 프로젝트를 이끌었고, 지금은 연구개발 부서에서 기술 전략과 교육, AI 에반젤리스트로 활동하고 있다. 국내 IT 분야 최고 권위의 자격인 정보관리기술사를 보유한 그는, 복잡한 시스템의 본질을 꿰뚫어 보는 안목과 현장에서 단련된 실무 감각을 겸비한 보기 드문 전문가다.이런 이력을 바탕으로 그는 지금, AI가 단순한 도구를 넘어 스스로 생각하고 움직이는 시대, 이른바 ‘에이전틱 워크플로우’ 시대를 준비하고 있다. 여러 AI가 서로 협력해 일할 수 있도록 돕는 ‘하네스 엔지니어링’이라는 새로운 방법론을 국내에 알리는 일에도 앞장서고 있다.그가 바라보는 기술은 차가운 논리의 나열이 아니다. 기술은 사람의 마음을 움직이는 하나의 이야기여야 한다고 믿는, ‘스토리텔러 엔지니어’다. 여러 매체와 블로그를 통해 AI 기술의 흐름을 기록하며, 전문가가 아닌 일반 독자도 AI와 IT를 쉽게 이해할 수 있도록 꾸준히 글을 써왔다. 기술을 대중의 언어로 풀어내되 깊이는 결코 놓치지 않는다는 것, 이것이 그가 지켜온 원칙이다. 이러한 신념은 후학을 길러내는 일로도 이어진다. 삼성 청년 소프트웨어 아카데미에서 IT 분야로 첫발을 내딛는 젊은 개발자들을 위해 여러 차례 멘토링과 강연을 해왔다.차갑고 어렵게만 느껴지는 IT 기술을 ‘인문학적 기술론’이라는 따뜻한 언어로 풀어내는 그의 시선은 이 시대가 필요로 하는 새로운 안내자의 역할을 하고 있다.“26년간 삼성SDS 현장에서 한국 IT의 뼈대를 만들어온 개발자이자 기획자. 행정안전부·NIA 자문위원, 구글 제미나이 우수 앰배서더. 이 모든 화려한 이력보다 더 전하고 싶은 건 단 하나입니다. 낯선 AI가 여러분의 든든한 친구가 될 수 있다는 것. 이 책은 그 증명입니다.”

📚《생존을 위한 최소한의 AI 교양》 자주 묻는 질문

Q.AI 시대에 챗GPT 외에 알아야 할 필수적인 교양 지식이 있나요?

AI 시대에 챗GPT 사용법을 아는 것은 중요하지만, 그것만으로는 충분하지 않습니다. 챗GPT가 어떻게 작동하는지 원리를 이해하고, 더 나아가 AI 기술의 발전 방향과 그것이 우리 사회에 미칠 영향에 대한 넓은 안목을 갖추는 것이 진정한 'AI 교양'이라 할 수 있습니다. 예를 들어, 챗GPT가 내 말을 어떻게 이해하는지, AI 에이전트나 소버린 AI 같은 새로운 개념들이 무엇을 의미하는지 등을 알아야 합니다. 이러한 지식은 단편적인 사용법을 넘어 AI 시대를 살아가는 데 필요한 본질적인 통찰력을 제공하며, 빠르게 변화하는 기술 환경 속에서 도태되지 않고 앞서나갈 수 있는 기반이 됩니다. 《생존을 위한 최소한의 AI 교양》은 AI를 이해하기 위한 필수 뼈대 지식만을 담아, 단순히 사용법을 넘어 AI 시대의 본질적인 변화를 이해하고 미래를 대비할 수 있도록 돕는 데 초점을 맞추고 있습니다.

Q.AI의 작동 원리가 너무 어려울 것 같아서 접근하기 망설여져요. 쉽게 이해할 방법이 없을까요?

AI의 작동 원리는 복잡하게 들릴 수 있지만, 어렵고 딱딱한 기술 용어 대신 일상적인 비유와 흥미로운 스토리텔링을 통해 훨씬 쉽게 이해할 수 있습니다. 예를 들어, 책 《생존을 위한 최소한의 AI 교양》에서는 AI가 배우는 방식을 '수만 번 넘어지며 자전거 타기를 배우는 아이'에 비유하고, 수천억 개의 지식 조절 장치를 '정밀 오디오에 달린 수천억 개의 나사'에 비유하여 독자들이 직관적으로 AI의 학습 메커니즘을 파악할 수 있도록 돕습니다. 또한, 챗GPT의 핵심 기술을 만든 사람들의 이야기, 즉 열두 살에 집을 뛰쳐나와 공원에서 노숙하면서도 AI의 씨앗이 된 논문을 써낸 월터 피츠나 챗GPT의 뼈대를 만든 구글 연구원들의 에피소드 등을 통해 딱딱한 개념을 한 편의 영화처럼 기억에 새길 수 있습니다. 이처럼 기술의 역사와 개발 과정 속 인물들의 이야기를 통해 AI 원리를 이해하면, 단순히 개념을 외우는 것이 아니라 잊히지 않는 장면처럼 마음속에 각인될 것입니다.

Q.AI 에이전트, 소버린 AI 같은 최신 AI 트렌드를 알고 싶어요. 어떤 책을 읽어야 할까요?

AI 에이전트, 소버린 AI와 같은 최신 AI 트렌드는 단순히 기술적 개념을 넘어 미래 사회의 변화를 이해하는 데 필수적인 요소입니다. 이러한 개념들은 AI가 단순히 명령을 수행하는 도구를 넘어 자율적으로 목표를 설정하고 실행하는 주체로 발전하고 있음을 보여줍니다. 시중에는 많은 AI 관련 서적들이 있지만, 대부분 특정 기술의 사용법을 다루거나 사전처럼 모든 개념을 나열하는 경향이 있습니다. 하지만 우리는 이러한 트렌드를 단순히 나열하는 것을 넘어, 그 원리와 배경, 그리고 앞으로의 파급력을 이해해야 합니다. 《생존을 위한 최소한의 AI 교양》은 챗GPT의 원리부터 시작하여 AI가 혼자 일하는 미래, 즉 여러 AI가 협력하고 코딩 없이 말로 프로그램을 만들며, AI들끼리 대화를 주고받는 시대까지를 조망합니다. 이 책을 통해 독자들은 전 세계 AI 왕좌의 전쟁, 딥씨크 쇼크와 같은 사건들을 이해하고, 대한민국이 '우리만의 AI'를 가져야 하는 절박한 이유까지 깨달으며 AI 시대의 주요 흐름을 정확하게 파악할 수 있을 것입니다.

Q.AI 관련 책을 여러 권 읽었지만, 지식이 파편화되어 있다는 느낌이 들어요. 이 지식들을 하나로 꿰는 방법이 있을까요?

AI 관련 책을 여러 권 읽으셨음에도 지식이 파편화되어 있다고 느끼신다면, 이는 많은 독자들이 겪는 어려움 중 하나입니다. AI 분야는 워낙 넓고 빠르게 변화하기 때문에, 각각의 책들이 다루는 특정 개념이나 도구에만 집중하다 보면 전체적인 그림을 놓치기 쉽습니다. 이러한 파편화된 지식을 하나로 꿰기 위해서는 AI라는 거대한 세계의 '지도'를 제공하는 책이 필요합니다. 즉, AI의 핵심적인 원리와 발전 과정을 체계적으로 이해하고, 각 기술들이 어떻게 연결되어 있는지를 파악할 수 있도록 돕는 도구가 필요하죠. 《생존을 위한 최소한의 AI 교양》은 바로 이 지점에 초점을 맞춥니다. 이 책은 AI를 이해하기 위한 '필수 뼈대'만 남겨, 이미 AI 책을 읽어본 독자에게는 흩어진 지식을 하나로 꿰는 강력한 도구가 됩니다. 챗GPT의 원리부터 AI 혼자 일하는 미래까지, AI 시대의 큰 흐름과 핵심 개념들을 유기적으로 연결하여 전체적인 안목을 키워줄 것입니다.

Q.AI 시대에 인간은 무엇을 해야 하는지에 대한 고민이 많습니다. 이 책이 해답을 줄 수 있을까요?

AI 시대에 인간이 무엇을 해야 하는지에 대한 고민은 기술 발전과 더불어 중요한 화두가 되고 있습니다. AI가 단순 반복 업무를 넘어 창의적인 영역까지 확장되면서, 많은 사람들이 자신의 역할에 대해 의문을 품게 됩니다. 《생존을 위한 최소한의 AI 교양》은 이러한 고민에 대해 정직하게 마주하며, AI 혼자 일하는 미래에 인간이 지녀야 할 역할과 자세를 탐색합니다. 책은 여러 AI가 협력하여 일을 나누고, 코딩 없이 말로 프로그램을 만들며, AI들끼리 대화를 주고받는 시대가 도래할 것임을 보여줍니다. 이러한 미래 속에서 인간은 단순히 AI를 사용하는 것을 넘어, AI가 해결할 수 없는 영역, 즉 인간 고유의 창의성, 비판적 사고, 윤리적 판단, 그리고 복잡한 문제 해결 능력에 집중해야 함을 시사합니다. 이 책은 AI 기술의 원리와 동향을 깊이 있게 이해함으로써, AI가 인간의 역할을 대체하는 것이 아니라 보완하고 확장하는 미래를 준비하는 데 필요한 안목과 통찰력을 제공합니다.

Q.AI 관련 기술 용어들이 너무 어렵고 딱딱하게 느껴져서 쉽게 이해하고 싶은데, 도움이 될 만한 책이 있나요?

AI 관련 기술 용어들은 낯설고 복잡하게 느껴질 수 있어 많은 분들이 진입 장벽을 느낍니다. 하지만 용어 자체에 매몰되기보다는 그 배경에 담긴 원리와 의미를 파악하는 것이 중요합니다. 《생존을 위한 최소한의 AI 교양》은 이러한 어려움을 해소하기 위해 딱딱한 기술 용어를 일상적인 언어와 흥미로운 비유로 풀어 설명합니다. 예를 들어, AI가 글뿐 아니라 사진과 소리까지 이해하게 된 과정을 '텍스트의 감옥을 탈출한 눈과 귀 이야기'로 설명하고, 엉뚱한 답을 막기 위해 전용 도서관을 붙여주는 기술을 '기억의 한계를 넘어서는 법'으로 풀이하는 식입니다. 이러한 설명 방식은 독자들이 개념을 외워야 할 문제가 아니라, 자연스럽게 이해하고 기억할 수 있는 장면으로 만들어줍니다. 단순히 기술 용어를 나열하는 것이 아니라, 그 용어가 탄생하게 된 배경과 발전 과정을 스토리텔링 방식으로 전달하여 AI의 핵심 원리를 쉽게 체득할 수 있도록 돕는 것이 이 책의 강점입니다.

Q.AI 분야의 큰 그림과 흐름을 이해하고 싶은데, 어떤 책이 좋을까요?

AI 분야는 너무나 방대하고 빠르게 변화하기 때문에, 개별적인 기술이나 사용법에 매몰되기보다는 전체적인 큰 그림과 흐름을 이해하는 것이 중요합니다. 그래야만 AI 시대의 변화를 예측하고 능동적으로 대응할 수 있습니다. 《생존을 위한 최소한의 AI 교양》은 바로 이러한 'AI 시대의 지도'를 제공하는 데 초점을 맞춘 책입니다. 챗GPT의 원리라는 출발점에서 시작하여, AI 기술을 만든 사람들의 이야기, 전 세계 AI 왕좌의 전쟁, 그리고 AI 혼자 일하는 미래에 이르기까지 AI 발전의 주요한 맥락과 흐름을 일목요연하게 정리해줍니다. 구글의 다급한 반격, 딥씨크 쇼크, 엔비디아가 AI 제국이 된 이유, 그리고 대한민국이 '우리만의 AI'를 가져야 하는 절박한 이유와 같은 흥미로운 사례들을 통해 현재 AI 시장의 역동적인 상황을 이해할 수 있습니다. 이 책은 단순히 AI 기술을 설명하는 것을 넘어, AI가 만들어나갈 미래 사회의 청사진과 인간의 역할을 깊이 있게 다루며 AI 시대의 큰 그림을 읽어내는 안목을 길러줄 것입니다.