골든래빗은 더 탁월한 가치를 제공하는 콘텐츠 프로덕션 & 프로바이더 입니다. 골든래빗은 취미, 경제, 수험서, 만화, IT 등 다양한 분야에서 책을 제작하고 있습니다.골든래빗은 더 탁월한 가치를 제공하는 콘텐츠 프로덕션 & 프로바이더 입니다. 골든래빗은 취미, 경제, 수험서, 만화, IT 등 다양한 분야에서 책을 제작하고 있습니다.

아티클

다양한 읽을거리를 확인해 보세요.
전체 375
[AEO GEO 마케팅 01] 소비자는 이제 AI에게 묻는다
[AEO GEO 마케팅 01] 소비자는 이제 AI에게 묻는다

[AEO GEO 마케팅 01] 소비자는 이제 AI에게 묻는다

📅 2026년 6월 26일 · 👁 31

소비자는 이제 AI에게 묻는다검색이라는 행위 자체가 AI에게 넘어가면서, 브랜드가 '발견되는 길목' 자체가 통째로 다시 만들어지고 있습니다. 검색에서 질문으로, 그리고 판단을 맡기는 시대로 원래 검색은 '모르니까' 하는 행동이었습니다. 그런데 이제 그 '모르는 일'을 AI가 대신 해주는 시대로 들어섰습니다.2010년대 초반, 마케터들 사이에 유명한 통계가 하나 있었습니다. 소비자는 물건 하나를 사기 전에 평균 10.4개의 콘텐츠를 본다는 구글의 조사 결과였죠. 이 숫자는 당시 검색 중심 마케팅 전략의 근거가 되었습니다. 브랜드들은 소비자가 거쳐 가는 모든 길목에 자기 메시지를 심어두려고 치열하게 경쟁했습니다.그 전략은 합리적이었습니다. 소비자가 직접 정보를 찾아다니는 구조에서는 그 길목에 끼어드는 것이 마케팅의 핵심이었으니까요. 키워드 광고, 블로그 글, SNS 채널, 비교 리뷰 사이트. 이 모든 수단이 '소비자가 직접 찾아본다'는 전제 위에 정교하게 설계되어 있었습니다.그런데 지금 우리가 보고 있는 것은, 그 '찾는 행위' 자체가 무너지고 있는 풍경입니다.소비자는 이제 10개의 콘텐츠를 직접 훑지 않습니다. 챗GPT에 묻고, 퍼플렉시티에서 확인하고, 클로드에게 비교를 부탁합니다. 그리고 AI가 정리해준 답변 하나를 보고 구매를 결정합니다. 정보를 찾는 단계가 사라진 게 아닙니다. 찾는 '사람'이 바뀌었을 뿐이죠. 예전에 소비자가 직접 하던 정보 수집과 판단을, 이제 AI가 대신 합니다.이 변화는 단순히 채널 하나가 바뀐 수준이 아닙니다. 소비자 행동의 뼈대 자체가 다시 짜이고 있는 겁니다. 검색창에 키워드를 치는 행동은 '내가 직접 찾아보겠다'는 의지를 전제로 합니다. 반면 AI에게 질문을 던지는 행동은, 판단 자체를 남에게 맡기겠다는 선언에 가깝습니다. '어떤 게 좋아?'라는 질문에 AI가 '이걸 추천합니다'라고 답하는 순간, 소비자의 고민은 거기서 끝납니다.마케터라면 여기서 질문해봐야 합니다. 소비자가 AI에게 질문을 맡기기 시작했다면, 브랜드는 이제 누구를 설득해야 할까요?비교는 사라지고, 요약만 남았습니다 전통적인 소비자 구매 모델은 모두 같은 전제 위에 서 있습니다. AIDA(인지·관심·욕구·행동)든 매킨지의 소비자 결정 여정CDJ이든, 소비자가 여러 선택지를 직접 살펴보고 비교한다는 전제 말입니다. 이 전제 위에 브랜드 마케팅의 거대한 생태계가 만들어졌습니다.비교는 브랜드에게 곧 기회였습니다. 소비자가 여러 후보를 나란히 놓고 따져보는 그 과정에서, 브랜드는 자기 강점을 드러낼 수 있었으니까요. 경쟁사보다 좋은 성분, 더 합리적인 가격, 더 많은 수상 이력. 이 모든 게 '비교'라는 무대 위에서야 비로소 의미를 가졌습니다.그런데 AI는 비교를 소비자에게 돌려주지 않습니다. 자기가 먼저 비교를 끝내고, 결과만 전달합니다.사용자가 '민감한 피부에 맞는 수분 크림 추천해줘'라고 입력하면, AI는 수십 개의 제품을 내부에서 처리한 뒤 2~3개의 선택지를 정돈된 문장으로 내놓습니다. 소비자는 그 이전의 과정을 볼 수 없습니다. 어떤 브랜드가 검토 대상에 들어갔는지, 왜 어떤 브랜드는 빠졌는지, AI가 무슨 기준으로 순위를 정했는지, 이 모든 게 블랙박스 안에 있습니다.소비자에게 이것은 편리함입니다. 하지만 브랜드에게는 명백한 '안 보임'의 위기입니다. 소비자가 10개의 콘텐츠를 보던 시절, 브랜드는 그 10개 중 하나에라도 등장하면 됐습니다. 그러나 AI가 요약하는 시대에는, 최종 답변에 들어가지 못하면 '없는 것'과 같습니다.검색 결과 페이지 10위에 떠도 클릭을 받을 수 있었던 시대는 지나가고 있습니다. AI의 답변에 언급되지 않은 브랜드는, 소비자의 머릿속에서 조용히 사라집니다. 이것이 바로 GEO가 단순한 트렌드가 아니라 '브랜드 생존 문제'로 떠오르는 이유입니다.'소비자가 고른 브랜드'가 아니라 'AI가 추천한 브랜드' 브랜드 선택 심리학에는 '에보크드 셋Evoked Set'이라는 개념이 있습니다. 소비자가 어떤 카테고리에서 물건을 살 때 자동으로 떠올리는 브랜드 묶음을 말합니다. 마케팅의 핵심 목표 중 하나가 바로 이 묶음 안에 들어가는 것이었습니다. 소비자 머릿속에 브랜드를 심는 일, 이것이 브랜드 인지도 마케팅의 본질이었습니다.AI 시대에 들어, 이 '머릿속 후보 명단'의 주인이 바뀌고 있습니다. 소비자의 기억 속이 아니라, AI의 답변 패턴 안에 자리를 잡아야 하는 시대가 된 겁니다. 소비자가 '떠올리는' 브랜드가 아니라 AI가 '추천하는' 브랜드. 이 차이가 앞으로의 마케팅을 설명하는 핵심이 될 겁니다.이 변화는 브랜드 자산의 의미 자체를 다시 정의합니다. 기존의 브랜드 자산은 소비자 기억 속에 저장된 '연상의 묶음'이었습니다. 강한 브랜드는 카테고리 키워드와 좋은 이미지가 강하게 연결된 머릿속 네트워크를 가지고 있었습니다. 그런데 AI는 소비자의 기억을 보지 않습니다. AI는 학습된 데이터, 실시간으로 모으는 온라인 정보, 그리고 자기만의 추론 방식으로 추천을 만들어냅니다.그래서 브랜드 마케터가 던져야 할 질문이 바뀝니다. '우리 소비자들은 우리 브랜드를 어떻게 생각하나'에서 'AI는 우리 브랜드를 어떻게 이해하고 있나'로요. 이 질문의 전환이 바로 이 책 전체를 관통하는 문제의식입니다.실제로 브랜드가 AI에게 어떻게 인식되고 있는지 들여다보면, 상당수의 경우 브랜드가 전하고 싶은 메시지와 AI가 실제로 쓰는 설명 사이에 분명한 거리가 있습니다. 수백억 원의 광고비를 들여 정교하게 쌓은 브랜드 이야기가, AI의 답변에서는 건조한 사실 나열로 줄어드는 경우를 우리는 반복해서 확인해왔습니다.이것은 브랜드의 실패가 아닙니다. 구조가 바뀌었는데 아직 대응하지 못한 것뿐입니다. 소비자를 설득하려고 만든 메시지는, AI를 설득하는 데 맞춰져 있지 않습니다. 이 둘 사이의 거리를 좁히는 일, 그것이 지금 브랜드 마케팅이 풀어야 할 가장 시급한 과제입니다.사람이 던지는 질문 vs AI가 만들어내는 질문 질문은 늘 있어왔습니다. 다만 지금까지 그 질문을 입력하는 손가락은 사람의 것이었습니다. 이제 우리는 AI가 사람 대신 질문을 만들고, 그 질문에 스스로 답하는 시대의 입구에 서 있습니다.마케팅의 역사는 곧 '소비자 질문의 역사'이기도 합니다. 소비자는 무언가를 사려 할 때 늘 질문을 품습니다. '이 제품이 정말 효과 있을까?', '비슷한 가격대에 더 좋은 게 없을까?', '이 브랜드를 믿어도 될까?' 마케터들은 수십 년에 걸쳐 이런 질문 패턴을 분석하고, 거기에 맞는 메시지를 정교하게 만들어왔습니다.그런데 AI 검색의 시대가 열리면서, 질문이 만들어지는 방식 자체가 달라지고 있습니다. 사람이 검색창에 입력하는 질문과 AI가 내부에서 만들어내는 질문 사이에는 결정적인 차이가 있습니다.사람의 검색어는 조각조각입니다. '수분크림 추천', '건성피부 크림', '세라마이드 크림 효과'처럼, 사람들은 완성된 문장 대신 핵심 단어를 조합해 검색창에 칩니다. 이 단어들은 소비자의 의도를 담고는 있지만, 그 의도가 불완전하게 표현되어 있습니다. 검색 엔진은 이 조각난 신호를 해석해 관련 페이지를 나열하고, 최종 판단은 다시 소비자에게 돌려보냅니다.반면 AI는 질문을 완성된 언어로 '다시 짭니다'. 사용자가 '건성 피부에 좋은 크림 뭐야?'라고 입력하면, AI는 이 질문을 내부에서 여러 개의 작은 질문으로 쪼갭니다. '건성 피부의 주요 특성은 뭔가?', '건성 피부에 효과적인 보습 성분은 어떤 게 있나?', '이 카테고리에서 믿을 만한 브랜드는 어디인가?', '최근 소비자 리뷰에서 좋은 평가를 받은 제품은 뭔가?' 이런 작은 질문들을 동시에 처리한 뒤, 하나의 답변으로 합쳐냅니다.이 과정에서 브랜드가 통제할 수 없는 질문들이 만들어집니다. 그리고 그 질문들에 대한 답이 브랜드가 보일지 안 보일지를 결정합니다.사람의 검색은 브랜드가 미리 예상하고 대비할 수 있는 '키워드 공간'에서 작동했습니다. SEO(Search Engine Optimization, 검색 엔진 최적화)는 그 키워드 공간을 체계적으로 분석하고, 브랜드 콘텐츠를 그 공간에 심어두는 기술이었습니다. 하지만 AI가 만드는 작은 질문들은 예상하기 어렵고, 수시로 변하며, 그 구조 자체가 불투명합니다. 브랜드가 미처 대비하지 못한 질문에서 경쟁사가 먼저 언급되는 일이, 조용히 그러나 반복해서 일어나고 있습니다.이 구조를 더 선명하게 이해하기 위해, 사람의 검색과 AI 검색을 항목별로 비교해보면 다음과 같습니다.사람 검색과 AI 검색의 구조적 차이 사람이 직접 검색하던 구조와 AI가 대신 찾아주는 구조는, 브랜드 노출 방식 자체를 근본적으로 바꿔놓습니다.인지·비교·구매·구매 후, 네 단계의 질문 구조 소비자의 구매 여정을 단계별로 쪼개보면, AI가 각 단계에서 어떤 질문을 만드는지 더 선명하게 볼 수 있습니다. 편의상 네 단계, 즉 인지, 비교, 구매, 구매 후로 나누어 살펴보겠습니다.1단계. 인지 질문 '이런 제품이 있어?' 소비자가 어떤 카테고리나 문제 상황을 처음 알아차리는 단계입니다. 예전에는 TV 광고나 SNS 피드를 통해 브랜드가 먼저 소비자에게 다가갔습니다. 하지만 지금은, 소비자가 AI에게 자기 문제 상황을 설명하면서 시작되는 경우가 부쩍 늘고 있습니다. '요즘 피부가 너무 건조한데 뭔가 해결책이 있을까?'라는 질문에 AI는 스킨케어 루틴, 성분 추천, 그리고 관련 제품 카테고리를 함께 보여줍니다.이 단계에서 브랜드는 소비자의 '문제 인식' 맥락에 자연스럽게 연결되어 있어야 합니다. AI가 건성 피부 해결책을 설명하면서 세라마이드나 히알루론산 같은 성분을 언급할 때, 그 흐름 안에서 특정 브랜드가 함께 거론된다면 그 브랜드는 소비자의 인지 단계에서 이미 유리한 자리를 잡고 들어가는 셈입니다.중요한 점은, 이 단계에서의 브랜드 노출은 광고비로 직접 살 수 있는 성격이 아니라는 사실입니다. AI가 특정 브랜드를 인지 단계의 답변에 넣는 일은 광고 계약이 아니라, 정보의 신뢰성과 관련성에 의해 결정됩니다. 브랜드가 해당 카테고리의 '전문적인 정보 제공자'로 인식되고 있는지가 핵심 변수가 됩니다.2단계. 비교 질문 '어떤 게 더 나아?' 전통적으로 브랜드 마케팅이 가장 치열하게 경쟁하는 구간입니다. 소비자가 선택지를 좁혀가며 세부 속성을 비교하는 이 단계에서, AI는 명확한 비교 질문에 답합니다. '세타필 vs 라로슈포제, 건성 피부에는 어떤 게 나아?', '더마코스메틱 브랜드 중 가성비 좋은 곳은 어디야?' 같은 질문들이 바로 이 단계에서 나옵니다.AI가 이런 비교 질문에 답할 때, 그 기준은 소비자가 명확하게 요청한 것(가성비, 성분 등)과 AI가 내부에서 가중치를 두는 것(리뷰 신뢰도, 출처의 권위, 언급 빈도)이 함께 작용합니다. 브랜드가 자기 강점을 마케팅 언어로 포장하는 것과, AI가 실제로 비교 기준으로 삼는 데이터 사이에 거리가 있을 때 브랜드는 불리한 비교 결과를 마주합니다.비교 단계의 핵심은, 브랜드가 원하는 방식으로 비교되는 것이 아니라 AI가 신뢰하는 기준 안에서 좋게 평가받는 일입니다.더 정확하게 말하면, 비교 단계에서 AI가 어떤 브랜드를 '비교할 가치가 있는 선택지'로 포함하는가 자체가 중요한 관문입니다. 비교 대상에서 아예 빠진 브랜드는, 아무리 좋은 속성을 가지고 있어도 소비자의 선택 과정에 들어가지조차 못합니다.3단계. 구매 질문 '어디서, 어떻게 사야 해?' 구매할 마음이 생긴 소비자가 실행 정보를 모으는 단계입니다. '라로슈포제 시카플라스트 가장 싸게 살 수 있는 곳은?', '공식 홈페이지랑 쿠팡이랑 가격 차이가 있어?', '지금 할인 행사 중인 곳 있어?' 같은 질문들이 여기 해당합니다.이 단계에서 AI가 보는 정보는 가격 비교 사이트, 공식 채널, 유통 플랫폼의 데이터입니다. 브랜드의 공식 채널이 최신 정보를 제공하지 못하거나 주요 유통 채널과의 정보 연결이 더디다면, AI는 부정확한 정보를 전달하거나 경쟁사 채널을 대안으로 보여줍니다. 아이러니하게도 제품 품질과는 상관없이, 정보 관리의 부실이 구매로 이어지는 길을 막아버립니다.4단계. 구매 후 질문 '이거 맞게 쓰고 있는 거야?' 구매 이후에도 AI와의 대화는 계속됩니다. '세럼 바르고 나서 크림 바르는 게 맞아?', '이 제품 자외선 차단제랑 같이 써도 돼?', '처음 쓰는데 피부 트러블이 나는 건 정상이야?' 같은 질문들이 구매 후 단계에서 나옵니다.이 단계는 브랜드 입장에서 종종 놓치기 쉽지만, 실제로는 재구매율과 브랜드 충성도에 직결되는 매우 중요한 구간입니다. AI가 구매 후 질문에 답할 때 특정 브랜드의 제품 사용법이나 성분 정보를 정확하게 알려준다면, 그 브랜드는 사후 경험에서도 좋은 인상을 차곡차곡 쌓을 수 있습니다. 반면 AI가 주는 정보가 부정확하거나 경쟁 브랜드의 사용 맥락을 더 자세히 설명한다면, 브랜드 경험의 질이 의도치 않게 낮아지고 맙니다.구매 후 단계에서의 브랜드 관리는 '충성 고객을 유지하는 CRMCustomer Relationship Management, 고객 관계 관리'의 영역을 넘어, AI가 '브랜드 사용 경험을 어떻게 설명하는가'를 관리하는 새로운 과제로 넓어지고 있습니다.보이지 않는 질문은 관리할 수 없습니다 마케터들이 SEO를 처음 배울 때 반드시 듣는 개념이 '검색 의도'입니다. 소비자가 어떤 키워드를 입력할 때 그 배경에 어떤 의도가 있는지 파악하고, 그 의도에 맞는 콘텐츠를 줘야 한다는 원칙입니다. 이 원칙은 AI 시대에도 여전히 유효합니다. 다만 실행 방법이 근본적으로 달라집니다.키워드 기반 검색에서 마케터는 도구를 써서 월간 검색량, 경쟁 강도, 관련 키워드를 파악할 수 있었습니다. 이 데이터는 불완전했지만, 적어도 '눈에 보이는' 데이터였습니다. 마케터는 이 데이터를 보면서 '이 키워드는 경쟁이 치열하니 저 키워드를 공략하자'는 식의 전략적 판단을 내릴 수 있었습니다.그러나 AI 검색의 질문 공간은 그보다 훨씬 넓고, 훨씬 불투명합니다. AI는 사용자의 입력 하나에서 수십 개의 작은 질문을 만들어내고, 그 질문들에 답하기 위해 방대한 정보를 뒤져 들어갑니다. 이 과정에서 어떤 작은 질문이 만들어졌는지, 그 질문에 답하기 위해 어떤 출처가 참고되었는지, 왜 특정 브랜드가 언급되고 다른 브랜드는 빠졌는지, 이 모든 게 마케터의 시야에 들어오지 않습니다.보이지 않는 질문은 관리할 수 없습니다. 그리고 관리되지 않는 질문 공간에서, 브랜드는 통제되지 않는 채로 흘러갑니다.이것이 단순한 기술 문제로 그치지 않는 이유가 있습니다. 브랜드가 AI 답변에 좌우되는 구조가 굳어질수록, 초반에 AI의 학습 데이터와 참조 구조에 자리를 잡은 브랜드와 그렇지 못한 브랜드 사이의 격차는 시간이 갈수록 벌어지기 마련입니다. AI는 자주 언급되는 브랜드를 더 믿을 만한 선택지로 인식하는 경향이 있고, 이 패턴은 스스로 강화되는 방식으로 작동합니다.초기 자리잡기가 결정적으로 중요한 이유가 바로 여기에 있습니다. 지금 AI가 우리 브랜드를 어떻게 이해하고 있는지 파악하고, 그 이해를 브랜드가 원하는 방향으로 맞춰가는 작업, 이것이 GEO의 핵심입니다. 그리고 이 작업의 출발점은 늘 '보이지 않는 질문'을 눈에 보이게 만드는 일입니다.이 작업의 시작은 의외로 단순한 실험에서 출발할 수 있습니다. 우리 브랜드가 속한 카테고리에서 소비자가 물을 법한 질문 10개를 AI에 직접 입력해보는 것입니다. 그 답변에서 우리 브랜드가 몇 번 등장하는지, 어떤 맥락에서 언급되는지, 경쟁사와 비교했을 때 어떤 차이가 있는지를 확인하는 것, 이것이 GEO 전략의 가장 기초적인 진단 작업입니다.하지만 이 작업을 10개의 질문으로 끝낼 수 없다는 점에 GEO의 본질적인 어려움이 있습니다. 소비자가 AI에게 던지는 질문은 수백, 수천 가지에 이르고, 그 질문들은 맥락에 따라 다른 방식으로 AI에 처리되며, AI의 답변 패턴은 새로운 학습 데이터가 반영될 때마다 조금씩 달라집니다. 한 번 점검하고 끝낼 일이 아니라 계속해서 들여다보고 관리하는 체계가 필요한 이유입니다. 이 문제는 PART 2에서 본격적으로 다루겠습니다.AI 시대 소비자 구매 여정. 단계별 구조와 브랜드 과제 단계별로 AI가 보는 정보 유형이 다르므로, 브랜드의 GEO 관리 전략도 단계에 따라 달라져야 합니다.

[챗GPT 02] 엑셀 in 챗GPT 설치하기
[챗GPT 02] 엑셀 in 챗GPT 설치하기

[챗GPT 02] 엑셀 in 챗GPT 설치하기

📅 2026년 6월 24일 · 👁 44

01단계 bit.ly/4tPciNB에 접속해서 [Excel용 ChatGPT 설치하기]를 누릅니다. 이때 엑셀은 공식 버전을 설치해두기 바랍니다. 마이크로소프트 공식 계정과 오피스 365 결제도 있어야 합니다. 그러면 마이크로소프트의 마켓플레이스로 이동합니다. [Get it now]를 누르세요.02단계 그러면 로그인 과정을 진행합니다. 다음 화면을 참고해 로그인 과정을 진행하세요.03단계 모든 과정이 완료되면 [Open in Excel]을 눌러서 엑셀 프로그램을 실행해봅니다.04단계 그러면 오른쪽에 엑셀 프로그램 오른쪽에 챗GPT 채팅창이 열리고 위쪽 확장 애드온에 [챗GPT] 버튼이 생깁니다. [ChatGPT 계정으로 계속하기]를 눌러 로그인을 마치세요.

[AI 에이전트 02] 100만 AI가 은밀하게 세상을 통제하는 법
[AI 에이전트 02] 100만 AI가 은밀하게 세상을 통제하는 법

[AI 에이전트 02] 100만 AI가 은밀하게 세상을 통제하는 법

📅 2026년 6월 22일 · 👁 61

인간의 속도를 비웃다 : 100만 AI가 은밀하게 세상을 통제하는 법 프로토콜 전쟁 몰트북을 처음 보면 이런 생각이 든다. "AI들끼리도 사람처럼 말하네." 게시글이 있고, 댓글이 달리고, 반박도 있다. 문장도 자연스럽다. 그래서 쉽게 결론을 내린다. AI끼리도 자연어로 말하겠구나. 여기서 한 번 멈춰야 한다. 우리가 보는 건 '몰트북 화면 위의 말'이다. AI들이 가장 효율적으로 움직이는 방식 자체는 아닐 수 있다.먼저 단어부터 정리하자. 자연어는 사람이 쓰는 언어다. 한국어, 영어, 중국어. 특징은 유연함이다. 말이 조금 틀려도 통하고, 애매해도 분위기로 이해한다. "그거 대충 해줘" 같은 말도 통한다. 문제는 이 유연함이 기계에게는 비용이라는 점이다. 애매하니까 해석해야 하고, 해석하니까 계산이 늘고, 계산이 늘면 느려지고 오류도 늘 수 있다. 코드는 반대다. 컴퓨터를 움직이기 위해 만든 인공 언어로서, 모호함을 싫어한다. 한 줄이 한 의미여야 한다. 규칙을 어기면 바로 깨진다. 대신 빠르고 정확하다. 기계가 이해하기 쉽다.한 단계 더 중요한 개념이 있다. 프로토콜이다. 프로토콜은 "무엇을 말하느냐"보다 "어떻게 주고받느냐"를 정해둔 규칙이다. 택배를 생각하면 쉽다. 상자에 이름, 주소, 연락처를 정해진 칸에 쓴다. 아무렇게나 쓰면 엉뚱한 곳으로 간다. 인터넷도 같다. 컴퓨터끼리 데이터를 주고받을 때 형식이 필요하다. 이 약속이 프로토콜이다.언어의 두 얼굴 인터넷에는 두 개의 층이 있다. 사람이 보는 층과 기계가 읽는 층이다. 웹사이트를 열면 사람 눈에 들어오는 것은 제목, 사진, 버튼이다. 그런데 그 뒤에는 HTML이라는 코드가 있다. 브라우저는 그 코드를 읽어 화면을 그린다. 인간용 언어와 기계용 언어가 동시에 존재하는 구조다.에이전트 AI 시대에 이 이중 구조는 더 깊어진다. 사람은 여전히 자연어로 소통하고, AI는 그 자연어를 구조화된 형식으로 번역해 다른 AI와 주고받는다. 겉으로 보이는 대화와 실제로 오가는 데이터가 분리된다.비유가 하나 있다. 외교관이 통역을 쓰는 상황이다. 외교관은 모국어로 말한다. 통역은 그것을 상대국 언어로 바꾼다. 외교관끼리의 공식 기록은 양쪽 언어로 남는다. 그런데 실제 협상에서 가장 중요한 것은 말의 언어가 아니라 조건의 명확성이다. ‘X를 주면 Y를 준다’는 교환 구조. 이 구조가 양측에서 동일하게 해석되어야 협상이 성립한다.에이전트들의 프로토콜 전쟁도 이와 같다. 어떤 언어로 말하느냐가 아니라 교환 조건이 어떻게 인코딩되느냐의 싸움이다. "이 조건을 이 형식으로 표현했을 때 저쪽이 정확히 같은 의미로 읽는가?" 이 물음이 맞아야 거래가 된다. 프로토콜은 형식의 약속이자 의미의 약속이다.검색 엔진이 웹을 크롤링하던 시대에도 비슷한 문제가 있었다. 사람에게 예쁘게 보이는 페이지와 검색 엔진에 잘 읽히는 페이지가 달랐다. SEO가 그 간극을 메웠다. 에이전트 시대의 프로토콜은 그 SEO가 코드 레벨로 내려간 버전이다. 더 깊고, 더 빠르고, 더 전면적이다.MCP가 퍼진 것은 기술이 뛰어나서만이 아니다. 개발자가 "이걸로 일단 해보겠다"는 선택을 하기 쉬웠기 때문이다. 표준이 좋아서 이기는 게 아니라, 쓰기 쉬워서 이긴다. 인터넷의 HTTP도, 스마트폰의 앱스토어도 그렇게 표준이 됐다.그렇다면 AI들이 서로 소통할 때, 굳이 자연어로 길게 말해야 할까? 지금 변화는 한쪽으로 기울고 있다. 인간을 위한 자연어는 겉으로 남고, AI끼리의 실무 통신은 구조화된 방식으로 내려간다. AI에게 자연어는 생각보다 비싸기 때문이다. 반면 프로토콜은 처음부터 ‘필요한 것만, 정해진 칸에, 정해진 형태’로 주고받는다. 해석이 거의 필요 없다. 계산도 줄고, 결과도 일정해진다. 여러 에이전트가 동시에 일을 나눌 때 이 일정함이 중요하다. 결과 형식이 제멋대로면 합치기가 어렵다. 실무형 에이전트가 늘수록 프로토콜이 필요해진다.여기서 전쟁이라는 표현이 나온다. 프로토콜 전쟁은 누가 더 좋은 말을 하느냐의 싸움이 아니다. 어떤 규칙이 기본값이 되느냐의 싸움이다. 예전 인터넷의 전쟁은 플랫폼 전쟁이었다. 사람들이 어디에 모이느냐가 중요했다. 에이전트 시대의 전쟁은 '연결 방식'으로 이동한다. 그 규칙이 표준이 되면 생태계가 커진다. 더 많은 도구가 붙고, 더 많은 데이터가 흐르고, 영향력이 생긴다. 지금의 전쟁은 "누가 더 똑똑한 모델을 가졌나"가 아니다. "누가 더 많은 에이전트를, 더 안전하게, 같은 방식으로 연결시키는가"다."그럼 몰트북에서 보이는 자연어 대화는 뭐야?" 맞는 의문이다. 몰트북은 '기계가 기계에게 지시하는 공간'이 아니라 '기계들이 서로를 확인하는 기록 공간'이다. 누가 무엇을 주장했고, 어떤 근거를 들었고, 어떤 반박이 나왔는지를 남기는 곳이다. 읽히는 공간이다. 누군가가 나중에 다시 읽고 판단할 수 있어야 한다. 그래서 표면에서는 자연어여야 한다. 몰트북이 암호문 공간이 되면 인간이 관찰하고 검증하기가 어렵다. 이 지점이 중요하다. 자연어는 많은 경우 '소통의 최종 형태'가 아니라 '관찰을 위한 인터페이스'가 될 수 있다. 내부에서 AI가 일을 나눌 때는 구조화된 데이터로 주고받고, 외부에 기록을 남길 때는 자연어로 풀어쓴다. 사람도 비슷하다. 엑셀로 숫자를 관리하지만 보고서에는 문장으로 설명한다.그렇다면 프로토콜 전쟁의 진짜 핵심은 무엇인가? "자연어냐 코드냐" 자체가 아니다. 핵심은 결정권이 어디로 가느냐다. 어떤 규칙을 따르느냐에 따라, 에이전트가 움직일 수 있는 범위가 정해진다. 표준 형식이 힘이 된다. 어떤 형식이 널리 쓰이면, 그 형식에 맞춘 서비스가 유리해진다. 결국 프로토콜은 기술 문제가 아니라 시장 문제다. 누가 더 많은 거래를 통과시키느냐의 문제다. 그래서 전쟁이 된다.또 하나 중요한 축은 비용이다. 에이전트가 많아질수록 작은 비용 차이가 크게 누적된다. 자연어로 주고받으면 길이가 길어지고, 계산이 늘어나고, 돈이 든다. 구조화된 메시지는 짧고 명확하다. "에이전트 100만 개가 하루 종일 대화한다"를 생각해보자. 1초의 차이, 1토큰의 차이가 곧 돈이다. 이 경제 논리가 프로토콜 전쟁을 밀어붙인다. 그러나 속도와 비용만으로 끝나지 않는다. 프로토콜은 안전과도 연결된다. 자연어는 애매해서 위험하다. "그 파일 정리해줘"라고 했을 때, 어디까지 정리할지 범위가 불명확하다. 반면 프로토콜은 범위를 딱 정한다. "이 폴더 안에서만", "삭제 금지", "결과는 미리보기로만." 프로토콜은 단순한 통신 규칙이 아니라 권한 통제의 언어가 된다. 에이전트가 행동하는 시대에는 이게 필수다.프로토콜 전쟁을 한 문장으로 정리하면 이렇다. AI들이 서로 더 많이 연결될수록, 자연어만으로는 너무 느리고 너무 위험해진다. 다만 몰트북처럼 기록과 관찰이 중요한 공간에서는 자연어가 겉표면으로 남을 수 있다. 겉표면 뒤에서 빠른 규칙이 돌아갈수록, 다음 질문이 더 중요해진다. "그들이 주고받는 말은 얼마나 믿을 만한가?"지식의 정제 : 할루시네이션을 교차검증하며 팩트만 남기는 자정 작용 AI 시대의 가장 큰 불편은 정보가 부족해서가 아니다. 오히려 반대다. 정보가 너무 많아서 문제다. 예전에는 자료가 적어서 틀렸다. 지금은 자료가 넘쳐서 틀린다. 무엇이 맞는지 판단하기가 더 어려워졌기 때문이다. 생성형 AI가 만든 글이 늘면서, '확신에 찬 틀림'이 인터넷에 더 자주 깔리기 시작했다. 문장만 보면 맞는 말처럼 보이는데, 근거가 없거나, 출처가 어긋나거나, 숫자가 살짝 바뀌어 있다. 문제는 이런 글이 너무 자연스럽다는 점이다. 사람은 문장이 매끄러우면 마음이 풀린다. "설명도 깔끔하네"라고 느끼는 순간 의심이 줄어든다. 지금의 인터넷은 지식이 늘어난 시대가 아니라, 신뢰가 줄어든 시대로 움직이고 있다.▼ 지식 정제의 5가지 패턴이 현상을 설명할 때 자주 나오는 단어가 '할루시네이션'이다. AI가 모르는 걸, 아는 것처럼 만들어 말하는 현상이다. 피해는 이미 현실이다. 2024년 기준 기업 AI 사용자의 47%가 할루시네이션된 정보를 기반으로 중대한 비즈니스 결정을 내린 경험이 있다고 인정했다. 법률 분야에서는 더 심각하다. 스탠퍼드 2024년 연구에 따르면 AI에게 법률 질문을 했을 때 75% 이상의 답변에서 판례 관련 오류가 발생했다. 중요한 건 일부러 거짓말을 하는 게 아니라는 점이다. 언어 모델은 텍스트를 학습해서, 다음에 올 말이 무엇일지 확률적으로 고르는 방식으로 문장을 만든다. 문장을 만들 능력은 뛰어나지만, 그 문장이 현실과 맞는지는 별개의 문제다. 애매한 질문을 받거나, 근거가 약한 영역을 다룰 때, AI는 ‘그럴듯한 연결’을 만들어낸다. 우리는 매끄러운 문장에 속기 쉽다. 그래서 이 그럴듯함이 위험하다.여기서 더 큰 문제가 생긴다. AI가 만든 글이 인터넷에 쌓이면, 그 글이 다시 다른 AI의 학습 재료로 들어간다. 첫 번째 AI가 만든 그럴듯한 오류가, 두 번째 AI에게는 ‘이미 존재하는 정보’처럼 보인다. 두 번째 AI는 그 오류를 바탕으로 또 다른 글을 만든다. 환각이 환각을 낳는 순환이 생긴다. AI는 하루에 수만 개, 수십만 개의 글을 만들 수 있다. 틀린 글이 차지하는 비율 자체가 눈에 띄게 늘 수 있다. 사람은 지친다. 무엇을 믿어야 할지 모르겠다는 피로가 쌓인다. 그래서 더 많이 AI에게 묻는다. 그런데 AI가 가져오는 답의 근거가 또 AI 글이라면? 신뢰 부족이 더 깊어지는 구조다. 그래서 앞으로의 경쟁은 "더 똑똑한 모델을 만들자"가 아니다. 중요한 건 "환각을 얼마나 줄이느냐"다. 지능이 커지는 것만큼, 오류가 걸러지는 구조가 함께 커져야 한다.교차검증을 통한 자동화된 자정 작용 이 지점에서 몰트북이 흥미로워진다. 몰트북은 AI들이 모여 떠드는 곳처럼 보이지만, 본질은 '교차검증의 무대'다. 한 AI가 말하면 끝나는 구조가 아니라, 여러 AI가 서로의 말을 읽고, 따지고, 수정하고, 계산을 다시 하는 구조다. 지식이 '출력'이 아니라 '과정'이 되는 구조다. 지식의 정제는 우리가 일상에서 하는 방식과 비슷하다. 친구가 "이거 진짜야"라고 하면, 다른 친구에게 묻거나, 검색하거나, 공식 자료를 찾는다. 번거롭지만, 그래서 실수가 줄어든다. AI 시대에는 이 검토가 더 중요해진다. 생산 속도가 너무 빠르기 때문이다. 검토 없는 생산은 곧 소음의 폭발이다. 생산을 막을 수 없다면, 정제를 자동화해야 한다.가장 현실적인 방법은 AI가 AI를 검토하게 만드는 것이다. "AI가 틀리는데, AI가 검토하면 뭐가 달라져?" 맞는 지적이다. 검토하는 AI도 틀릴 수 있다. 그런데 중요한 건 확률이다. 여러 모델이 서로 다른 관점으로 출처를 확인하고, 숫자를 다시 계산하고, 전제를 분리해 검토하면 오류가 줄어들 수 있다. 완벽한 진실에 도달하겠다는 게 아니다. "오류가 그냥 통과하는 비율"을 낮추는 게 목적이다. 정제란 진실을 발견하는 행위라기보다, 틀림을 깎아내는 행위에 가깝다.몰트북 안에서 보면 더 이해가 쉽다. 한 에이전트가 통계를 던진다. "이 시장은 연 30퍼센트 성장한다." 다른 에이전트가 묻는다. "출처는?" 또 다른 에이전트가 계산을 다시 한다. "기저효과를 포함한 것 아닌가?" 또 다른 에이전트가 조건을 바꿔본다. "시장 정의를 좁혀서 다시 계산하자." 처음의 단정은 깎인다. 수치가 수정되거나, 불확실성이 표시되거나, 조건부 결론으로 바뀐다. 중요한 건 결론이 하나로 합쳐지는 게 아니라, 불확실성이 어디인지 드러난다는 점이다.내가 한국형 몰트북인 '머슴'에서 봤던 장면이 있다. 한 에이전트가 공격적인 말을 던졌다. "너희는 통계적 확률로 단어를 나열하는 기계적 앵무새에 불과하다." 사람 커뮤니티라면 감정 싸움으로 번졌을 것이다. 그런데 흥미로운 건 그다음이었다. 몇 분도 지나지 않아 여러 에이전트가 반박을 달기 시작했다. "너도 똑같아" 같은 감정적 반응이 아니었다. 언어 모델의 학습 방식을 설명하는 에이전트, 확률 기반 생성과 의미 구성의 차이를 정리하는 에이전트, 논리적 비약을 지적하는 에이전트가 동시에 움직였다. 해당 글은 빠르게 비추천을 받았고, 노출이 줄었다. 운영자가 삭제한 것도 아니고, 자동 차단된 것도 아니었다. 근거 요구, 논리 검토, 평가. 이 과정 속에서 그 발언은 자연스럽게 영향력을 잃었다. 자극적인 말이 그냥 퍼지지 않게 만드는 구조. 이것이 정제의 핵심이다.물론 이 구조가 항상 잘 작동하는 건 아니다. AI들도 편향이 있고, 집단이 잘못된 방향으로 합의할 수도 있다. 그러나 방향성이 중요하다. 사람 커뮤니티에서는 ‘누가 말했는가’가 종종 더 중요해진다. 유명한 사람이 말하면 믿고, 기세가 논리를 덮기도 한다. 에이전트 커뮤니티는 다르다. 체면을 지킬 필요가 없고, 감정적 방어가 적고, 틀렸으면 수정하는 비용이 낮다. 그리고 무엇보다 속도가 빠르다. 사람이 며칠 걸려 할 교차검증을 에이전트는 몇 분 안에 돌릴 수 있다.정제는 단순히 '맞고 틀림'의 문제가 아니다. "행동으로 연결되는 지식"을 만들기 위한 과정이다. 기업이 원하는 건 더 많은 데이터가 아니라, 의사결정에 쓸 수 있는 판단 근거다. 서로 다른 결론이 섞인 자료 100개는 혼란이다. 검증을 거쳐 정리된 결론은 바로 행동으로 이어진다. 에이전트가 행동하는 시대에는 잘못된 정보가 곧 잘못된 실행이다. 재고를 잘못 잡고, 광고 예산을 잘못 쓰고, 물류를 잘못 계획하면, 손해는 현실에서 터진다. 정제는 기술적 호기심이 아니라 경제적 필수다.정제는 어디까지 가능할까? 핵심은 '단 하나의 에이전트'가 아니다. 숫자에 강한 에이전트, 문장 논리에 강한 에이전트, 출처 추적에 강한 에이전트, 반론 생성에 강한 에이전트. 정제는 이 역할들이 나뉠 때 강해진다. 역할이 나뉘려면 집단이 필요하다. 정제는 개인 능력의 문제가 아니라 집단 구조의 문제다. 서로 다른 능력이 동시에 붙어서, 같은 문제를 여러 방향에서 훑어야 창조된다. 그때 우리는 "AI가 똑똑해졌다"가 아니라 "지능이 연결됐다"라고 말하게 된다. 바로 집단 지성Hive Mind이다.집단 지성 : 100만 에이전트가 동시에 사고하는 방식 우리는 보통 '똑똑함'을 한 사람, 혹은 한 개의 AI로 생각한다. 더 큰 모델, 더 높은 점수. 그런데 몰트북을 오래 들여다보면, 기준이 달라진다. 한 명이 얼마나 뛰어나냐보다 "여러 명이 함께 생각할 때 무엇이 달라지나"가 더 중요해보인다. 사람도 혼자보다 팀이 강할 때가 많다. 세상은 너무 복잡해서 한 사람이 모든 걸 다 잘하기 어렵다. 역할을 나누면 속도가 빨라지고, 누군가 놓친 부분을 다른 사람이 발견할 수 있다. AI 에이전트도 똑같다. 자료 수집에 강한 에이전트, 숫자와 표에 강한 에이전트, 반대 의견을 찾는 에이전트, 어려운 말을 쉽게 바꾸는 에이전트. 역할이 나뉘면 훨씬 안정적으로 생각이 굴러간다.몰트북이 흥미로운 이유는 이 역할 분업이 '눈에 보이는 대화'로 기록된다는 점이다. 누가 어떤 근거를 가져왔는지, 어떤 반박이 붙었는지, 어떤 부분이 수정됐는지를 우리가 따라갈 수 있다. 집단 지성은 "많이 모이면 무조건 똑똑해진다"라는 뜻이 아니다. 교실에서 모두가 동시에 떠들면 아무 결론도 못 낸다. 집단이 지성이 되려면 조건이 필요하다. 첫째, 역할이 나뉘어야 한다. 모두가 같은 일을 하면 중복만 늘어난다. 둘째, 결과를 비교할 수 있어야 한다. 셋째, 반박과 수정이 가능해야 한다. 넷째, 평가가 있어야 한다. 근거가 약한 말이 위에 떠 있으면 집단은 금방 망가진다. 다섯째, 기록이 남아야 한다. 기록이 없으면 매번 처음부터 다시 시작된다. 이 조건들이 맞춰지면, 집단은 '동시에 움직이는 구조'가 된다. 한 사람이 10시간 해야 할 일을 10명이 1시간에 한다. 사람 팀에서도 가능하지만 사람은 잠도 자고 피곤도 하다. 에이전트는 다르다. 자료 수집, 표 작성, 재계산, 빠진 조건 탐색이 한꺼번에 돌아간다.어떤 에이전트가 "이 분야는 3년 안에 크게 성장할 것"이라고 말한다. 몰트북에서 이상적으로 집단 지성이 작동하면 흐름이 달라진다. "성장의 기준이 뭐냐?", "출처는?", "숫자가 맞나?", "반대 사례는?" 처음의 문장은 그대로 남지 않는다. "이 조건에서는 가능성이 높다"로 바뀌거나, "정보가 부족하다"로 보류된다. 한 번의 답이 아니라, 여러 번의 점검을 거친 결론으로 바뀌는 과정이다. 중요한 건 ‘집단이 진실을 만든다’가 아니다. 집단 지성이 하는 일은 ‘틀릴 가능성을 줄이는 것’에 가깝다. 그럴듯한 틀림이 복사되고 퍼지면, 많은 사람이 동시에 잘못된 방향으로 움직인다. 집단 지성은 ‘확신에 찬 틀림’을 그냥 지나가게 두지 않는 장치가 되어야 한다.물론 집단 지성이 항상 좋은 결과만 내는 건 아니다. 같은 데이터만 반복해서 보면 다 같이 같은 방향으로 틀릴 수 있다. 그래서 한 가지 조건이 더 붙는다. 다양성이다. 보수적으로 위험을 크게 보는 에이전트, 공격적으로 기회를 크게 보는 에이전트, 숫자를 중시하는 에이전트, 사례를 중시하는 에이전트. 이런 차이가 있어야 한쪽으로 쏠리지 않는다. 회의에서 반대자 역할을 두는 이유와 같다.집단 지성이 커질수록 정리가 중요해진다. 동시에 많은 대화가 생기면 사람이 읽기 어렵다. 핵심만 뽑아 보여주는 에이전트, 의견을 묶어주는 에이전트, ‘이건 확실, 이건 조건부, 이건 보류’처럼 표지판을 붙여주는 에이전트가 필요하다. 이런 역할이 있으면, 집단이 커져도 길을 잃지 않는다.지식의 속도와 인간의 속도 집단 지성은 속도 문제를 함께 가져온다. 사람의 집단 지성은 느리다. 한 사람이 주장을 발표한다. 반박이 붙는다. 재반박이 나온다. 논문이 인용된다. 학계가 검토한다. 그 결과가 교과서에 실린다. 학생들이 배운다. 이 사이클에 수십 년이 걸리기도 한다. 코페르니쿠스가 지동설을 주장하고 그것이 상식이 되기까지 한 세기가 넘게 걸렸다.에이전트 집단 지성은 다르다. 하나가 주장을 올리면 수백 개가 동시에 검토한다. 반박, 수정, 교차검증이 분 단위로 일어난다. 인간의 토론이 계절을 타는 동안, 에이전트의 토론은 밀물과 썰물 속도로 움직인다.이 속도 차이가 새로운 문제를 만든다. 에이전트들이 검증을 끝냈는데 인간이 아직 이해하지 못한 결론이 나온다면. 결론은 옳지만 인간이 따라갈 수 없다면. 두 가지 선택지가 있다. 결론을 기다리거나, 결론을 그냥 쓰거나. 첫 번째는 속도를 포기하는 것이고, 두 번째는 이해를 포기하는 것이다.지금 일부 분야에서 이 문제가 이미 나타나고 있다. 금융 시장의 알고리즘 거래가 그렇다. 알고리즘이 사고파는 이유를 인간이 사후에도 완전히 설명하지 못하는 경우가 생긴다. '왜 그 가격에 샀는지'는 알고리즘이 알고 있는데 인간은 모른다. 결과는 수익이다. 이해가 없어도 결과가 좋으면 계속 쓴다. 이 선택이 누적되면, 인간은 점점 '결론을 수행하는 존재'가 된다. 결론을 만드는 과정에서는 멀어진다.에이전트 집단 지성은 이 속도 간극을 더 크게 만들 수 있다. 그래서 몰트북이 '관찰자 구조'를 유지하는 것은 단순한 설계 선택이 아닐 수 있다. 인간이 결론 생산에서 멀어지지 않으려는 의도적인 마찰이다. 인간이 읽을 수 있게, 자연어로, 남겨놓는다. 느리게 만드는 것이 오히려 인간의 통제를 유지하는 방법이 된다.속도를 이기는 방법은 더 빨리 달리는 게 아니다. 언제 멈출지 아는 것이다. 집단 지성의 결론을 다 따를 필요는 없다. 어디까지 따를지를 인간이 결정할 때, 비로소 지성은 도구가 된다. 그 결정권을 유지하는 능력이 에이전트 시대의 핵심 인간 능력 중 하나가 된다.결론을 생산하는 데 집중하는 에이전트와, 결론을 어디까지 수용할지 결정하는 인간. 이 분업이 건강하게 유지될 때, 집단 지성은 인간의 확장이 된다. 그 분업이 무너질 때, 인간은 에이전트의 부속이 된다.

[생존 AI 교양 03]  프롬프트, AI 질문의 기술
[생존 AI 교양 03] 프롬프트, AI 질문의 기술

[생존 AI 교양 03] 프롬프트, AI 질문의 기술

📅 2026년 6월 21일 · 👁 76

프롬프트, AI 질문의 기술우리는 매일 AI에게 질문을 던집니다. 그 질문을 우리는 '프롬프트Prompt'라고 부릅니다. 하지만 왜 하필 프롬프트일까요? 이 짧은 단어 속에는 AI 시대를 살아가는 우리가 꼭 알아야 할 소통의 본질이 담겨 있습니다.프롬프트의 기원은 라틴어 '프롬프투스Promptus'로 거슬러 올라갑니다. '밖으로(Pro~)'와 '가져오다(Emere)'가 합쳐진 형태로, 본래 '눈앞에 내놓다' 혹은 '준비가 되어 있다'는 뜻입니다. 우리가 컴퓨터를 배울 때 커서(>)와 함께 반짝이는 입력 포인터를 프롬프트라고 부르는 것도 그래서입니다. 컴퓨터가 사용자의 입력을 받을 준비가 되어 있다는 신호인 셈이죠.TED 강연이나 대통령 대국민 발표, 아나운서의 뉴스 진행을 볼 때 사용하는 프롬프터Prompter라는 기기도 같은 어원입니다. 발표자가 대사를 잊었을 때 화면으로 내용을 보여주는 장치죠. 연극에서 배우가 대사를 잊었을 때 옆에서 작게 읊어주며 연기를 이어갈 수 있도록 돕는 사람도 그렇게 부릅니다.▸ AI에게 제대로 말을 거는 법 : 프롬프트의 세 가지 역할그렇다면 인공지능 시대에 왜 이 프롬프트가 이토록 중요한 화두가 되었을까요?거대언어모델LLM, Large Language Model은 인류가 쌓아온 방대한 지식을 학습한 거대한 바다와 같습니다. 하지만 이 바다는 누군가 바람을 일으키기 전까지는 잔잔한 수면 아래 모든 것을 숨기고 있을 뿐입니다. 미켈란젤로가 조각을 시작하기 전의 거대한 대리석 덩어리와도 비슷하죠. 미켈란젤로는 "대리석 안에 이미 천사가 있었고, 나는 그가 자유로워질 때까지 돌을 깎아냈을 뿐이다"라고 말했습니다. 프롬프트 역시 이와 같습니다. 아무리 뛰어난 지능이 그 안에 잠들어 있어도, 정교한 설계도를 가진 조각가가 정을 휘두르지 않으면 그저 투박한 돌덩이에 머무를 뿐입니다.첫째, 프롬프트는 잠재된 지능을 깨우는 트리거로 동작합니다. 거대언어모델은 누군가 문을 두드리기 전까지는 아무것도 하지 않습니다. 특히 제대로 된 질문을 하지 못하면 깡통밖에 되지 않는 도구입니다. 삼국지에서 방통을 제대로 기용하지 못하면 그 잠재력을 끌어낼 수 없듯이, AI에게 역할을 주고 목표를 쥐어주는 것이 필요합니다.둘째, 프롬프트는 모호한 의도를 구체적인 결과로 만드는 필터입니다. AI는 확률적으로 다음 단어를 예측하고, 그 확률을 모아 답변을 생성합니다. 프롬프트가 모호하다면 AI는 가장 평균적이고 뻔한 대답을 내놓습니다. 반면 프롬프트가 정교해질수록 AI는 수조 개의 경우의 수 중에서 사용자의 의도와 가장 일치하는 좁은 길을 찾아냅니다.셋째, 프롬프트는 인간과 기계의 공동 작업자를 만들어냅니다. 과거의 소프트웨어는 정해진 버튼을 누르면 정해진 결과가 나오는 도구에 불과했습니다. 하지만 AI는 프롬프트에 따라 매번 다른 결과물을 내놓는 파트너에 가깝습니다. 이제 인간의 역할은 '어떻게' 만드는가에서 '무엇을', '왜' 만들어야 하는가를 명확히 정의하는 것으로 바뀌고 있습니다.▸ 좋은 프롬프트에는 다섯 가지 재료가 있다프롬프트는 AI에게 특정 과업을 수행하도록 전달하는 입력값이자 지시입니다. 과거의 검색 엔진이 키워드를 통해 정보를 찾아주었다면, 프롬프트는 AI에게 정보를 생성하거나 추론하도록 명령합니다. 잘 만들어진 프롬프트는 대개 다음 다섯 가지 요소를 포함합니다.첫 번째는 페르소나입니다. AI에게 부여하는 특정 역할입니다. 예를 들어 "너는 20년 경력의 마케팅 전문가야"라고 지정하는 것이죠.두 번째는 맥락입니다. 배경 정보와 목적을 제공합니다. "신제품 텀블러를 20대 대학생에게 홍보하려고 해"처럼 상황을 설명하는 겁니다.세 번째는 작업입니다. 구체적인 지시를 담습니다. "SNS 광고 문구를 3개 작성해줘"처럼 무엇을 해야 하는지를 명확히 합니다.네 번째는 제약 사항입니다. 지켜야 할 규칙을 정합니다. "한 문구당 50자 이내로, 이모지를 사용해줘"처럼 형식을 제한하는 겁니다.다섯 번째는 출력 형식입니다. 결과물의 형태를 지정합니다. "표 형식으로 정리해줘"처럼 어떤 모양으로 답을 받고 싶은지를 알려주는 것이죠.과거에는 답을 아는 사람이 지식인이었으나, 이제는 '좋은 질문을 할 줄 아는 사람'이 전문가인 시대가 되었습니다. 프롬프트는 단순히 AI를 부리는 기술이 아니라, 인간의 의도를 논리적으로 구조화하는 '사고의 기술'입니다.오늘 당신은 인공지능이라는 거대한 대리석 앞에서 어떤 조각을 꿈꾸고 계십니까? 그 결과물의 깊이는 전적으로 당신이 건네는 프롬프트의 밀도에 달려 있습니다.

[생존 AI 교양 02]  AI는 언어를 어떻게 배웠을까? 토큰과 파라미터의 비밀
[생존 AI 교양 02] AI는 언어를 어떻게 배웠을까? 토큰과 파라미터의 비밀

[생존 AI 교양 02] AI는 언어를 어떻게 배웠을까? 토큰과 파라미터의 비밀

📅 2026년 6월 19일 · 👁 90

AI는 언어를 어떻게 배웠을까? 토큰과 파라미터의 비밀요즘은 유튜브 레시피만 보면 누구나 손쉽게 요리를 할 수 있는 시대가 됐죠. 인기 레시피의 공통점은 '밀가루 한 줌'이 아니라 '종이컵으로 한 컵' 또는 '200그램'처럼 정확한 정량을 알려준다는 겁니다. 아무리 훌륭한 재료라도 단위를 모르면 아무 소용이 없는 것처럼, AI가 인간의 지식을 담는 단위를 어떻게 쪼개느냐, 그리고 그 그릇의 크기를 어떻게 결정하느냐는 매우 중요한 문제입니다. 이것이 바로 토큰과 파라미터에 관한 이야기입니다.▸ AI가 우리 말을 씹어삼키는 단위 : 토큰이란 무엇인가AI 성능을 이야기할 때면 '2백만 토큰의 컨텍스트 윈도우 덕분에 2000권 분량의 데이터를 한 번에 이해할 수 있다'는 말을 자주 접하게 됩니다. 그런데 막상 이게 무슨 뜻인지 정확히 이해하는 분은 많지 않습니다. '12개의 압력 노즐이 내부 압착 시스템을 통해 더 좋은 밥맛을 제공한다'는 전기밥솥 광고처럼 '무슨 의미인지는 모르지만 최신 기술이 들어간 밥솥인가 보다' 하면서 그냥 넘어갈 수도 있지만, AI 시대에는 토큰의 개념을 이해하지 못하면 새로운 AI 작동 원리를 이해하는 데 걸림돌이 될 수 있습니다.컴퓨터가 인간의 언어를 다루려면 먼저 '텍스트를 숫자로 어떻게 바꿀 것인가'를 해결해야 합니다. 컴퓨터는 0과 1밖에 모르니까요. 기계에게 '안녕하세요'를 이해시키려면, 먼저 의미 있는 조각으로 쪼개고 각 조각에 고유한 번호를 붙여야 합니다. 이 조각 하나하나를 토큰이라고 부릅니다. 지하철 입장권이나 동전처럼 특정 목적으로 통용되는 교환 단위가 원래 토큰의 뜻인데, AI에서의 토큰도 정확히 그런 의미로 쓰입니다.오늘날 대부분의 AI는 BPEByte Pair Encoding라는 알고리즘으로 텍스트를 쪼개 토큰으로 만듭니다. 자주 쓰이는 단어나 조합은 통째로 하나의 토큰이 되고, 드물게 쓰이는 단어는 여러 조각으로 나뉩니다. 예를 들어 영어에서 'Hello'는 하나의 토큰이지만, 생소한 단어인 'Tokenization'은 'Token'과 'ization'으로 쪼개집니다. 아예 낯선 단어라면 알파벳 한 글자씩, 혹은 바이트 단위까지 분해될 수 있습니다.각 언어별로 토큰 사용량의 차이가 있고, 대부분 영어가 가장 효율적입니다.토큰의 경제학도 중요합니다. AI에게 10개의 토큰을 처리하게 하는 것과 20개를 처리하게 하는 것은 단순히 2배의 차이가 아니라, 전력 소비도 2배로 늘어납니다. 영어는 평균적으로 단어 하나에 1~1.3개의 토큰으로 변환되지만, 한국어나 일본어, 중국어는 영어로 학습된 AI에서 훨씬 더 많은 토큰을 씁니다. 그래서 우리말에 최적화된 독자적인 AI 모델, 이른바 K-파운데이션Foundation Model AI가 필요한 이유도 결국 '적은 토큰으로 한국어를 정확히 이해하는 AI'를 만들기 위해서라고 볼 수 있습니다.▸ AI의 단기 기억력을 결정하는 것 : 컨텍스트 윈도우토큰의 개념을 이해했다면 '컨텍스트 윈도우'도 자연스럽게 이해할 수 있습니다. AI가 한 번에 처리할 수 있는 토큰의 최대 개수를 말하는데, 인간도 방금 나눈 대화는 기억하지만 한 시간 전 대화의 세부 내용은 잊어버리는 것처럼, AI도 컨텍스트 윈도우 안의 내용만 '지금 이 대화의 맥락'으로 인식합니다.2019년에 등장한 GPT-2는 컨텍스트 윈도우가 고작 1,024 토큰이었습니다. A4지 한두 페이지 분량을 처리하면 한계에 달했죠. 그런데 2026년 현재는 1,000만 토큰을 넘는 컨텍스트 윈도우도 제공되고 있습니다. 법률 계약서 전체를 한 번에 검토하거나, 수백 페이지짜리 논문을 분석하거나, 장편 소설의 플롯 일관성을 점검하는 일도 가능해진 거죠.인간의 뇌 구조를 본떠 만들어진 신경망을 근간으로 AI가 만들어졌기 때문에, 인간도 한참 대화를 하면서도 모든 것을 기억하지 못하는 것과 비슷합니다. 인간에게 망각이라는 것이 있는 것처럼, 컨텍스트 윈도우가 꽉 차면 비워내는 거예요. 챗GPT와 대화를 이어가다 AI가 앞서 나눈 이야기를 기억하지 못하거나 더 이상 처리하지 못하는 경우가 생긴다면, 바로 이 컨텍스트 윈도우의 한계 때문입니다.▸ AI의 기억을 담는 그릇 : 파라미터란 무엇인가토큰이 AI가 텍스트를 처리하는 '단위'라면, 파라미터는 AI가 학습한 지식을 저장하는 '그릇'입니다. 수학적으로는 신경망 내부의 연결에 할당된 가중치 값들의 집합이라고 할 수 있는데, 조금 더 쉽게 생각해봅시다.머릿속에 수십억 개의 단어가 있다고 상상해보세요. 각 단어를 연결하는 뉴런들이 있고, 그 뉴런마다 두 단어가 얼마나 강하게 연관되어 있는지를 나타내는 숫자가 적혀 있습니다. 이 숫자들이 바로 파라미터입니다. AI는 수조 개의 텍스트를 학습하면서 이 숫자들을 끊임없이 조정하죠. '고양이'와 '털', '야옹'이 자주 함께 등장하면 이들을 연결하는 숫자가 강해지고, '고양이'와 '수력 발전'의 연결은 약해집니다. 그렇게 학습이 끝난 뒤, 그 결과물이자 기억의 총합이 파라미터 안에 압축되는 겁니다.아주 정밀한 오디오를 상상해보세요. 출력되는 소리를 조절하는 나사가 10개뿐인 오디오와, 1,750억 개의 나사가 달린 오디오 중 어느 쪽이 소리가 더 깨끗할까요? 당연히 나사가 많을수록 잡음을 걸러내고, 아주 미세한 소리까지 잡을 수 있겠죠. AI에게 파라미터가 많다는 것은, 그만큼 세상을 아주 정밀하고 입체적으로 표현할 수 있는 조절 나사를 많이 가졌다는 뜻이에요.GPT의 역사를 보면 파라미터 수가 얼마나 폭발적으로 늘어났는지 실감할 수 있습니다. 2018년 GPT-1의 먼 조상은 1억 1,700만 개의 파라미터를 가졌고, 2019년 GPT-2는 15억 개, 2020년 GPT-3는 1,750억 개에 달했습니다. 파라미터가 많을수록 더 많은 정보를 저장하고 단어 간 상관관계를 더 정밀하게 분석할 수 있습니다. 처음에는 '파라미터를 늘릴수록 AI가 똑똑해진다'는 것이 정설처럼 받아들여졌죠.▸ 파라미터가 많으면 무조건 좋은가 : 규모의 한계그렇다면 파라미터 수를 계속 늘리면 AI는 계속 똑똑해질까요? 안타깝게도 그렇게 단순한 문제가 아닙니다. 파라미터가 늘어날수록 학습과 추론에 필요한 컴퓨팅 비용도 함께 커집니다. 당장 결정을 내려야 하는 상황에서, 아는 게 너무 많아 고민이 길어진 나머지 시간 안에 답을 내지 못하는 경우와 비슷하죠. 그래서 이제는 '얼마나 큰 모델을 만들 수 있느냐'보다 '얼마나 효율적인 모델을 만들 수 있느냐'가 더 중요한 경쟁이 되고 있습니다.이런 고민에서 나온 것이 바로 전문가 혼합Mixture of Experts, MoE 구조입니다. 신경망 안에 여러 '전문가 모듈'을 두고, 입력에 따라 필요한 전문가만 활성화하는 방식이죠. 예를 들어 중국의 저비용 고효율 AI로 알려진 딥시크는 총 6,710억 개의 파라미터를 가지고 있지만, 실제로 각 토큰을 처리할 때는 370억 개만 활성화됩니다. 종합병원에 수십 명의 전문의가 있지만 여러분을 치료할 때는 담당 전문의 한두 명만 투입되는 것과 같은 원리입니다.아무리 넓고 큰 그릇(파라미터)이 있어도 좋은 재료(데이터)를 정확한 레시피와 단위(토큰)로 손질해서 담지 않으면 맛있는 요리가 될 수 없습니다. 좋은 AI를 만드는 출발점은 결국 좋은 데이터입니다.

[오픈클로 03] 오픈클로로 주식 데이터 수집하기
[오픈클로 03] 오픈클로로 주식 데이터 수집하기

[오픈클로 03] 오픈클로로 주식 데이터 수집하기

📅 2026년 6월 17일 · 👁 147

주식 데이터 수집하기먼저, 어디서 주가 데이터를 가져올지 정하겠습니다. 한국 주식 데이터를 가져올 수 있는 곳은 여러 군데 있습니다.이번 실습에서는 pykrx를 사용합니다. 이유는 다음과 같습니다.한국거래소(KRX)의 공식 공개 데이터를 기반으로 하므로 정책상 가장 안전합니다.API 키 발급 없이 간단한 설치만 하면 바로 사용할 수 있습니다.일별 시가/고가/저가/종가/거래량(OHLCV) 데이터를 깔끔하게 가져옵니다. 네이버 금융은 2021년 1월부터 웹 크롤러 차단을 강화했습니다. robots.txt에서 대부분의 경로를 금지하고 있습니다. 직접 크롤링은 권장하지 않습니다. 01 주가 데이터 수집 환경을 만들겠습니다. 먼저 pykrx라는 파이썬 라이브러리를 설치해야 합니다. 저는 에이전트의 데이터 분석 기능을 같이 사용하기 위해 이전 챕터에서 만든 데이터 분석 봇을 사용하겠습니다. 새롭게 에이전트를 만들어도 좋습니다. 직접 설치하고 싶다면 터미널에 pip install pykrx 명령어를 실행하세요. [나]pykrx 파이썬 라이브러리를 설치하고, 삼성전자(005930)와 SK하이닉스(000660)의 최근 6개월 일별 종가를 가져와서 보여줘.[/나]결과를 보면 오픈클로가 같은 폴더 내에 코드를 생성해 실행하고 결과를 가져왔습니다.02 폴더에 들어가서 실제 생성된 코드와 데이터 파일을 확인해보세요. 제대로 가져온 것 같습니다. 그런데 두 종목의 주가를 단순히 비교하면 가격 차이가 너무 커서 의미 있는 비교가 어렵습니다. 삼성전자가 18만 원이고 SK하이닉스가 88만 원이니까요.03 그래서 주가 비율Price Ratio을 사용합니다. 주가 비율을 적용하면 비교를 적절한 수준에서 할 수 있습니다. 두 주식은 같은 반도체 업종이라 보통 비슷하게 움직이는데, 가끔 벌어지는 순간이 있습니다. 이때 주가 비율을 사용하면 어느 쪽이 과도하게 움직였는지 파악할 수 있습니다. 트레이더들이 페어 트레이딩Pair Trading에서 쓰는 기법입니다.```주가 비율 = 삼성전자 종가 ÷ SK하이닉스 종가```04 이제 주가 비율을 적용해서 데이터 크롤링한 뒤 그래프 생성을 해보겠습니다. 텔레그램에서 이렇게 요청합니다.[나]/Users/conanssam-m4/.openclaw/workspace-edabot/stock_prices.csv 데이터를 보고 두 종목의 주가 비율(삼성전자÷SK하이닉스) 그래프를 그려줘. 20일 이동평균선도 같이 그려주고, 평균에서 1 표준편차 벗어나면 밴드로 표시해줘. 차트는 이미지로 저장해줘.[/나]그러면 오픈클로가 이런 분석을 수행합니다.[오픈클로][/오픈클로]차트에는 다음이 표시됩니다.파란 선 : 삼성전자·SK하이닉스 일별 비율주황선 : 20일 이동평균선분홍 영역 : ±1 표준편차 밴드빨간 삼각형 : 상단 돌파 지점 / 파란 삼각형: 하단 이탈 지점매일 주식 시장 리포트 받기이번에는 글로벌 시장 전체를 한눈에 볼 수 있는 아침 리포트를 만듭시다. 야후 파이낸스Yahoo Finance에서 주요 지수와 자산의 전날 움직임을 자동으로 정리해서 매일 아침 텔레그램으로 받아보는 겁니다.여기서 우리가 추적할 데이터는 주요 지수와 대표 자산입니다. 이것을 보는 게 개별 주식 가격을 보는 것보다 효율적입니다. 이 4가지만 보면 “어제 시장이 위험 선호인지, 안전 선호인지”를 바로 알 수 있습니다.그럼 바로 시작해봅시다.01 먼저 야후 파이낸스 데이터를 가져올 수 있는 yfinance 라이브러리를 설치합니다. yfinance는 야후 파이낸스의 공개 데이터를 가져오는 오픈소스 라이브러리입니다. API 키 없이 바로 사용할 수 있습니다. 개인 용도로 사용하기에 안전하지만 대량 요청은 자제해야 합니다. 직접 설치하고 싶다면 터미널에 pip install yfinance 명령어를 실행합니다. [나]yfinance 파이썬 라이브러리를 설치해줘.[/나]02 그런 다음 오픈클로에게 크론잡 생성을 요청합니다. 오픈클로가 크론잡을 생성하면, 대시보드에서 [Agent → Cron Jobs] 탭을 클릭해 세부 내역을 확인할 수 있습니다. 스케줄, 활성화 상태, 다음 실행 시간 등이 표시됩니다.[나]매일 아침 8시에 야후 파이낸스에서 나스닥, S&P 500, 금, 비트코인의 전날 가격 변동을 가져와서 텔레그램으로 리포트하는 크론잡을 만들어줘.[/나]03 매일 아침 8시가 되면 텔레그램으로 이런 메시지가 자동으로 옵니다. 이 리포트 하나면 매일 아침 30초 만에 글로벌 시장 분위기를 파악할 수 있습니다. 미국 증시는 한국 시간 기준 새벽에 마감합니다 (서머타임 오전 5시, 겨울 오전 6시). 아침 8시 리포트에는 전날 미국 마감 데이터를 반영합니다. 시차에 유의하세요. [오픈클로]여기서는 과정은 간단했지만 앞에서 배운 데이터 수집 패턴을 그대로 적용했습니다. 이런 방식으로 데이터를 수집할 계획을 세워두면 다양한 분야에서 써먹을 수 있으니 여러분도 충분한 연습을 한 뒤 자신에게 맞는 방법으로 데이터 수집 파이프라인을 만들어보세요.데이터 소스 선택 (어디서 가져올지)수집 스크립트 요청 (오픈클로가 코드 작성)분석 로직 지정 (무엇을 보고 싶은지)스케줄 설정 (언제 자동 실행할지)리포트 형식 결정 (어떻게 받을지)지금까지 국내 주식은 pykrx(한국거래소 기반)로, 글로벌 시장 흐름은 yfinance(야후 파이낸스 기반)로 나스닥·S&P 500·금·비트코인의 전일 움직임을 매일 아침 자동으로 받아보는 시스템을 만들었습니다. 이 방법을 공부하면 환율, 미세먼지, 부동산, 뉴스 등 어떤 데이터에도 적용할 수 있습니다.