[AI] “기업들은 AI를 이렇게 쓴다”, 사례로 보는 챗GPT 시대

이 글은 [챗GPT 시대 살아남기]에서 발췌했습니다.
글 그림 박종천 / 골든래빗 출판사

S&P 7은 미국 주식 시장에서 가장 영향력 있고 빠르게 성장하는 기술 기업들을 지칭하는 용어로 마이크로소프트, 애플, 엔비디아, 알파벳(구글), 아마존, 메타(페이스북), 테슬라를 일커릅니다. 매그니피센트 7이라고도 부릅니다. 그중 마이크로소프트, 알파벳(구글), 아마존, 메타(페이스북)의 AI 활용 근황을 간단히 확인해보겠습니다.

광고 산업은 AI의 도입으로 큰 변화를 맞이했습니다. 광고 업계에서는 광고 성과가 수익과 직결되는 만큼 클릭률 극대화가 중요합니다. 구글, 메타(페이스북) 등 대형 광고 플랫폼들은 세계 최고 수준의 AI 인재들을 영입해 AI 알고리즘 고도화에 매진하고 있습니다. 광고 산업의 니즈가 AI의 발전을 견인했다고 해도 과언이 아닙니다. 넷플릭스는 AI를 통해 고객 개개인의 취향과 니즈에 맞는 상품을 추천함으로써 매출 증대를 꾀하고 있습니다. 아마존의 경우 상품 추천으로 인한 매출이 전체의 35%에 달한다는 보고도 있습니다.

그럼에도 기존 AI로 광고의 효율을 끌어올리는 일은 쉽지 않았습니다. AI 시스템 구축에는 막대한 비용이 소요되는 만큼, 항상 투자 대비 효과를 따져봐야 합니다. 추천 시스템이 매출에 기여하는 비중이 5% 정도라면, 그 성능을 두 배로 끌어올리는 데 드는 비용이 과연 합리적일지 고민해봐야 합니다.

반면 AI가 필수불가결한 영역도 있습니다. 피싱 전화나 스팸 문자, 스팸 메일은 AI가 24시간 365일 실시간으로 필터링해주고 있습니다. 한 통신 업체의 지인은 AI로 스팸 문자를 필터링하지 않으면 오늘날 스마트폰에서 불이날 지경으로 스팸문자가 당도할 거라 말할 정도입니다. 또 다른 예로 유튜브에서 불법적이고 유해한 영상을 필터링하는 일을 사람이 수행하기에는 법적, 윤리적 리스크가 크기 때문에 AI에 의존할 수밖에 없습니다. 비용이 많이 들더라도 기계가 수행해야만 하는 일인 셈입니다.

번역도 AI에 적합한 일입니다. 몇 해 전만 해도 구글 번역팀은 전통적인 알고리즘 활용해 번역 서비스를 제공했습니다. 그러다가 AI 팀이 AI 번역 엔진을 만들어 하루아침에 번역 품질을 대폭 향상시켰습니다. 그 결과 기존 알고리즘 개발자 상당수가 AI 팀으로 옮겨 개발을 했습니다. 얼마 후 새로 개발한 LLM AI로 번역을 했더니 기존 AI보다 대폭 개선된 번역 품질을 얻을 수 있었습니다. 이는 자연어 처리 분야에 얼마나 큰 혁신을 가져왔는지 엿볼 수 있는 사례입니다.

 

<구글 번역>

 

AI 자체가 서비스의 핵심 가치로 부상하는 분야도 늘고 있습니다. 골프 자세를 분석하는 AI 코치, CCTV 영상을 분석해 화재 발생 시 자동으로 신고하는 시스템, 음성 통화 내용을 실시간으로 텍스트화하는 서비스 등은 AI 없이는 구현 자체가 불가능합니다. 이런 서비스들은 초기에는 기술 시연에 그치는 경우가 많았지만, 최근에는 상용화 사례도 늘어나고 있는 추세입니다.

챗GPT, 제미나이와 같은 대화형 AI의 등장은 이런 흐름에 더욱 박차를 가하고 있습니다. 마이크로소프트는 오픈AI와의 전략적 제휴를 통해 자사의 다양한 서비스에 최첨단 AI 기술을 적극적으로 통합하고 있습니다. 빙 검색엔진에 챗GPT를 통합한 덕분에, 빙은 대화형으로 검색할 수 있도록 개선되었으며, 복잡한 질문에 대한 답변을 더 신속하고 정확하게 제공할 수 있게 되었습니다.

구글 역시 AI 경쟁에서 한 발 앞서 나가기 위해 LLM 기술을 활용해 차세대 검색엔진인 ‘AI 오버뷰( AI Overview)’를 공개했습니다. AI 오버뷰는 기존의 검색 알고리즘을 뛰어넘어, 사용자의 검색 의도를 더 정확하게 파악하고 개인화된 결과를 제공하는 데 중점을 둡니다. 이 검색 엔진은 방대한 데이터를 실시간으로 분석하고, 사용자가 원하는 정보를 쉽게 찾을 수 있도록 도와주는 고도의 AI 기능을 탑재하고 있습니다.

메타는 자체 개발한 LLM인 ‘라마(LLaMA)’ 모델을 공개했습니다. 라마는 메타가 보유한 방대한 사용자 데이터를 기반으로 개발된 모델로, 자연어 처리와 이해에서 뛰어난 성능을 발휘합니다. 메타는 라마를 자사의 다양한 플랫폼에 통합하여, 사용자들에게 개인화된 콘텐츠 추천, 자동화된 고객 지원, 향상된 커뮤니케이션 도구를 제공하려고 합니다. 소셜 미디어와 메타버스의 영역에서 AI 활용도를 극대화하려는 의도입니다.

 

<Meta>

 

이밖에 애플은 온디바이스 AI, 테슬라는 자율주행과 로봇, 엔비디아는 GPU에 주력하고 있습니다. 세 회사들은 뒤에서 각각 더 집중해서 다루겠습니다. 이처럼 주요 IT 기업들은 AI와 LLM 기술을 자사의 핵심 서비스에 통합하여, 사용자 경험을 개선하고 경쟁 우위를 확보하기 위해 치열한 경쟁을 벌이고 있습니다.

지금까지 여러 글로벌 사례를 살펴봤습니다. ‘그래서 우리나라에서 누가 뭘 쓰고 있는 거야?’ 생각이 들 겁니다. 통신, 게임, 쇼핑몰, 채팅 등 안쓰는 곳이 없을 정도로 다 쓰고 있다고 말씀드리고 싶습니다. 그중에서도 이번에는 제한된 자원으로 더 많은 가치를 창출하는 강력한 도구로 AI를 활용하는 당근 사례를 들겠습니다.

이베이 직원은 12,300명 정도인 반면, 당근은 몇백 수준입니다. 당근은 미국의 유사 서비스인 이베이와 비교했을 때 훨씬 적은 인원으로 운영됩니다. 이는 머신러닝 기술을 활용해 인력 소요를 최소화했기 때문입니다. 예를 들어 사용자들이 중고 물품을 올릴 때 실수로 잘못된 카테고리를 선택하거나 상품명과 맞지 않는 사진을 첨부하는 경우가 있습니다. 이런 상황을 일일이 사람이 모니터링하고 수정하는 것은 비효율적입니다.

당근은 처음에는 자체적으로 이미지 분류 모델을 만들어 사용했지만, 이후 구글 비전 AI로 전환했습니다. 상품 사진이 업로드되면 비전 AI가 이미지를 분석하고, 상품명이나 카테고리와 일치하지 않을 경우 사용자에게 알림을 보내는 기능을 제공한 덕분에 플랫폼 신뢰도를 높이면서도 운영 비용을 크게 절감할 수 있었습니다.

또한 추천 시스템에도 AI를 사용했습니다. 쿠팡과 같은 이커머스 플랫폼과 달리, 키워드가 통일되지 않은 중고 거래 플랫폼 당근에서는 추천 시스템의 영향력이 더 큽니다. 5,000만 명에 달하는 사용자에게 수많은 중고 물품을 일일이 노출하는 것은 비효율적입니다. 개별 관심사에 맞는 상품을 추천하는 것이 매출 증대에 도움이 됩니다.

 

<당근>

 

간단히 말해 사용자 A가 구매한 상품 X, Y, Z와 유사한 구매 이력을 가진 사용자 B에게 상품 Z를 추천하는 방식입니다. 물론 실제 추천 시스템은 이보다 훨씬 복잡합니다. 상품 가격, 재고 상황, 배송 조건 등 다양한 요소를 고려해야 합니다. 수백만 사용자와 수백만 상품 간 상호작용 데이터를 바탕으로 개인화된 추천을 실시간으로 제공하는 것은 결코 쉬운 일이 아닙니다.

여기서 중요한 것은 AI 모델의 학습에 사용되는 데이터입니다. 사용자 프로필, 상품 메타데이터와 같은 정적인 데이터도 중요하지만 실제 사용자 행동 데이터야말로 추천 시스템의 핵심 자산입니다. 어떤 사용자가 어떤 상품을 클릭하고 구매했는지, 얼마나 오래 머물렀는지 같은 데이터를 지속적으로 수집하고 분석해야 정교한 추천 모델을 만들 수 있습니다. 여기서 중요한 것은 사용자와 물건 사이의 상호작용, 즉 행동 데이터를 모으는 겁니다. 이 데이터는 사용자와 물건에 대한 정보이고, 그 행동이 정답이 됩니다.

쇼핑몰의 추천도 사실상 내부는 복잡한데, 당근의 추천은 근처 지역의 물건들을 보여주어야 하기 때문에 더 복잡합니다. 사용자들이 관심가질만한 물건을 주로 보여주면서, 그외 물건들도 보여주어야 하며, 모든 물건이 사용자가 있는 지역이어야 합니다. 머신러닝 도움이 없이는 개발하기는 힘든 서비스입니다.

당근에서는 사용자 간 채팅 기능도 중요한 데이터 소스가 됩니다. 중고거래의 특성상 판매자와 구매자 간 실시간 소통이 빈번하게 이루어지기 때문입니다. 문제는 익명의 사용자 사이에서 욕설과 같은 부적절한 언어 사용이 발생할 수 있다는 겁니다. 당근은 이를 방지하고자 AI 욕설 탐지 시스템을 운영 중입니다. 그런데 욕설의 기준과 패턴은 시대에 따라 계속 변화합니다. 너드nerd라는 단어가 과거에는 부정적인 의미로 사용되었지만 지금은 오히려 긍정적인 뉘앙스를 담고 있습니다. 따라서 욕설 탐지 모델도 환경 변화에 맞춰 지속적으로 업데이트해야 합니다. 사용자가 특정 채팅 내용을 부적절하다고 신고하면, 이를 학습 데이터로 반영해 모델을 개선해나가는 겁니다.

채팅뿐만 아니라 금지 물품이나 사기 물품 등 여러 위험 요소가 있습니다. 이 역시 머신러닝을 이용해서 판별을 할 수 있습니다. 운영정책을 세우는 팀, 운영정책을 지원할 수 있도록 개발하는 팀, 그리고 운영정책에 따라 머신러닝이 일차로 검사해둔 채팅이나 물건들을 실제 검사하고 운영하는 팀까지 조직을 AI 기반으로 셋업해서 적은 인원으로 당근 서비스를 유연하게 운영하고 있는 겁니다.

이처럼 AI는 단순히 좋은 알고리즘을 개발하는 것에 그치지 않습니다. 서비스 환경 속에서 데이터를 지속적으로 수집, 분석, 활용하고 변화에 적응해나가는 일련의 과정이 더욱 중요합니다. 당근 사례는 AI 프로젝트의 성공에 도메인에 대한 이해와 데이터 기반의 문제 해결 능력이 얼마나 중요한지를 여실히 보여줍니다. 이런 역량을 갖추려면 무엇보다도 현실 세계의 데이터를 직접 다뤄보고 실험하는 자세가 필요합니다.

박종천 

30여 년 동안 실리콘밸리를 오가며 한글과컴퓨터, 블리자드, 넥슨, 삼성전자를 거쳐 머신러닝 기반의 광고 플랫폼 유니콘 기업 몰로코에서 헤드 오브 솔루션스 아키텍처로 일했습니다. 삼성전자, 몰로코, 뤼이드 등에서 머신러닝, 생성 AI(LLM) 등 인공지능을 활용해 혁신적인 성과를 도출하는 비즈니스를 고안하고 구축했습니다. 현재는 이런 노하우를 공유하고자 크고 작은 기업과 개발자 커뮤니티에서 머신러닝, 생성 AI(LLM), 기술, 개발, 조직 문화를 주제로 강연과 컨설팅을 병행하고 있습니다. 주요 저서로는 《개발자로 살아남기》(2022)가 있습니다.

현) 넥스트인텔리전스 AI 어드바이저
전) MOLOCO Head of Solutions Architecture
전) 삼성전자 무선사업부 상무/그룹장
전) 넥슨 VP of Platform Technology
전) 블리자드 Lead Software Engineer

Leave a Reply

©2020 GoldenRabbit. All rights reserved.
상호명 : 골든래빗 주식회사
(04051) 서울특별시 마포구 양화로 186, 5층 512호, 514호 (동교동, LC타워)
TEL : 0505-398-0505 / FAX : 0505-537-0505
대표이사 : 최현우
사업자등록번호 : 475-87-01581
통신판매업신고 : 2023-서울마포-2391호
master@goldenrabbit.co.kr
개인정보처리방침
배송/반품/환불/교환 안내