- 일정(이벤트)이 종료되었습니다.
[마감] 《텐초의 파이토치 딥러닝 특강》 베타리더를 모집합니다
5월 30, 2022 - 6월 22, 2022
수치, 텍스트, 이미지, 생성모델을
한 번에 배우는 딥러닝 실전
동경에서 데이터 엔지니어로 활약하는 저자는 유튜브에서, 올더파티(Allthepartee)에서 인공지능 강의를 진행하면서 개념을 제대로 이해하면 ‘기초 지식 ➝ 데이터 분석 ➝ 전처리 ➝ 모델링 ➝ 평가’ 순서를 따라 딥러닝 신경망을 어렵지 않게 만들 수 있다는 걸 알게 되었습니다. 그래서 이 책은 그림을 곁들여 개념과 신경망 구조와 학습 흐름을 제시합니다. 특히 신경망을 만들며 기본 블록을 정의한 후 반복 재활용해 더 체계적이고 구조적으로 신경망을 이해할 수 있게 돕습니다.
현업에서 딥러닝은 비정형 데이터인 텍스트, 이미지, 음성, 동영상을 처리하는 데 주로 쓰입니다. 그래서 이 책은 앞서 언급한 다양한 형식의 데이터를 활용해 16가지 신경망을 만들어봅니다. 이 책으로 딥러닝 기초를 다지고 나서 필요하면 최신 논문을 참고하면 실무에서 만나는 데이터에 알맞은 문제 풀이 전략을 고안할 수 있게 될 겁니다.
《텐초의 파이토치 딥러닝 특강》(가제)를 가장 먼저 만나고, 좋은 책이 완성될 수 있도록 의견을 주실 여러분의 참여를 기다립니다.
지은이 : 이종민
발행 예정일 : 2022년 8~9월
난이도 : 입문, 초급, 중급
ISBN : 미정
분량 : 미정
판형 : 46배판형(183mm x 235mm)
콘셉트
동경의 데이터 엔지니어 텐초가
독자 여러분께 드리는 편지
paperswithcode.com에 따르면 2022년 3월 현재 파이토치는 전 세계에서 가장 많이 사용하는 딥러닝 프레임워크입니다. 파이토치는 페이스북, 마이크로소프트 같은 대형 회사부터 대학 연구실까지 많은 사람이 이용합니다. 파이토치 코드는 파이썬 본래의 코드와 유사해 직관적이라는 장점이 있습니다. 텐서플로는 구글에서 공개한 모델이 많고 다양한 플랫폼에서 이용할 수 있다는 장점이 있습니다. 그렇기 때문에 상황에 따라 어느 프레임워크를 이용할지를 정해야 합니다.
이 책은 파이토치를 사용해 딥러닝 신경망을 만들고 학습 결과를 확인합니다. 파이토치는 클래스 기반으로 신경망, 학습 순서를 정의하고 학습합니다. 이 책은 파이토치에서 권고하는 코딩 구조를 먼저 알려드리고 나서 본격적인 학습에 들어갑니다. 신경망을 만들 때는 ‘기본 블록’을 먼저 만들고, 적당한 반복을 하는데 ‘적당한’은 협업을 진행해본 사람만 아는 노하우입니다. 적당한 손실 함수를 선택하거나, 적당한 평가 방법을 고를 때도 마찬가지입니다. 이 책은 그저 코드를 따라 치는 게 아니라 어떤 관점에서 문제를 풀어나가야 하는지 설명을 보태 실무에도 적용할 수 있게 설명합니다.
이런 식으로 16가지 신경망을 모두 학습하고 나면, 딥러닝 알고리즘에 대한 이해뿐만 아니라, 파이토치 코딩에 대한 지식과 실무 노하우도 얻을 수 있습니다. 학습에 도움이 되길 빕니다.
타깃 독자
· 파이썬을 아는 딥러닝 입문자
· 딥러닝을 협업/캐글에서 더 잘 활용하고 싶은 개발자
선수지식
· 파이썬
1단계 딥러닝 입문
인공지능의 배경지식을 알아보고 나서 신경망을 알아보고 간단한 신경망을 만듭니다. 이미 배경지식을 아는 분은 1장과 2장을 건너뛰어도 되지만, 가능하면 리마인드 기회로 삼기 바랍니다.
01. 딥러닝 한눈에 알아보기
02. 인공 신경망 ANN 이해하기
03. 간단한 신경망 만들기
2단계 입문용 신경망 3총사 CNN, ResNet, RNN
이번 단계에서는 딥러닝에서 가장 흔하게 사용되는 알고리즘 세 가지를 소개합니다. 이미지를 처리하는 가장 기본적인 신경망인 VGG(CNN 모델)입니다. 거기서 조금 더 발전된 형태인 ResNet은 최근에도 사용될 정도로 성능이 좋습니다. 마지막으로 시간의 흐름에 따라 순서가 있는 데이터를 시계열 데이터라고 부르는데, 시계열 데이터를 다루는 기본적인 알고리즘인 RNN을 다루겠습니다.
04. 사진 분류하기 : CNN과 VGG
05. 유행 따라가기 : ResNet 만들기
06. 넷플릭스 주가 예측하기 : RNN으로 첫 시계열 학습
3단계 딥러닝으로 이미지 처리하기
분류보다 더 복잡한 이미지 처리 기술인 이미지 세그멘테이션, 이미지 디노이징, 자동 채색을 알아보겠습니다. U-Net, 오토인코더, Let there be color을 이용합니다.
07. 이미지 세그멘테이션 : U-Net
08. 이미지 노이즈 제거 : 오토인코더
09. 자동 채색 : Let there be color 모델
4단계 딥러닝으로 텍스트 처리하기
실전에서 등장하는 시계열 알고리즘을 사용해 조금 더 복잡한 텍스트 처리를 배워보겠습니다 10장에서는 RNN의 발전형인 LSTM을 이용해 ‘글을 쓰는 인공지능’을, 11장에서는 어텐션 기법을 이용해 기계 번역기를 만듭니다. 12장에서는 이미지로부터 텍스트를 추출하는 알고리즘을 알아봅니다. LSTM과 어텐션은 텍스트 처리에서 빠지지 않고 등장하는 개념입니다. 최대한 자세하면서도 쉽게 설명하려고 노력했습니다.
10. 글쓰는 인공지능 : LSTM 텍스트 생성
11. 직접 만드는 번역기 : 어텐션 기계 번역
12. 캡챠 텍스트 인식 : CRNN+GRU
5단계 GAN으로 생성 모델 만들기
그림을 그리거나 음악을 만드는 등을 입력으로 주고 결과물을 출력하는 모델을 생성 모델이라고 부르는데, 가장 기본은 적대적 생성 신경망GAN입니다. 얼굴을 생성하는 GAN, 화질을 개선하는 GAN, 데이터 없이 학습하는 GAN을 만들겠습니다.
13. 얼굴을 생성하는 GAN
14. 화질을 개선하는 GAN
15. 데이터 없이 학습하는 GAN
부록 A 로컬에 개발 환경 구축하기
부록 B 자연어 처리 알아보기
recruitment
베타리딩은 책에 있을 수 있는 문제를 파악하고 더 완성도 높은 책을 만들기 위한 출판 과정입니다.
여러분의 의견 한 줄 한 줄이 더 좋은 책을 만드는 데 큰 힘이 됩니다.