일정표 불러오는 중

« 모든 일정표

  • 일정(이벤트)이 종료되었습니다.

[마감] 《데싸노트의 머신러닝 TOP 10 알고리즘》 베타리더를 모집합니다

2022-03-02 - 2022-03-04

BETA READING

캐글과 현업에서 머신러닝을 활용하려면
얼마나 많은 머신러닝 알고리즘을 알아야 하는 걸까?

뉴욕에서 데이터 사이언티스트로 활약하는 저자는 콜롬비아 대학교 대학원생 튜터로, 패스트캠퍼스 데이터분석 강사와 거북이반 스터디 리더로 활동하면서 이론보다 데이터 분석을 바탕으로 한 코딩에 집중할 때 학습 능력이 더 오르는 것을 발견했습니다. 그래서 각 알고리즘을 ‘기초 지식 ➝ 데이터 분석 ➝ 전처리 ➝ 모델링 ➝ 평가 ➝ 알고리즘 깊이 이해하기’ 순서로 격파해나갑니다.

캐글 챌린지에도 통하는 10가지 알고리즘으로 머신러닝을 알려줍니다. 당연히 실무에서도 통합니다. 이 책을 읽고 나면 독자 스스로가 데이터에 알맞은 문제 풀이 전략을 고안할 수 있게 될 겁니다.

《데싸노트의 머신러닝 TOP 10 알고리즘》(가제)를 가장 먼저 만나고, 좋은 책이 완성될 수 있도록 의견을 주실 여러분의 참여를 기다립니다.

지원하기

지은이 : 권시현
발행 예정일 : 2022년 4~6월
난이도 : 입문, 초급, 중급

ISBN : 미정
분량 : 약 500쪽
판형 : 46배판형(183mm x 235mm)

권시현 
현) IDT Corporation (미국 모바일 서비스 업체) 데이터 사이언티스트
전) 콜롬비아 대학교, Machine Learning Tutor, 대학원생 대상
전) 콜롬비아 대학교, Big Data Immersion Program Teaching Assistant
전) 콜롬비아 대학교, M.S. in Applied Analytics
전) 삼성전자 무선사업부, 스마트폰 데이터 분석가
전) 삼성전자 무선사업부, 모바일앱 스토어 데이터 관리 및 운영

강의 경력
패스트캠퍼스 〈파이썬을 활용한 이커머스 데이터 분석 입문〉

 콘셉트

뉴욕의 데이터사이언스 데싸노트가 독자 여러분께 드리는 편지

제가 지금까지 본 대부분의 책과 강의들은 기본부터 시작하여 정해진 스텝으로 진행이 됩니다. 제가 경험한 바, 입문자의 입장에서는 이 기초적인 과정이 매우 지루하고, 이걸 통해 내가 나중에 어떤 결과물을 만들 수 있는지 전혀 알 수 없기 때문에 쉽게 의욕이 생겨나지 않습니다.

이 책은 기존 책과 큰 차이가 있습니다. 상세한 기초적인 코딩 및 이론은 코딩을 마친 후로 파트는 뒤로 미루고, 일단 머신러닝 알고리즘 코드를 작성합니다. 그저 코드를 따라 치는 게 아니라 어떤 관점에서 문제를 풀어나가야 하는지 설명을 보태 실무에도 적용할 수 있게 됩니다. 이렇게 손으로 결과물을 만들어보고 나서 이론을 깊게 살펴봅니다. 회고를 통해 전체 과정을 다시금 머리에 상기시키고, 핵심 개념과 용어를 복습합니다.

이런 식으로 TOP 10 알고리즘을 모두 학습하고 나면, 머신러닝 알고리즘에 대한 이해뿐만 아니라, 코딩에 대한 기초 지식도 자연스럽게 갖출 수 있습니다. 무엇보다 큰 장점은, 결과물을 바로 확인하고 본인이 무엇을 하고있는지 직관적으로 알 수 있기 때문에, 의욕을 고취시킨다는 데 있습니다.

타깃 독자

· 적어도 프로그래밍 언어 하나를 아는 머신러닝 입문자
· 머신러닝을 협업/캐글에서 더 잘 활용하고 싶은 개발자

선수지식

· 객체지향 개념이 있는 프로그래밍 언어를 적어도 하나 익힌 사람

 이 책의 특징

알고리즘은 달라도 머신러닝 실행 순서는 학습 ➝ 예측 ➝ 평가로 진행됩니다. 이 부분은 거의 정형화되어 있어 성능에 큰 영향을 미치지 않습니다. 쓰레기가 들어가면 쓰레기가 나온다고 합니다. 머신러닝에 딱맞는 말입니다. 좋은 데이터가 좋은 머신러닝 모델을 만듭니다. 그래서 이 책은 TOP 10 알고리즘을 공략하면서 무엇보다 데이터를 분석과 가공에 공을 들입니다. 데이터에 어떤 가공 기법이 필요한지 하나하나 분석하며 클리닝, 피처 엔지니어링, 차원축소 등의 기법을 사용할 겁니다. 이렇게 데이터 분석 능력을 기르며 알고리즘을 익히면 현업과 캐글에서도 통하는 실력을 갖추게 됩니다.

더 깊이 살펴보고 싶다면 다음 문서를 보시기 바랍니다.

실습 환경 안내

1부 : 배경지식 익히기

파이썬 문법 입문
판다스와 넘파이
머신러닝 배경지식

2부 : 답을 알려줘야 학습하는 머신러닝 지도학습 알고리즘

선형 회귀 분석 : 보험 데이터셋
로지스틱 회귀 분석 : 타이타닉 데이터셋
K-최근접 이웃(KNN) : 와인 등급 데이터셋
나이브 베이즈 분류 : 스팸 메일 데이터셋
결정 트리 : 연봉 데이터셋
랜덤 포레스트 : 자동차 데이터셋
XG부스트 : 스피드 데이팅 데이터셋
라이트GBM : 카드 거래 내역 데이터셋

3부 : 답을 스스로 찾는 비지도학습 알고리즘

K-평균 군집화 : 카드 고객 데이터셋
주성분 분석(PCA) : 고객 데이터셋 및 익명 데이터셋

recruitment

베타리딩은 책에 있을 수 있는 문제를 파악하고 더 완성도 높은 책을 만들기 위한 출판 과정입니다.

여러분의 의견 한 줄 한 줄이 더 좋은 책을 만드는 데 큰 힘이 됩니다.

2022년 3월 2일(수) ~ 3월 4일(금)

2022년 3월 8일(화) ~ 3월 29일(화)

《데싸노트의 머신러닝 TOP 10 알고리즘》(가제) 종이책을 드립니다.

대상 독자에 적합한 난이도와 깊이로 설명하는가?
개념 설명이 이해가 되는가? 어려운 부분은 없는가?
실습을 따라하는 데 문제가 없는가?
구성을 바꾸거나 추가했으면 하는 내용은 없는가?

    세부 사항

    시작:
    2022-03-02
    종료:
    2022-03-04
    이벤트 카테고리:
    이벤트 Tags:
    , , , , , , , , , , , , , , , ,

    장소

    온라인

    1 Comment

    • Rabbit 댓글:

      베타리더를 발표합니다!

      권순범, 박가단, 박서현, 안다혜, 조동민, 강점우, 강하림, 김용욱, 박조은, 송진영, 이진원, 최우성, 황후순, 김승규, 정현준, 최선경 이상 16분 축하합니다.

    Leave a Reply