[Must Have] 나성호의 R 데이터 분석 입문

지은이 : 나성호
발행 예정일 : 2021년 10월
난이도 : 초급, 중급
정가 : 미정

ISBN : 미정
분량 : 미정
판형 : 46배판형(183mm x 235mm)

베타리딩

0

설명

명강사가 알려주는 입문자가 알아야 하는
탄탄한 데이터 분석 기본기

이 책은 R 프로그래밍의 기초를 단단하게 다지고, 특히 데이터프레임을 전처리하는 방법을 충실하게 익혀 R을 활용한 데이터 분석 과정을 체험할 수 있게 합니다. 약 17년간 금융회사에서 현업 분석가로 근무한 경험을 살려서 데이터 분석가가 업무상 알아야 할 내용을 체계적으로 구성한 것이 특징입니다. 아울러 강의 경험에서 얻은 ‘공부는 재미있어야 꾸준하게 할 수 있다’는 신념을 살려 누구나 관심을 가질 만한 부동산 데이터를 활용합니다.

왜 이 책으로 R 데이터 분석에 입문해야 하나요?

나성호 저자는 F사/L사/M사 같은 다양한 기업에서 강의한 명강사입니다. 강의를 하며 ❶ 수강생은 바쁘다 ❷ 바쁘다는 이유로 자료 구조를 건너뛰고 무작정 데이터 분석부터 배우면 ❸ 데이터 분석을 제대로 익히지 못한다는 사실을 알아냈습니다.

그래서 이 책을 준비했습니다. ❶ 한 권으로 ❷ 특히 데이터 분석 핵심인 자료 구조를 자유자재로 다룰 수 있게 중점적으로 설명하고 ❸ 데이터 분석 전과정을 체험하게 구성했습니다. 단순히 명령어 사용법만 안다고 데이터 분석을 할 수는 없습니다. 실제 현장에서 만나게 되는 다양한 경우에 맞춰 활용하는 방법을 알아야 합니다.

반드시 데이터 분석을 제대로 익히고 싶은 분이라면 17년간 데이터 분석가로 활약한 저자가 제시하는 학습 방법을 따라 책에 담긴 데이터 분석 노하우도 모두 챙겨가기 바랍니다. 잊지 마세요, 자료구조가 먼저입니다.

0 아무것도 몰라도 OK
R을 몰라도 됩니다. R 입문과 데이터 분석 입문 과정 모두를 알려줍니다.

3 단계로 익히는 R 데이터 분석
1단계에서 R 자료구조, 2단계에서 프로그래밍, 3단계에서 데이터 분석(수집, 전처리, 기술 통계, 시각화)을 차례대로 배웁니다.

3가지 OS별 개발 환경 구축
윈도우, 맥OS, 리눅스 개발 환경 구성 방법을 모두 제시합니다.

4가지 데이터 입출력 형식
엑셀 파일, 텍스트 파일, RDS 파일, RDA 파일 입출력을 배웁니다. 이 4가지 형식으로 입출력을 자유자재로 할 줄 알면 데이터 관리가 훨씬 수월해집니다.

5가지 데이터 시각화 그래프 학습
데이터의 분포와 시간에 따른 변화 및 상관관계 등 데이터 분석 과정에 유용한 5가지 시각화 그래프(히스토그램, 상자 수염 그림, 막대, 선, 산점도)를 소개합니다.

2020년 아파트 매매 데이터 활용
국토교통부 ‘아파트 매매가격 데이터’와 한국 감정원 ‘K-APT 아파트단지’ 정보를 직접 수집해 활용합니다.

이 책의 구성

이 책은 0~3단계까지, 배경지식부터 Go 프로그래밍에 유용한 기법까지 다룹니다. 추가로 본문에서 다하지 못한 이야기는 에서 더 깊고 자세히 다룹니다.

_0단계 Go 언어를 배우기 전에

기초 원리를 잘 알아야 더 깊은 이해를 할 수 있습니다. 본격적으로 Go 프로그래밍 언어를 배우기 앞서 개발 환경을 구축합니다. 그후 프로그래밍 입문자와 초보자를 고려해 컴퓨터란 무엇이고, 어떻게 동작하는지 또 프로그래밍이란 무엇인지, 현대적 프로그래밍 언어가 탄생하게 된 배경은 무엇이고, Go 언어는 어떤 특징을 가지는지 살펴봅니다. 컴퓨터, 프로그램, 프로그래밍 언어의 관계를 더 잘 이해하고 더 좋은 코드를 만드는 발판이 되길 바랍니다.

더 보기

_1단계 가볍게 Go 입문하기

Go 언어 기본 문법을 차근차근 배웁니다. 변수, 연산자, 제어문, 함수 등 대부분 언어가 제공하는 기본 문법입니다. Go 언어의 기본 문법과 프로그래밍 방식을 알려드립니다.

_2단계 고급 기법으로 Go 레벨업하기

Go 언어 고급 문법을 알아봅시다. 메서드, 인터페이스, 다양한 함수 활용 방법을 살펴봅니다. 상황에 맞게 자료구조를 선택하는 방법과 예외 상황에 대처하는 방법도 배웁니다. 고루틴, 채널, 컨텍스트를 활용한 Go 언어만의 독특한 동시성 프로그래밍도 배우게 됩니다. 마지막 장에서는 ★ 두 개 수준 프로젝트로 파일에서 원하는 단어를 찾는 프로그램을 만들어보겠습니다.

_3단계 Go 프로그래밍에 유용한 기법 익히기

3단계는 어엿한 Go 언어 프로그래머로 첫발을 내딛을 수 있도록 돕는 데 목적이 있습니다. Go 언어 문법은 이미 다 배웠습니다. 문법만 익혀서는 좋은 프로그램을 만들 수 없습니다. 문법을 넘어서 Go 프로그래머로 성장해야 합니다. SOLID 객체지향 설계 원칙, 테스트, 벤치마크 방법을 익히며 좋은 프로그램을 만드는 프로그래머로 성장해봅시다. 이대로 끝나면 아쉽겠죠? 지금까지 배운 것을 바탕으로 29장에서는 웹 서버를 만듭니다. 그리고 ‘RESTful API 서버’, ‘Todo 리스트 웹 사이트 만들기’ 프로젝트를 함께 진행해보고 마무리합니다.

_Tucker 노트

본문에서 미처 다루지 못한 Go 문법, 생각하는 프로그래밍, Go 언어를 Go답게 쓰는 방법을 알려드립니다. 저자 Tucker의 특별한 노트를 만나보세요.
A. Go 문법 보충 수업
B. 생각하는 프로그래밍

목차

00 R 환경 구축

[1단계] R 자료구조 : 데이터를 담는 그릇을 알아야 제대로 다룰 수도 있다

01장 데이터 분석 입문

__1.1 R 기초 지식
__1.2 생애 첫 R 프로그래밍 : Hello World
__1.3 R 객체의 특징
__1.4 R 자료구조 종류
__학습 마무리

02장 자료구조 : 벡터

__2.1 R 자료형과 벡터의 특징
__2.2 벡터 생성
__2.3 벡터 원소 선택
__2.4 벡터 원소 추가
__2.5 벡터 원소 삭제
__2.6 벡터 원소 변경
__2.7 벡터 형변환
__2.8 벡터 강제변환
__2.9 산술 연산자
__2.10 비교 연산자
__2.11 논리 연산자
__2.12 멤버 연산자 : %in%
__학습 마무리

더 보기

03장 자료구조 : 리스트 093

__3.1 리스트 특징
__3.2 리스트 생성 : list( )
__3.3 리스트 원소 선택
__3.4 리스트 원소 추가
__3.5 리스트 원소 삭제
__3.6 리스트 원소 변경
__학습 마무리

04장 자료구조 : 데이터프레임 103

__4.1 데이터프레임 특징
__4.2 데이터프레임 생성 : data.frame()
__4.3 데이터프레임 원소 선택
__4.4 데이터프레임 원소 추가
__4.5 데이터프레임 원소 삭제
__4.6 데이터프레임 원소 변경
__학습 마무리

[2단계] R 프로그래밍 : 프로그래밍을 알아야 효과적으로 분석한다

05장 조건문

__ 05 조건문
__5.1 if문 기본 구조
__5.3 ifelse() 함수
__학습 마무리

06장 반복문

__6.1 for문
__6.2 while문
__6.3 이후 코드 건너뛰기 : next
__6.4 반복문 탈출하기 : break
__학습 마무리

07장 사용자 정의 함수

__7.1 왜 사용자 정의 함수가 필요할까?
__7.2 사용자 정의 함수의 기본 구조
__7.3 사용자 정의 함수 생성
__7.4 파일로 저장한 사용자 정의 함수 재활용
__7.5 인수의 기본값 설정
__학습 마무리

08장 같은 함수 반복 실행

__8.1 벡터를 넣어 반복 실행하는 함수 : apply()
__8.2 for문과 비교
__8.3 원소를 넣어 반복 실행하는 함수 : lapply()와 sapply()
__8.4 FUN에 사용자 정의 함수 사용하기
__학습 마무리

[3단계] R 데이터 분석 : 아파트 실거래 데이터로 실전처럼 익히자

09장 데이터 입출력

__9.1 사전 지식 : tidyverse 패키지 소개
__9.2 작업 경로 확인 및 변경
__9.3 엑셀 파일 입출력
__9.4 텍스트 파일 입출력 : csv파일, txt 파일
__9.5 RDS 파일 입출력
__9.6 RDA 파일 입출력
__학습 마무리

10장 오픈 API를 활용한 공공데이터 수집과 처리

__10.1 사전 지식 : API
__10.2 STEP 1 공공데이터포털 오픈 API 활용하기
__10.3 STEP 2 기술문서 읽기
__10.4 STEP 3 데이터 가져오기
__10.5 STEP 4 데이터 처리하기
__학습 마무리

11장 데이터프레임 전처리

__11.1 사전 지식 : dplyr 패키지
__11.2 STEP 1 실습 데이터셋 준비
__11.3 STEP 2 컬럼 선택 및 삭제
__11.4 STEP 3 컬럼명 변경
__11.5 STEP 4 조건에 맞는 행 선택(필터링)
__11.6 STEP 5 인덱스로 행 선택 및 삭제
__11.7 STEP 6 컬럼의 자료형 변환
__11.8 STEP 7 기존 컬럼 변경 및 새로운 컬럼 생성
__11.9 STEP 8 집계 함수로 데이터 요약
__11.10 STEP 9 데이터프레임 형태 변환
__11.11 STEP 10 오름차순 및 내림차순 정렬
__학습 마무리

12장 데이터프레임 병합

__12.1 데이터프레임 병합
__12.2 STEP 1 실습 데이터셋 준비
__12.3 STEP 2 외래키 확인 및 전처리
__12.4 STEP 3 외래키 중복 여부 확인
__12.5 STEP 4 데이터프레임 병합 실습
__학습 마무리

13장 기술통계

__13.1 기술통계 분석
__13.2 실습 데이터셋 준비
__13.3 대푯값 : 평균, 절사평균, 중위수, 백분위수, 사분위수
__13.4 산포 : 최솟값, 최댓값, 범위, 사분범위, 분산, 표준편차
__13.5 선형관계 : 공분산, 상관계수
__학습 마무리

14장 데이터 시각화 : ggplot2 패키지

__14.1 사전 지식 : ggplot2 패키지
__14.2 시각화
__14.3 실습 데이터셋 준비 및 폰트 추가
__14.4 히스토그램 시각화
__14.5 상자 수염 그림 시각화
__14.6 막대 그래프 시각화
__14.7 선 그래프 시각화
__14.8 산점도 시각화
__학습 마무리

나성호

2002년에 삼성화재 CRM 파트에서 직장생활을 시작하여 현대캐피탈, 하나카드, 하나금융경영연구소 등 다양한 금융회사에서 데이터 분석을 직접 수행하는 마케터이자 연구원으로 약 17년 동안 근무했습니다.

패스트캠퍼스 전임강사로 <R을 활용한 웹 크롤링>과 을, 멀티캠퍼스에서 <R을 활용한 데이터 분석>, 러닝스푼즈 나노디그리 과정에서 <R을 활용한 데이터 분석>을 강의했습니다. 현재는 R과 파이썬으로 데이터 수집(웹 크롤링), 전처리, 시각화, 통계 분석 및 머신러닝을 주제로 여러 기업에서 강의를 하고 있습니다. 2020년 말에 박사 과정을 수료하여 졸업을 눈앞에 두고 있습니다.

저·역서
《나성호의 R 데이터 분석 입문》 저
《효율적인 R 프로그래밍》 공역
《포워드 2019 미래를 읽다》 공저

MISPRINT

오탈자를 알려주세요

알려주신 오탈자는 검토 후 다음 쇄에 반영되며,
내역은 정오표에서 확인할 수 있습니다.

SUBSCRIPTION

책 이야기를 들려드립니다.

책이 만들어지는 집필, 편집, 베타리딩 등의 출간 소식뿐 아니라,
관련 주제의 책 소식, 저자와의 만남, 강의, 오탈자 등 책 관련 소식을 전해드립니다.

    상품평

    아직 상품평이 없습니다.

    “[Must Have] 나성호의 R 데이터 분석 입문”의 첫 상품평을 남겨주세요

    이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다

    ©2020 GoldenRabbit. All rights reserved.
    서울시 마포구 신촌로2길 19 302호 (우)04051
    master@goldenrabbit.co.kr
    개인정보처리방침