[Must Have] 나성호의 R 데이터 분석 입문

자료구조가 핵심이다! 기초부터 탄탄히 익히는 R 데이터 분석 입문의 정석

지은이 : 나성호
발행 예정일 : 2021년 10월 15일
난이도 : 초급, 중급
정가 : 20,000원
신간안내 :

ISBN : 979-11-91905-03-8 93000
분량 : 300쪽
판형 : 46배판형(183mm x 235mm)
소스 코드 :
강의교안 :

판매 중

16,000

설명

명강사가 알려주는 입문자가 알아야 하는
탄탄한 데이터 분석 기본기

저자는 패스트캠퍼스/러닝스픈즈/멀티캠퍼스를 비롯해 유수의 기업에서 데이터 분석 강의를 진행한 명강사입니다. 강의를 하며 수강생은 바쁘다 바쁘다는 이유로 자료 구조를 건너뛰고 무작정 데이터 분석부터 배우면 데이터 분석을 제대로 익히지 못한다는 사실을 알아냈습니다.

그래서 이 책을 준비했습니다. 한 권으로 특히 데이터 분석 핵심인 자료 구조를 자유자재로 다룰 수 있게 중점적으로 설명하고 데이터 분석 전과정을 체험하게 구성했습니다. 단순히 명령어 사용법만 안다고 데이터 분석을 할 수는 없습니다. 실제 현장에서 만나게 되는 다양한 경우에 맞춰 활용하는 방법을 알아야 합니다.

반드시 데이터 분석을 제대로 익히고 싶은 분이라면 17년간 데이터 분석가로, 3년간 강사로 활약한 저자가 제시하는 학습 방법을 따라 책에 담긴 데이터 분석 노하우도 모두 챙겨가기 바랍니다. 잊지 마세요, 자료구조가 핵심이고 먼저입니다.

데이터 분석을 잘하려면
자료구조와 프로그래밍의 기본을 잘 알아야 합니다.

데이터 분석에 능숙하고 싶습니까? 그렇다면 자료구조를 먼저 탄탄히 익혀야 합니다. 데이터 분석 과정은 데이터를 다양한 형태로 바꾸며 진행되기 때문입니다. 그래서 이 책은 먼저 자료구조를 탄탄히 익히고 나서 R 프로그래밍, 데이터 수집, 전처리, 기술통계 분석, 시각화를 설명합니다.

엑셀 파일, 텍스트 파일, RDS 파일, RDA 파일 입출력을 배웁니다. 데이터의 분포와 시간에 따른 변화 및 상관관계 등 데이터 분석 과정에 유용한 5가지 시각화 그래프(히스토그램, 상자 수염 그림, 막대, 선, 산점도)를 소개합니다. 국토교통부 ‘아파트 매매가격 데이터’와 한국 감정원 ‘K-APT 아파트단지’ 정보 4천 여건을 직접 수집해 활용합니다.

17년간 데이터 분석가로서, 3년간 강사로서 활동하며 깨달은 ’고급 분석가로 가기 전에 이 정도는 알아야 하는 내용’을 충실히 담았습니다. 데이터 분석가를 꿈꾸는 대학생과 취업 준비생은 물론 데이터 분석가로 직무 전환을 바라는 직장인이 한 권으로 R 입문과 데이터 분석 전반을 체험하고 익힐 수 있도록 구성했습니다.

더 보기

숫자로 보는 책의 특징

0 아무것도 몰라도 OK
R을 몰라도 됩니다. R 입문과 데이터 분석 입문 과정 모두를 알려줍니다.

3 단계로 익히는 R 데이터 분석
1단계에서 R 자료구조, 2단계에서 프로그래밍, 3단계에서 데이터 분석(수집, 전처리, 기술 통계, 시각화)을 차례대로 배웁니다.

3가지 OS별 개발 환경 구축
윈도우, 맥OS, 리눅스 개발 환경 구성 방법을 모두 제시합니다.

4가지 데이터 입출력 형식
엑셀 파일, 텍스트 파일, RDS 파일, RDA 파일 입출력을 배웁니다. 이 4가지 형식으로 입출력을 자유자재로 할 줄 알면 데이터 관리가 훨씬 수월해집니다.

5가지 데이터 시각화 그래프 학습
데이터의 분포와 시간에 따른 변화 및 상관관계 등 데이터 분석 과정에 유용한 5가지 시각화 그래프(히스토그램, 상자 수염 그림, 막대, 선, 산점도)를 소개합니다.

4000여건 아파트 매매 데이터
국토교통부 ‘아파트 매매가격 데이터’와 한국 감정원 ‘K-APT 아파트단지’ 정보를 직접 수집해 활용합니다.

이 책의 구성

이 책은 먼저 자료구조를 탄탄히 익히고 나서 R 프로그래밍, 데이터 수집, 전처리, 기술통계 분석, 시각화를 설명합니다.

1단계 R 자료구조 : 자료구조가 핵심이다. 잘 다뤄야 분석이 쉽다

자료형과 자료구조에 익숙해집시다. 구글링으로 발견한 코드를 자신의 데이터에 적용할 때 에러가 발생하고, 문제를 해결하지 못하는 이유는 자료형과 자료구조에 대한 이해가 부족하기 때문입니다. 데이터를 담는 그릇인 자료구조를 알아야 데이터를 제대로 다룰 수 있습니다.

_1장 R 데이터 분석 입문

생애 첫 R 프로그램을 만들고, 코드를 실행하고 프로젝트를 생성하는 방법을 알아봅니다. R 기본 구문과 객체도 알아보며 기본을 다집니다. 무협지 무림 고수가 기초 체력부터 다진 후 화려한 기술을 익히듯이, 코딩 고수를 목표로 기초부터 제대로 익히는 시간이 될 겁니다.

_2장 자료구조 : 벡터

R에서 가장 기본이 되는 자료구조인 벡터를 알아봅시다. 벡터는 같은 자료형을 원소로 갖는 자료구조이며, 나중에 학습할 리스트와 데이터프레임의 원소로 사용됩니다.

더 보기

목차

00 R 환경 구축

[1단계] R 자료구조 : 데이터를 담는 그릇을 알아야 제대로 다룰 수도 있다

01장 데이터 분석 입문

__1.1 R 기초 지식
__1.2 생애 첫 R 프로그래밍 : Hello World
__1.3 R 객체의 특징
__1.4 R 자료구조 종류
__학습 마무리

02장 자료구조 : 벡터

__2.1 R 자료형과 벡터의 특징
__2.2 벡터 생성
__2.3 벡터 원소 선택
__2.4 벡터 원소 추가
__2.5 벡터 원소 삭제
__2.6 벡터 원소 변경
__2.7 벡터 형변환
__2.8 벡터 강제변환
__2.9 산술 연산자
__2.10 비교 연산자
__2.11 논리 연산자
__2.12 멤버 연산자 : %in%
__학습 마무리

더 보기

나성호

2002년에 삼성화재 CRM 파트에서 직장생활을 시작하여 현대캐피탈, 하나카드, 하나금융경영연구소 등 다양한 금융회사에서 데이터 분석을 직접 수행하는 마케터이자 연구원으로 약 17년 동안 근무했습니다.

패스트캠퍼스 전임강사로 <R을 활용한 웹 크롤링>과 을, 멀티캠퍼스에서 <R을 활용한 데이터 분석>, 러닝스푼즈 나노디그리 과정에서 <R을 활용한 데이터 분석>을 강의했습니다. 현재는 R과 파이썬으로 데이터 수집(웹 크롤링), 전처리, 시각화, 통계 분석 및 머신러닝을 주제로 여러 기업에서 강의를 하고 있습니다. 2020년 말에 박사 과정을 수료하여 졸업을 눈앞에 두고 있습니다.

저·역서
《나성호의 R 데이터 분석 입문》 저
《효율적인 R 프로그래밍》 공역
《포워드 2019 미래를 읽다》 공저

[Python] 파이썬으로 엑셀 다루기 | ❷ 엑셀 데이터 사용하기

실제 업무에서 가장 많이 다루는 프로그램 중 하나인 엑셀을 파이썬으로 자동화하는 방법을 알아보겠습니다. 파이썬으로 엑셀 데이터를 다루면 수백 개의 엑셀 파일을 하나로 합치거나 특정 조건에 맞는 데이터만 추출하는 등의 반복 작업을 코드 몇 줄로 자동화할 수 있습니다. 파이썬을 통해 엑셀 프로그램보다 더 빠르게 엑셀 데이터를 처리해봅시다.

Read More

[Python] 파이썬으로 엑셀 다루기 | ❶ 엑셀 데이터 사용하기

실제 업무에서 가장 많이 다루는 프로그램 중 하나인 엑셀을 파이썬으로 자동화하는 방법을 알아보겠습니다. 파이썬으로 엑셀 데이터를 다루면 수백 개의 엑셀 파일을 하나로 합치거나 특정 조건에 맞는 데이터만 추출하는 등의 반복 작업을 코드 몇 줄로 자동화할 수 있습니다. 파이썬을 통해 엑셀 프로그램보다 더 빠르게 엑셀 데이터를 처리해봅시다.

Read More

[Python] 아나콘다 설치하기 | Anaconda, 파이썬, 주피터 노트북, 단축키

아나콘다는 ‘종합 패키지’입니다. 또한 콘다(Conda) 패키지 관리자라는 것도 함께 설치되는데, 이를 통해 아나콘다로 설치했거나 설치하지 못한 다른 라이브러리 또는 패키지를 쉽게 설치하고 관리할 수 있습니다. 한마디로 파이썬 버전 문제를 해결한 라이브러리 패키지를 몽땅 쉽게 설치할 수 있게 만든 것이 아나콘다입니다. 파이썬만 설치할 수도 있지만 초보자라면 아나콘다를 설치하는 것을 권장합니다. 설치 방법과 주피터 노트북 사용법을 알아보겠습니다.

Read More

[강의] 5. 파이썬 데이터 분석가 되기_데이터 시각화(1) 색상표+파이 차트+막대 그래프

이번 강의에서는 6장 넷플릭스 데이터 분석 프로젝트를 실습합니다. 교보문고에서 도서 출간을 기념하여 독자분들을 위해 준비한 특별 강연으로, 넷플릭스 데이터를 활용한 실전 데이터 분석 과정을 함께 실습해 볼 예정입니다. 5편은 데이터 시각화(1) 색상표+파이 차트+막대 그래프입니다.

Read More
MISPRINT

오탈자를 알려주세요

알려주신 오탈자는 검토 후 다음 쇄에 반영되며,
내역은 정오표에서 확인할 수 있습니다.

SUBSCRIPTION

책 이야기를 들려드립니다.

책이 만들어지는 집필, 편집, 베타리딩 등의 출간 소식뿐 아니라,
관련 주제의 책 소식, 저자와의 만남, 강의, 오탈자 등 책 관련 소식을 전해드립니다.

    ©2020 GoldenRabbit. All rights reserved.
    상호명 : 골든래빗 주식회사
    (04051) 서울특별시 마포구 양화로 186, 5층 512호, 514호 (동교동, LC타워)
    TEL : 0505-398-0505 / FAX : 0505-537-0505
    대표이사 : 최현우
    사업자등록번호 : 475-87-01581
    통신판매업신고 : 2023-서울마포-2391호
    master@goldenrabbit.co.kr
    개인정보처리방침
    배송/반품/환불/교환 안내