이 글은 한빛미디어에서 출간한 “핸즈온 머신러닝” 도서의 1장과 2장의 내용입니다. 1장, 2장은 머신러닝에 대한 개괄적인 소개와 머신러닝 프로젝트를 진행하는 자세한 단계를 포함하고 있어서 많은 사람들에게 유익한 자료가 되길 기대합니다. 이 책은 온라인(YES24, 교보문고)/오프라인 서점에서 구입하실 수 있습니다. 구입하시면 저에게 큰 도움이 됩니다.
★★★★★ 제가 본 한국어로 된 ML책중에서 최고의 기량을 갖추었습니다.(bk**ys 님)
♥♥♥♥ 좋은 책입니다. 꼭 읽어봅시다.(we**lifema 님)
★★★★ 현존하는 머신러닝 책중 최고.(wnghdcjfe 님)
★★★★★ 머신러닝/딥러닝계의 바이블이라고 생각합니다!(Kebee 님)
★★★★★ 책장에 꽂아두고 마르고 닳도록 꺼내 보는 그러한 책인 것이다.(dragmove 님)도서의 내용을 공개할 수 있도록 허락해 주신 한빛미디어 출판사에 깊이 감사드립니다. 이 책의 저작권은 한빛미디어(주)에 있으므로 무단 복제 및 무단 전제를 금합니다.
추천의 글
옮긴이의 말
이 책에 대하여
감사의 글
1. 한눈에 보는 머신러닝
- 머신러닝이란?
- 왜 머신러닝을 사용하는가?
- 머신러닝 시스템의 종류
- 지도 학습과 비지도 학습
- 배치 학습과 온라인 학습
- 사례 기반 학습과 모델 기반 학습
- 머신러닝의 주요 도전 과제
- 충분하지 않은 양의 훈련 데이터
- 대표성 없는 훈련 데이터
- 낮은 품질의 데이터
- 관련 없는 특성
- 훈련 데이터 과대적합
- 훈련 데이터 과소적합
- 한걸음 물러서서
- 테스트와 검증
- 연습문제
2. 머신러닝 프로젝트 처음부터 끝까지
- 실제 데이터로 작업하기
- 큰 그림 보기
- 문제 정의
- 성능 측정 지표 선택
- 가정 검사
- 데이터 가져오기
- 작업환경 만들기
- 데이터 다운로드
- 데이터 구조 훑어보기
- 테스트 세트 만들기
- 데이터 이해를 위한 탐색과 시각화
- 지리적 데이터 시각화
- 상관관계 조사
- 특성 조합으로 실험
- 머신러닝 알고리즘을 위한 데이터 준비
- 데이터 정제
- 텍스트와 범주형 특성 다루기
- 나만의 변환기
- 특성 스케일링
- 변환 파이프라인
- 모델 선택과 훈련
- 훈련 세트에서 훈련하고 평가하기
- 교차 검증을 사용한 평가
- 모델 세부 튜닝
- 그리드 탐색
- 랜덤 탐색
- 앙상블 방법
- 최상의 모델과 오차 분석
- 테스트 세트로 시스템 평가하기
- 론칭, 모니터링, 그리고 시스템 유지 보수
- 직접 해보세요!
- 연습문제