이 책의 제1장은 데이터 마이닝에 대한 개괄적 해설과 함께 교재에서 사용된 데이터세트에 대한 설명으로 구성되어 있다. 제2장부터 제8장까지는 데이터 마이닝 기법 및 모형비교 방법을 소개하고, R 실습을 통해 응용능력을 향상시키는 데 중점을 두고 있다. 이 책에서 다루고 있는 데이터 마이닝 기법은 회귀모형, 의사결정나무모형, 앙상블모형, 신경망모형, 모형평가, 군집분석 및 연관성 분석이며, 각 기법의 주요 내용을 이해하고 실제 R 프로그래밍을 통해 해당 기법을 실습할 수 있도록 구성하였다. 또한 교재 및 강의를 통한 학습내용에 대해 점검할 수 있도록 연구과제를 수록하였다. 이 교재가 데이터 마이닝에 대한 심도 깊은 이해와 활용에 도움이 되기를 바란다.
제1장 데이터 마이닝이란 1.1 데이터 마이닝의 개념 및 사례 1.2 R을 이용한 실습
제2장 회귀모형 2.1 선형회귀모형 2.2 로지스틱회귀모형 2.3 범주형 입력변수 처리 2.4 모형구축을 위한 변수선택 2.5 R을 이용한 실습
제3장 의사결정나무 3.1 의사결정나무란 3.2 분류의사결정나무의 분할방법 3.3 분류의사결정나무의 크기 선택 3.4 회귀의사결정나무의 분할방법 3.5 R을 이용한 실습
제4장 앙상블모형 4.1 앙상블모형이란 4.2 앙상블모형의 종류 4.3 R을 이용한 실습
제5장 신경망모형 5.1 신경망모형이란 5.2 신경망의 등장 5.3 신경망의 구성 및 종류 5.4 신경망을 이용한 훈련 5.5 신경망모형의 장단점 5.6 딥러닝 5.7 R을 이용한 실습
제6장 모형비교평가 6.1 평가모형 6.2 평가측도 6.3 데이터 분할에 의한 타당도 평가 6.4 R을 이용한 실습
제8장 연관성분석 8.1 연관성분석이란 8.2 연관성분석의 종류 8.3 연관성분석의 절차 8.4 연관성분석의 장단점 8.5 R을 이용한 실습
참고문헌
장영재
서울대학교 자연과학대학 계산통계학과(이학사) 미국 University of Wisconsin-Madison 통계학과(이학석사, 통계학박사) 한국은행 경제통계국 조사국 차장 ˙현재: 한국방송통신대학교 자연과학대학 통계 ․ 데이터과학과 교수
김현중
연세대학교 상경대학 응용통계학과(경제학사) 연세대학교 대학원 응용통계학과(경제학석사) 미국 University of Wisconsin-Madison 통계학과(통계학박사) 미국 University of Tennessee 통계학과 조교수 ∙현재: 연세대학교 상경대학 응용통계학과 교수
조형준
고려대학교 정경대학 통계학과(경제학사) 고려대학교 대학원 통계학과(이학석사) 미국 University of Wisconsin-Madison 통계학과(통계학박사) 미국 University of Virginia 생물통계학과 조교수 ∙현재: 고려대학교 정경대학 통계학과 교수