본문 바로가기
[eBook] 비정형데이터분석
비정형데이터분석 표지

장영재, 손원, 황희진 지음
파일크기 : 15(MB)
파일포맷 : PDF
2020년 08월 01일
워크북
대여 : 6,850 원 (180일 , 50%↓)
판매 정보
판매상태
정상
정오표
확인하기

이 책은 대표적인 비정형 데이터인 텍스트 데이터의 특징과 구체적인 분석 방법을 중점적으로 다루고 있다. 특히 통계학 전공자들이 기존 지식을 바탕으로 텍스트 데이터를 실제 분석해 볼 수 있도록 R을 이용한 분석 절차를 단계적으로 상세하게 정리하였다. 학습자들이 이 책에서 제시한 사례를 충실하게 익히고 분석 예제를 실습해 봄으로써 비정형 데이터에 대한 통찰력과 분석 능력을 함양하여 사회가 요구하는 데이터 과학자의 모습을 갖추어 나가길 기대한다.
이 책은 8개의 장으로 구성되어 있다. 제1장에서는 데이터의 개념과 환경 변화 등 비정형 데이터의 등장 배경에 대해 소개하였다. 제2장에서는 비정형 데이터 분석의 도구로서 다양한 프로그래밍 언어를 정리하였다. 제3장에서는 대표적인 비정형 데이터인 텍스트 데이터의 특징과 입수 방법을 살펴보았다. 제4장 및 5장에서는 텍스트 데이터의 전처리 방법과 탐색적 분석 방법을 다루었다. 제6장에서는 벡터공간모형을 이용하여 텍스트 데이터를 표현하는 방법을 설명하였으며, 제7장에서는 데이터 마이닝 기법을 이용하여 텍스트 데이터를 분석해 보았다. 마지막으로 제8장에서는 텍스트 데이터의 분석 절차에 따라 실제 데이터를 분석해 보고 유용한 정보를 추출하는 일련의 과정을 정리해 보았다.

제1장 데이터의 개념 및 환경 변화
1. 데이터의 개념
2. 데이터 환경의 변화
3. 데이터 활용을 위한 제도적 장치(데이터 3법)
4. 데이터 활용의 유의점


제2장 비정형 데이터 분석의 도구
1. 비정형 데이터의 분석
2. 분석 도구의 구현
3. 주요 프로그래밍 언어의 이해
4. 프로그래밍 언어의 선택


제3장 텍스트 데이터 불러오기
1. 비정형 데이터의 현황
2. 텍스트 데이터의 이해
3. 텍스트 데이터의 수집 방법
4. 텍스트 데이터 수집 사례
5. 유용한 R 패키지


제4장 텍스트 데이터의 전처리
1. 텍스트 데이터와 수치형 데이터의 표현 방식의 차이
2. 텍스트 데이터의 통계 분석을 위한 기본 가설
3. 토큰화
4. 대소문자 변환과 문장부호 삭제
5. 어간추출과 원형복원
6. 불용어 삭제
7. 실제 텍스트 데이터의 전처리


제5장 텍스트 데이터에 대한 탐색적 자료분석
1. 텍스트 데이터에 대한 탐색적 자료분석의 필요성
2. 텍스트 데이터의 요약
3. 단어의 출현 위치 탐색
4. 두 문서의 단어 출현 빈도 비교
5. 산점도를 이용한 두 문서의 비교


제6장 벡터공간모형을 이용한 텍스트 데이터 표현
1. 벡터공간모형
2. 문서-단어 행렬
3. 단어빈도-역문서빈도
4. 문서-단어 행렬의 특징
5. 단어 의미의 유사성
6. 워드 임베딩


제7장 텍스트 데이터의 통계적 분석
1. 텍스트 마이닝
2. 코사인 유사도를 이용한 문서의 분류
3. 텍스트 데이터에 대한 군집분석
4. 텍스트 데이터에 대한 분류분석


제8장 텍스트 데이터 분석 사례
1. 분석 대상 텍스트 데이터
2. 텍스트 데이터의 전처리
3. 텍스트 데이터의 탐색적 자료분석
4. 문서-단어 행렬과 코사인 유사도
5. 군집분석
6. 분류분석


■ 찾아보기

장영재

서울대학교 자연과학대학 계산통계학과(이학사)
미국 University of Wisconsin-Madison 통계학과(이학석사, 통계학박사)
한국은행 경제통계국 차장
• 현재: 한국방송통신대학교 자연과학대학 정보통계학과 교수

손원

서울대학교 자연과학대학 계산통계학과(이학사)
서울대학교 대학원 통계학과(이학석사, 통계학박사)
한국은행 경제통계국 차장
• 현재: 단국대학교 SW융합대학 정보통계학과 교수

황희진

서울대학교 자연과학대학 계산통계학과(이학사)
서울대학교 대학원 계산통계학과(이학석사)
한국외국어대학교 대학원 통계학과(이학박사)
네이버(주) 데이터정보센터 부장
• 현재: 한국은행 경제통계국 차장

등록된 리뷰가 없습니다.
■ 상품 이용 안내
  • 본 상품은 방송대 학생 및 출판문화원 회원이라면 누구나 이용할 수 있습니다.
  • 본 상품은 홈페이지를 통해 이용하는 eBook 서비스로, 배송이 되지 않습니다.
  • 본 상품은 홈페이지에서 구매 후 모바일 앱(방송대 eBook) 및 홈페이지(PC, 모바일)에서 이용할 수 있습니다.
    (이용 가능 단말기 수: 앱 및 웹 뷰어 총 3대까지 가능)
  • 본 상품은 불법복제방지기술이 적용되어있으므로 저작권 보호를 위해 인쇄/저장 편집이 불가합니다.
  • 본 상품 구매 후 다운로드 받거나 한번이라도 읽었을 경우 주문 취소 및 환불이 불가능합니다.
  • 본 상품 구매 후 미열람 시 구매일로부터 10일 이내인 경우에만 환불 가능하며,
    10일이 지난 경우 이미 콘텐츠를 이용한 것으로 간주하여 주문 취소 및 환불이 불가능합니다.
  • EPUB 포맷: 사용하는 기기에 맞게 글자가 재배열되는 가변형 전자책 포맷이며 쪽수가 표시되지 않음
    PDF 포맷: 어느 기기에서나 종이책과 동일한 형태로 보이는 전자책 포맷이며 쪽수가 표시됨

■ 단말기별 앱 안내
  • PC : 출판문화원 홈페이지에서 웹 뷰어로 이용
  • 모바일 단말기(Android 및 iOS) : 출판문화원 홈페이지에서 제공하는 웹 뷰어 및 앱 이용(방송대 eBook)
    ※ 모바일 웹 뷰어: 출판문화원 모바일 홈페이지에서 설치 없이 이용
    ※ 모바일 앱: 앱스토어에서 “방송대 eBook” 검색, 설치 후 이용

이 저자의 다른책