본문 바로가기

카테고리 없음

만들면서 배우는 기계 학습

일본책들의 장점은 깔끔한 정리, 구성이고 단점은 너무 깔끔하다보니 가끔 알맹이가 너무 부실하다는 것이다. 내가 생각하기에 이 책은 이러한 일본책의 장/단점을 모두 가지고 있다.일단 깔끔하게 머신러닝의 역사나 주요 알고리즘에 대해서 정리해주고 있다. 처음 머신러닝을 접할 때 스윽 읽어보기 좋은 정도다. 다만.... 너무 지식이 얕다. 이런게 있고 이런식으로 적용하는구나 감만 느낄 수 있는 정도의 책이다.굳이 사볼 필요는 없는거 같다. 솔직히 2만원 조금 아까운 책이다.

C 언어 예제로 직접 실험하며 대용량 데이터를 처리하는 기계 학습 원리를 이해한다사람의 말을 이해하는 아이폰의 시리, 사람의 말을 이해하고 퀴즈쇼 우승을 차지한 IBM의 왓슨, 구글의 자동 번역 시스템에는 모두 인공 지능 기술이 숨어 있다. 대용량 데이터 처리 기술이 발전하면서 과거에는 불가능하거나 어렵다고 여겨졌던 일이 가능해지기 시작했다. 체스 같은 제한된 규칙에서 인간과 경쟁하던 인공 지능 기술이 빅데이터를 통해 사람의 말을 이해하는 수준까지 발전했다. 왓슨은 470만 개의 특허와 1,100만 개의 저널을 분석해 250만 개의 화학혼합물을 분석했고, IBM은 이를 미 국립의료연구원에 기증하기도 했다.빅데이터 기술은 기계 학습, 자연어 처리, 통계학, 분산 병렬 컴퓨팅 등의 기술이 결합된 시스템을 말한다. 이 책에서는 C 언어 예제를 통해 직접 실험하면서 데이터를 처리하는 기계 학습 원리를 학습할 수 있게 되어 있다. 기계 학습은 이론에 치우쳐 이해하기 어렵다는 단점이 있는데 간단한 코드와 실습을 통해 기초 원리를 쉽게 학습하게 구성되어 있다.

1장 기계 학습이란
__1.1 기계 학습의 역사
____기계 학습
____기계 학습 시스템의 역사
__1.2 기계 학습 종류
____이 책에서 다루는 기계 학습 종류
____기계 학습 프로그램 구현 방법

2장 파라미터 조정에 의한 학습
__2.1 파라미터 조정과 학습
____학습 데이터 세트의 기계 학습과 파라미터 조정
____파라미터 조정 실행 예
__2.2 파라미터 조정에 의한 시계열 데이터 학습
____학습 데이터 세트 작성
____시계열 데이터의 변동 경향 학습

3장 귀납 학습
__3.1 암기 학습
____텍스트 마이닝과 기계 학습
____n-gram 출현빈도에 기초한 텍스트 데이터 학습
____일본어 텍스트 데이터 학습
__3.2 일반화 도입
____문서의 일반적인 특징 추출
____특징 추출에 응용

4장 감독 학습
__4.1 감독 학습이란
____감독에 의한 학습
____감독 학습 예
__4.2 감독 학습에 기초한 데이터 분류 시스템 구성
____의사결정 트리 구성 지원 프로그램
____분류 지식의 기계 학습 프로그램

5장 진화적 방법에 의한 규칙 학습
__5.1 진화적 방법에 의한 기계 학습
____랜덤 탐색과 계통적 탐색
____진화 연산
__5.2 유전자 알고리즘에 따른 지식 획득
____유전자 알고리즘 실제__
____유전자 알고리즘에 의한 지식 획득 프로그램

6장 신경망
__6.1 퍼셉트론형 신경망
____신경망
____퍼셉트론__
____퍼셉트론 학습
__6.2 역전파에 의한 학습__
____역전파에 의한 학습 과정
____역전파 프로그램
__6.3 신경망에 의한 실제 데이터 학습
____학습 준비
____bp.c 프로그램에 의한 학습과 미지의 데이터 예측

__부록
__A. Cygwin 내려받기와 인스톨
__B. testprogram.c 프로그램 소스 리스트
__C. 문자 코드 변환 프로그램 iconv 사용 방법
__D. 논리식과 논리연산
__E. 전수검사에 의한 퍼즐 풀이 프로그램