\( \def\defeql{\stackrel{\mathrm{def}}{=}} \def\rR{\mathbb R} \newcommand{\nN}{\mathbb N} \def\st{\bigm\vert} \)R로 알아가는 머신러닝과 통계, 수학 (정주희 저, 교우사, 2023년 2월)

머신러닝 작업환경|

구글 코랩

  1. 구글 코랩 사용법 1/3 (2023년3월24일)
  2. 구글 코랩 사용법 2/3 (2023년3월27일)
  3. 구글 코랩 사용법 3/3 (2023년3월27일)

구글 코랩을 사용하는 경우에는 다음의 동영상들을 꼭 볼 필요는 없습니다. 이 웹페이지의 [보충자료]에 있는 모든 ipynb 파일과 [연습문제]에 있는 일부 ipynb 파일에 대한 링크는 이제 코랩 문서로 연결됩니다. (2023.04.18)

주로 윈도즈 PC 사용자를 염두에 두고 만든 동영상입니다. 맥 사용자에게도 도움이 되는 내용이 있을 것입니다.

설치할 때 발생할 수 있는 대표적인 문제들에 대하여 [install_tip.html]에 해결책을 모아 두었습니다.

5개의 동영상들 중에 3, 4, 5를 먼저 만들었었는데, 조금 복잡하게 느껴질 수 있어서 더 간단하게 만든 것이 1, 2입니다. 1만 보아도 설치는 할 수 있습니다. 효율적인 사용을 위하여 꼭 알아 두어야 할 내용을 2에 넣었습니다.

3, 4, 5는 내용이 더 풍부합니다. 설치에 더하여 쥬피터 노트북을 실제로 사용하는 방법에 중점을 두었습니다. 예를 들자면 마크다운 쎌 작성법에 대한 설명이 있습니다.

  1. 미니콘다, R, Python, 쥬피터노트북 설치
  2. 쥬피터 노트북과 PDF, Alias
  3. 머신러닝 공부환경 구축 1/3
  4. 머신러닝 공부환경 구축 2/3
  5. 머신러닝 공부환경 구축 3/3

보충 자료 |

오타 및 업뎃 목록
R 노하우(Tips)
제2장. R 프로그래밍 |
  • Chapter_2(1절-5절).ipynb: R-스크립트 소스코드 2장(1절-5절)
  • Chapter_2(6절-9절).ipynb: R-스크립트 소스코드 2장(6절-9절)
  • Rcolor.pdf : R에서 사용할 수 있는 색깔들
  • 문자열과_데이터.ipynb : 텍스트에서 데이터를 추출하는 방법, 정규표현식
  • 데이터프레임_연습.ipynb : 데이터프레임 만들기, 레코드 추가/삭제, 정렬 등
  • 행렬과어레이.ipynb : 행렬과 어레이에서 사용되는 apply(), sweep()
  • util.R : 유틸리티 함수, 리소스 2022.Nov.22
  • 제3장. 수학 |
  • Chapter_3.ipynb: R-스크립트 소스코드 3장
  • 벡터의사영.pdf : 벡터의 사영에 대한 두 식 (3.21)과 (3.22)의 동등함의 증명
  • 제4장. 통계학의 기본이론 |
  • csv_files.zip : 데이터 파일들
  • Chapter_4(1절).ipynb: R-스크립트 소스코드 4장 1절
  • Chapter_4(2절).ipynb: R-스크립트 소스코드 4장 2절
  • conditional_independence.ipynb: 조건부 독립성
  • dist_tables.pdf : 분포표 모음 (표준정규, $t$, 포아송, 카이제곱, $F$)
  • 제5장. 표본, 통계량, 모수 |
    제6장. 추정의 이론과 엔트로피 |
  • Chapter_6.ipynb: R-스크립트 소스코드 6장
  • 증명.6.24 : 베타함수의 적분
  • 고찰.6.27 : 조건이 $\varphi(\vec x) = u$ 형태일 때의 조건부 확률함수
  • 증명.6.34.a : KL-디버전스의 부등식
  • 증명.6.34.b : 젠센 부등식
  • 증명.6.34.c : 볼록함수와 2계 도함수
  • 제7장. 머신러닝의 기본 |
  • Chapter_7a.ipynb: R-스크립트 소스코드 7장 1.1절 (산점도와 적합선)
  • Chapter_7b.ipynb: R-스크립트 소스코드 7장 1.2절~2.3절
  • Chapter_7c.ipynb: R-스크립트 소스코드 7장 2.4절 (모형의 편향-변동성 균형)
  • 증명.7.5 : [팩트 7.5] 상관계수의 성질
  • 증명.7.6 : [보조정리 7.6] 잔차의 모멘트의 합은 0
  • [정리 7.21] 보충
  • 제8장. 머신러닝의 기법 |
  • Chapter_8a.ipynb: R-스크립트 8장 1절~4절
  • Chapter_8b.ipynb: R-스크립트 8장 5절~6절
  • Chapter_8c.ipynb: R-스크립트 8장 7절
  • Chapter_8_knn.ipynb: KNN 분류
  • 제9장. 신경망과 딥러닝 |

    연습문제 |

    제2장. R 프로그래밍 |
  • Hw1.html : BMI 계산 및 정렬
  • Hw2.html : 함수의 그래프 2개 그리기
  • 과제2_2.ipynb, Exer2.png : 문자열 다루기와 데이터 프레임 연습
  • Hw3.ipynb
  • 제3장. 수학 |
  • 과제3.1 : 방향미분계수의 계산
  • 제4장. 통계학의 기본이론 |
  • 연습문제 4.13 : 사건의 독립성에 관한 여러 문제들
  • 연습문제 4.16 : 조건부 확률 문제. (아들-딸 역설, 상자 속의 금화/은화, 몬티 홀 문제)
  • 과제4.1
  • 연습문제4.42.ipynb: 누적분포함수와 분위함수의 그래프 (정규분포와 2항분포)
  • (풀이) 연습문제4.69.ipynb: 두 확률변수의 독립
  • Hw4.ipynb : 히스토그램, 상자수염 그림, 이상점
  • Hw5.ipynb : 파레토 그림, 조건부 확률, 베이즈 공식
  • Hw6.ipynb : 2항분포
  • 제5장. 표본, 통계량, 모수 |
  • Hw7.ipynb : 분포의 합성, 신뢰구간
  • 문제 5.1 (exer5.1.ipynb)
  • 문제 모음 5.1
  • 문제 모음 5.2
  • 연습문제5.16.ipynb: $t$-분포를 이용한 신뢰구간 계산
  • 동질성검정
  • 제6장. 추정의 이론과 엔트로피 |
  • 연습문제 6.10 : 편향, 변동성, MSE 계산
  • 연습문제 6.17 : 2항분포의 모수 $p$의 MLE 추정
  • 연습문제 6.19 : 지수분포의 모수 $\lambda$의 MLE 추정
  • 연습문제 6.20 : 포아송 분포의 모수 $\lambda$의 MLE 추정
  • 연습문제 6.23 : 동전의 앞면이 나올 확률 $\theta$를 모수로 보고 이를 다양한 방법으로 추정한다.
  • 제7장. 머신러닝의 기본 |
  • 회귀분석 문제 1 : 단순선형회귀 분석 문제
  • Hw8.ipynb : 산점도와 적합선 그리기
  • 제8장. 머신러닝의 기법 |
  • naive_bayes_iris.html : 단순 베이즈 분류 (iris)
  • classification_tree.html : 분류나무와 엔트로피
  • knn_and_logistic.html : KNN과 로지스틱 회귀 (다운로드 할 것: wisc_bc_data.csv)
  • 제9장. 신경망과 딥러닝 |
  • ffnn_train.html : 신경망 학습 (다운로드 할 것: util_ffnn.R)
  • ffnn_train2.html : 신경망 학습 2
  • 연구 발표 과제 |
  • 과제 1 : 조건부 독립에 관하여
  • 과제 2 : 가우스 단순 베이즈
  • 과제 3 : 로지스틱 회귀
  • 과제 4 : 의사결정 나무 (iris)

  • 이 책을 교재로 사용하시는 교수님에게 제공할 해답집 및 강의자료는 준비중입니다. [샘플] 구글 코랩 사용법