과제 11

이 과제는 Wisconsin Breast Cancer Diagnostic 데이터 집합을 가지고 유방암 진단을 하는 것이다.
KNN과 로지스틱 회귀의 2 방법을 사용하여 결과를 비교해 본다.

첫 번째 변수는 ID이므로 분석에 사용되지 않는다.
두 번째 변수인 diagnosis가 반응변수이다. "M"은 Malignant(악성), "B"는 Benign(양성)을 의미한다.
나머지 30개의 변수들은 모두 연속형 예측변수이다.

  1. KNN (k=2 사용)
  1. Logistic Regression