과제 10

  1. 분할하기 전의 초기 엔트로피 ent_init를 구하여라.
  2. 첫 분할에서 4가지 경우 각각에 대하여 엔트로피가 얼마나 감소했는지 계산하고 최적의 분할을 선택하여라.
  3. 첫 분할에서 얻은 두 개의 영역 각각에 대하여 가능한 모든 분할과 그때의 엔트로피의 감소를 계산하고 최적의 분할을 선택하여라.
  4. 최종적으로 얻은 분류나무의 엔트로피 ent_final를 구하여라.
  5. ent_init - ent_final = entropy_decrement_1st + entropy decrement_2nd 임을 확인하여라.
  1. 이상 4개의 분할 중에 가장 좋은 것 하나를 택한다.
  2. 2개의 영역에 대해서 가능한 모든 분할을 시도하여 엔트로피가 가장 크게 감소하는 것을 선택한다.
  3. 예를 들어 X1=1이 가장 좋게 나타났다면 다음과 같은 5개의 분할들이 가능하다.
    • Split R111 by X2 = 1, obtain R111_211 and R111_212
    • Split R111 by X2 = 2, obtain R111_221 and R111_222
    • Split R112 by X1 = 2, obtain R112_121 and R112_122
    • Split R112 by X2 = 1, obtain R112_211 and R112_212
    • Split R112 by X2 = 2, obtain R112_221 and R112_222