Category: Data Science
Mining – 은행 데이터를 이용한 의사결정나무 실습
의사결정나무는 한 단계 거쳤을 때마다 좀 더 정리되게 집합을 나눈 나무입니다. 이러한 나무는 ‘cart’라는 알고리즘을 통해 구현이 가능합니다. cart알고리즘은 집합을 분리해가며 지니지수(집합 […]
Mining – 의사결정나무 中 지니지수
‘의사결정나무’를 모르시겠다면 이전 포스팅 글을 참고하세요!!-> https://shacoding.com/2019/09/20/mining-%ec%97%94%ed%8a%b8%eb%a1%9c%ed%94%bc%ec%99%80-%ec%a7%80%eb%8b%88%ec%a7%80%ec%88%98/ 지니지수 무질서도를 나타내는 척도입니다.엔트로피와 마찬가지로, 두 비율이 0.5로 가까워질 때 값이 제일 커집니다. 공식은 아래와 […]
R – Titanic 데이터로 R분석 해보기!!
R에서 기본으로 제공하는 Titanic데이터를 가지고 R분석을 해보겠습니다. Titanic: 타이타닉 호와 관련해서 (그룹, 성별, 나이, 생존 여부)속성을 가지고 있는 데이터 모음 아래 스크립트에는 […]
Mining – 의사결정나무 中 엔트로피
여러 모양이 섞여 있는 집합에서 특징 별로 구분해서 같은 종류의 도형만 남게 해봅시다. 우리는 아래와 같은 ‘의사결정나무’를 이용합니다. ‘의사결정나무’의 규칙은 한 단계 […]

