Mining – 은행 데이터를 이용한 의사결정나무 실습
의사결정나무는 한 단계 거쳤을 때마다 좀 더 정리되게 집합을 나눈 나무입니다. 이러한 나무는 ‘cart’라는 알고리즘을 통해 구현이 가능합니다. cart알고리즘은 집합을 분리해가며 지니지수(집합 […]
의사결정나무는 한 단계 거쳤을 때마다 좀 더 정리되게 집합을 나눈 나무입니다. 이러한 나무는 ‘cart’라는 알고리즘을 통해 구현이 가능합니다. cart알고리즘은 집합을 분리해가며 지니지수(집합 […]
‘의사결정나무’를 모르시겠다면 이전 포스팅 글을 참고하세요!!-> https://shacoding.com/2019/09/20/mining-%ec%97%94%ed%8a%b8%eb%a1%9c%ed%94%bc%ec%99%80-%ec%a7%80%eb%8b%88%ec%a7%80%ec%88%98/ 지니지수 무질서도를 나타내는 척도입니다.엔트로피와 마찬가지로, 두 비율이 0.5로 가까워질 때 값이 제일 커집니다. 공식은 아래와 […]
Script ) 데이터 가공: 조건에 맞춰 일부 데이터만 저장하는 기술 등을 의미 북 참고) R로 배우는 데이터 과학
Script ) 데이터 정제: 이상한 데이터를 처리하거나 삭제하는 등의 기술 북 참고) R로 배우는 데이터 과학
Script ) P. s. 디렉토리는 알아서 변경해서 사용 북 참고) R로 배우는 데이터 과학
R에서 기본으로 제공하는 Titanic데이터를 가지고 R분석을 해보겠습니다. Titanic: 타이타닉 호와 관련해서 (그룹, 성별, 나이, 생존 여부)속성을 가지고 있는 데이터 모음 아래 스크립트에는 […]
여러 모양이 섞여 있는 집합에서 특징 별로 구분해서 같은 종류의 도형만 남게 해봅시다. 우리는 아래와 같은 ‘의사결정나무’를 이용합니다. ‘의사결정나무’의 규칙은 한 단계 […]
Script1 ) Script2) 북 참고) R로 배우는 데이터 과학