Month: October 2019
Mining – 10대 데이터를 이용한 클러스터링 실습
클러스터링: 비슷한 데이터끼리 클러스터(그룹)를 만드는 것! , 군집화라고도 부름 SNS사이트를 크롤링해서 가져온 데이터 : 10대 시장 데이터 를 가지고 클러스터링을 해보겠습니다. 데이터 활용하게 […]
Mining – 클러스터링
클러스터링: 비슷한 데이터끼리 클러스터(그룹)를 만드는 것! , 군집화라고도 부름 클러스터링 예시 고객 세분화: 은행에서 일일히 한명한명 맞춤화된 서비스를 제공할 수는 없으므로 (나이or성별 […]
Mining – 타이타닉 데이터를 이용한 연관분석 실습
연관분석에 관한 포스팅: https://shacoding.com/2019/10/19/mining%ec%97%b0%ea%b4%80%eb%b6%84%ec%84%9d/ 연관분석을 이용해서 타이타닉호 사고 중 사망률이 가장 높았던 사람들은 어떤 사람들인지 알아 보겠습니다. R Script ) 결과) 0) […]
Mining – 연관분석
연관분석: 데이터 간의 연관성을 파악하는 것,마케팅에서 (고객의 장바구니에 들어있는 품목 간의 관계를 탐구하는) 장바구니 분석에 주로 사용되는 기법 연관성: 사건A가 일어났을 때 […]
Mining – 은행 데이터를 이용한 의사결정나무 실습
의사결정나무는 한 단계 거쳤을 때마다 좀 더 정리되게 집합을 나눈 나무입니다. 이러한 나무는 ‘cart’라는 알고리즘을 통해 구현이 가능합니다. cart알고리즘은 집합을 분리해가며 지니지수(집합 […]
Mining – 의사결정나무 中 지니지수
‘의사결정나무’를 모르시겠다면 이전 포스팅 글을 참고하세요!!-> https://shacoding.com/2019/09/20/mining-%ec%97%94%ed%8a%b8%eb%a1%9c%ed%94%bc%ec%99%80-%ec%a7%80%eb%8b%88%ec%a7%80%ec%88%98/ 지니지수 무질서도를 나타내는 척도입니다.엔트로피와 마찬가지로, 두 비율이 0.5로 가까워질 때 값이 제일 커집니다. 공식은 아래와 […]