Mining – 나이브 베이즈
나이브 베이즈는 스팸 메시지 필터를 만들 때 사용됩니다. 스팸의 유래를 소개하며 포스팅을 시작하겠습니다. 스팸의 유래)스팸이라는 회사에서 자기네 햄을 알리려고 쓸데없는 메일을 많이 […]
나이브 베이즈는 스팸 메시지 필터를 만들 때 사용됩니다. 스팸의 유래를 소개하며 포스팅을 시작하겠습니다. 스팸의 유래)스팸이라는 회사에서 자기네 햄을 알리려고 쓸데없는 메일을 많이 […]
KNN에 관한 포스팅: https://shacoding.com/2019/12/07/mining-k-nearest-neighbor/ KNN을 이용해서의료 데이터로 유방암 환자를 분류해보겠습니다. 결과) 0) 의료 데이터 보기 id는 환자의 id입니다. diagnosis는 양성인지,음성인지를 나타내는 변수로 양성은 […]
K-NN : 새로운 데이터가 주어지면 [기존 데이터 중 가장 가까운 k개의 데이터와 비교해서] 새로운 데이터를 분류(예측)하는 알고리즘이다. 토마토가 새로운 사례로 들어왔을 때 , […]
클러스터링: 비슷한 데이터끼리 클러스터(그룹)를 만드는 것! , 군집화라고도 부름 SNS사이트를 크롤링해서 가져온 데이터 : 10대 시장 데이터 를 가지고 클러스터링을 해보겠습니다. 데이터 활용하게 […]
클러스터링: 비슷한 데이터끼리 클러스터(그룹)를 만드는 것! , 군집화라고도 부름 클러스터링 예시 고객 세분화: 은행에서 일일히 한명한명 맞춤화된 서비스를 제공할 수는 없으므로 (나이or성별 […]
연관분석에 관한 포스팅: https://shacoding.com/2019/10/19/mining%ec%97%b0%ea%b4%80%eb%b6%84%ec%84%9d/ 연관분석을 이용해서 타이타닉호 사고 중 사망률이 가장 높았던 사람들은 어떤 사람들인지 알아 보겠습니다. R Script ) 결과) 0) […]