My blog - Page 29 of 37 - SHA Computing

December 7, 2019December 7, 2019Data Mining, Data Science

Mining – K Nearest Neighbor

K-NN : 새로운 데이터가 주어지면 [기존 데이터 중 가장 가까운 k개의 데이터와 비교해서] 새로운 데이터를 분류(예측)하는 알고리즘이다. 토마토가 새로운 사례로 들어왔을 때 , […]

November 12, 2019November 12, 2019Data Science, R Programming

R – 선형 회귀 스크립트로 알아보기

Script ) 북 참고) R로 배우는 데이터 과학

November 11, 2019August 11, 2021Data Science, Reference

Python – 데이터 사이언스 기초 스크립트

ipynb파일 – Jupyter Notebook 프로그램에서 실행 가능

November 5, 2019November 12, 2019Data Science, R Programming

R – 데이터 시각화 스크립트로 알아보기

Script ) 북 참고) R로 배우는 데이터 과학

October 29, 2019October 29, 2019Data Science, R Programming

R – 데이터 가공 및 CSV파일 활용 스크립트로 알아보기

Script ) 북 참고) R로 배우는 데이터 과학

October 20, 2019October 23, 2019Data Mining, Data Science

Mining – 10대 데이터를 이용한 클러스터링 실습

클러스터링: 비슷한 데이터끼리 클러스터(그룹)를 만드는 것! , 군집화라고도 부름 SNS사이트를 크롤링해서 가져온 데이터 : 10대 시장 데이터 를 가지고 클러스터링을 해보겠습니다. 데이터 활용하게 […]

October 20, 2019October 20, 2019Data Mining, Data Science

Mining – 클러스터링

클러스터링: 비슷한 데이터끼리 클러스터(그룹)를 만드는 것! , 군집화라고도 부름 클러스터링 예시 고객 세분화: 은행에서 일일히 한명한명 맞춤화된 서비스를 제공할 수는 없으므로 (나이or성별 […]

October 19, 2019October 20, 2019Data Mining, Data Science

Mining – 타이타닉 데이터를 이용한 연관분석 실습

연관분석에 관한 포스팅: https://shacoding.com/2019/10/19/mining%ec%97%b0%ea%b4%80%eb%b6%84%ec%84%9d/ 연관분석을 이용해서 타이타닉호 사고 중 사망률이 가장 높았던 사람들은 어떤 사람들인지 알아 보겠습니다. R Script ) 결과) 0) […]

October 19, 2019October 19, 2019Data Mining, Data Science

Mining – 연관분석

연관분석: 데이터 간의 연관성을 파악하는 것,마케팅에서 (고객의 장바구니에 들어있는 품목 간의 관계를 탐구하는) 장바구니 분석에 주로 사용되는 기법 연관성: 사건A가 일어났을 때 […]

October 9, 2019December 5, 2021Data Mining, Data Science

Mining – 지도학습과 혼돈행렬

지도 학습: 기계 학습을 통해 답을 내면 이 답이 맞았는지 틀렸는지를 컴퓨터가 알 수 있는 학습 < 답이 있는 데이터를 가지고 답을 […]