Master, Author at SHA Computing

December 20, 2019May 15, 2022My Project

한국 복지 패널 데이터 분석 (R 프로젝트)

주제: 저소득 가구와 지역간의 관계 조사 데이터: Koweps_hpc10_2015_beta1.sav 한국보건사회연구원에서 가구의 경제 활동 및 상태를 연구하여 정책지원에 반영할 목적으로 조사한 자료이다. 2006~2015년까지 전국 […]

December 20, 2019June 14, 2022My Project

Brick Ball (WEB 프로젝트)

Game: https://shacoding.com/game/load.html BGM: Sereno – 흘러내린 눈물은 꽃이 되어 (Flower of Tears) Reference: MDN 사용 언어: HTML / JavaScript / CSS (내부 […]

December 11, 2019June 11, 2021Data Mining, Data Science

Mining – 모델 성능 향상

앙상블 기법은 동일하거나 서로 다른 학습 알고리즘을 사용해서 여러 모델을 생성하는 개념 입니다. 여러 모델을 이용하면, 한 가지 모델을 이용하는 것보다 성능이 […]

December 11, 2019November 4, 2022Data Mining, Data Science

Mining – 모델 성능 평가

이번 포스트는 모델의 성능을 평가하는 여러 가지 방법을 소개합니다. 1) 혼돈행렬: 알고리즘이 얼마나 맞았나 틀렸는지를 평가하는 행렬(머신러닝 관점)알고리즘대로 학습된 모델에 데이터를 넣었을 […]

December 11, 2019December 11, 2019Data Mining, Data Science

Mining – 부모 키와 자식 키를 이용한 회귀 분석 실습

회귀 분석에 관한 포스팅: https://shacoding.com/2019/12/08/mining-%ed%9a%8c%ea%b7%80-%eb%b6%84%ec%84%9d/ 회귀 분석을 이용해서부모 키에 대한 자식 키의 회귀를 구해 보겠습니다. 결과) 0) galton 확인 내장 데이터 galton은 (자식의 […]

December 8, 2019August 19, 2021Data Mining, Data Science

Mining – 회귀 분석

회귀 분석 : 변수와 변수 사이의 관계를 알아보기 위한 통계적 분석 방법 ‘종속 변수와 독립 변수 사이의 관계를 알아보기 위한 분석‘ 이라고도 말합니다. […]

December 8, 2019December 11, 2019Data Mining, Data Science

Mining – SMS 스팸 분류를 이용한 나이브 베이즈 실습

나이브 베이즈에 관한 포스팅: https://shacoding.com/2019/12/07/mining-%eb%82%98%ec%9d%b4%eb%b8%8c-%eb%b2%a0%ec%9d%b4%ec%a6%88/ 나이브 베이즈를 이용해서SMS 스팸 분류를 해보겠습니다. 결과) 0) sms_raw 확인 sms_raw$type에는 문자가 햄인지 스팸인지가 기재돼있습니다.sms_raw$text에는 문자 내용이 기록돼있습니다. […]

December 7, 2019February 17, 2022Data Mining, Data Science

Mining – 나이브 베이즈

나이브 베이즈는 스팸 메시지 필터를 만들 때 사용됩니다. 스팸의 유래를 소개하며 포스팅을 시작하겠습니다. 스팸의 유래)스팸이라는 회사에서 자기네 햄을 알리려고 쓸데없는 메일을 많이 […]

December 7, 2019January 13, 2023Data Mining, Data Science

Mining – 유방암 진단 데이터를 이용한 KNN 실습

KNN에 관한 포스팅: https://shacoding.com/2019/12/07/mining-k-nearest-neighbor/ KNN을 이용해서의료 데이터로 유방암 환자를 분류해보겠습니다. 결과) 0) 의료 데이터 보기 id는 환자의 id입니다. diagnosis는 양성인지,음성인지를 나타내는 변수로 양성은 […]

December 7, 2019December 7, 2019Data Mining, Data Science

Mining – K Nearest Neighbor

K-NN : 새로운 데이터가 주어지면 [기존 데이터 중 가장 가까운 k개의 데이터와 비교해서] 새로운 데이터를 분류(예측)하는 알고리즘이다. 토마토가 새로운 사례로 들어왔을 때 , […]

SHA Computing

How Sunghyun handles computer

Author: Master