R – 분석 함수 스크립트로 알아보기 (str,view,plot 등)

Script1 )

# 워킹 디렉토리를 불러온다.
# <워킹 디렉토리>는 앞으로 코딩할 R소스가 담긴 폴더이다.
getwd()

# 워킹 디렉토리를 설정한다.
#setwd('C:/Sources')

# 패키지 형태인 데이터를 가져온다. 
install.packages("dplyr")
install.packages("ggplot2")

# 패키지를 사용하기 위해 라이브러리에 추가한다. 
library(dplyr)
library(ggplot2)

# 데이터의 구조를 나타낸다.
str(iris)
# 데이터를 별도의 창에 나타낸다.
View(iris)
# iris데이터 위에 10개값을 보겠다. <반대는 tail>
head(iris, 10)
# 데이터를 시각화해서 나타낸다.
plot(iris)

plot(iris$Petal.Width, iris$Petal.Length, col = iris$Species)

# 외부에 있는 데이터를 가져온다. 
tips = read.csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv')
str(tips)
head(tips, 10)

# 요약 통계를 보여줌
summary(tips)                

# 그림 2-19(a)~(d)

# %>%은 dplyr패키지가 제공하는 명령어로, 패키지 함수에 연결하는 연산자이다. <즉 tips에서 ggplot2패키지의 함수(명령어)를 사용>
# size변수의 히스토그램을 보여준다.
# aes변수로 나타낼 변수를 지정할 수 있고 옵션(색,기호 등)도 지정할 수 있다. 
tips%>%ggplot(aes(size)) + geom_histogram()                                           # 그림 2-19(a)
# total_bill변수와 tip변수의 산점도(두 변수 사이의 관계도)를 보여준다. 
tips%>%ggplot(aes(total_bill, tip)) + geom_point()                                    # 그림 2-19(b)
# 마찬가지로 산점도를 보여주데 요일은 색으로 나타낸다. 
tips%>%ggplot(aes(total_bill, tip)) + geom_point(aes(col = day))                      # 그림 2-19(c)
# 마찬가지로 산점도를 보여주는데 성별은 다른 모양으로 나타낸다. 그리고 size옵션으로 기호의 크기를 키운다. 
tips%>%ggplot(aes(total_bill, tip)) + geom_point(aes(col = day, pch = sex), size = 3) # 그림 2-19(d)

Script2)

# 이 데이터가 무슨 데이터인지 알아본다. 
?cars
View(cars)
summary(cars)
plot(cars)
# box형태로 데이터를 시각화한다. 
boxplot(cars)

북 참고) R로 배우는 데이터 과학

Leave a Reply

Your email address will not be published. Required fields are marked *