본문 바로가기

통계: 이 또한 기본이라

R 데이터프레임: 관련 함수 정리

 

데이터프레임 생성

data.frame(x1, x2, x3, ...)

    예: DF_grade = data.frame(x1=c("A", "B", "C"), x2=c(1,2,3))

         DF_grade = data.frame(c("A", "B", "C"), c(1,2,3)) 열 이름을 지정하지 않는 방식도 가능하지만, 권장하지 않음.

 

외부 데이터 읽어오기

read.csv(file = "파일명 또는 파일경로")

 

데이터프레임 다루기

str(DF_name)

 

데이터프레임과 관련된 기능

View(DF): Script창에 데이터프레임을 출력

dim(DF): 몇 행 몇 열로 구성되는지 차원을 출력

length(DF): 길이 출력

head(DF): 상위 6개 값 출력

tail(DF): 하위 6개 값 출력

summary(DF): 기본 통계량 요약

 

데이터프레임의 행과 열 접근

인덱스 지정 방식

DF_name[index]

DF_name[n:n]

DF_name[c(x1,x2,x3, ...)]

DF_name[r,c] r행 c열

      DF_name[1, 3]

      DF_name[1:2, 3]

      DF_name[c(2,3,5), 5]

DF_name["col_name"] 열 이름으로 접근

      DF_name["age"]

      DF_name[2:5, "age"]

      DF_name[c("age", "weight")]

      DF_name$col_name

      DF_name[조건식]

          DF_name[dataframe$age>22, ]

          DF_name[dataframe$Gender == "MALE",]

 

attach(DF_name): 데이터프레임을 검색 목록으로 올림.

                                데이터프레임을 R의 검색 경로에 저장하는 함수

                                변수명으로 바로 접근 가능함.

detach(DF_name): 검색 할당 해제

 

 

출처: 한혁수. (2020). R로 쉽게 통계 배우기. 생능출판사.