데이터프레임 생성
data.frame(x1, x2, x3, ...)
예: DF_grade = data.frame(x1=c("A", "B", "C"), x2=c(1,2,3))
DF_grade = data.frame(c("A", "B", "C"), c(1,2,3)) 열 이름을 지정하지 않는 방식도 가능하지만, 권장하지 않음.
외부 데이터 읽어오기
read.csv(file = "파일명 또는 파일경로")
데이터프레임 다루기
str(DF_name)
데이터프레임과 관련된 기능
View(DF): Script창에 데이터프레임을 출력
dim(DF): 몇 행 몇 열로 구성되는지 차원을 출력
length(DF): 길이 출력
head(DF): 상위 6개 값 출력
tail(DF): 하위 6개 값 출력
summary(DF): 기본 통계량 요약
데이터프레임의 행과 열 접근
인덱스 지정 방식
DF_name[index]
DF_name[n:n]
DF_name[c(x1,x2,x3, ...)]
DF_name[r,c] r행 c열
DF_name[1, 3]
DF_name[1:2, 3]
DF_name[c(2,3,5), 5]
DF_name["col_name"] 열 이름으로 접근
DF_name["age"]
DF_name[2:5, "age"]
DF_name[c("age", "weight")]
DF_name$col_name
DF_name[조건식]
DF_name[dataframe$age>22, ]
DF_name[dataframe$Gender == "MALE",]
attach(DF_name): 데이터프레임을 검색 목록으로 올림.
데이터프레임을 R의 검색 경로에 저장하는 함수
변수명으로 바로 접근 가능함.
detach(DF_name): 검색 할당 해제
출처: 한혁수. (2020). R로 쉽게 통계 배우기. 생능출판사.
'통계: 이 또한 기본이라' 카테고리의 다른 글
데이터 구조(Data Structure): 벡터(Vector), 리스트(List) (0) | 2024.06.26 |
---|---|
EDA(탐색적 데이터 분석): 측정 지표와 추정값 (0) | 2024.06.18 |
통계학의 기본(표본을 얻는 과정의 추상화 - 확률) (0) | 2023.12.26 |
통계학의 기본(통계학이란, 표본과 모집단) (1) | 2023.12.26 |