데이터 분석 (Data Analysis)/R
[데이터분석기사 실기] 가변수(Dummy Variable) 처리 후 새 변수 생성하기 문제 - 실기 작업 1유형
apdo
2021. 7. 7. 17:14
스터디하면서 개인 공부했던 자료를 이제 올립니다.
첫 시행 시험이다보니 스스로 문제 만들어서 풀었습니다.
실기 작업형 제 1유형 (3문항, 각 배점 10점 총 30점)
단답형 답을 가진 변수를 print 명령어로 출력하는 코드 제출
# 데이터 전처리 - 작업 데이터 변환하기 - 기존변수 이용하여 새 변수 생성 (데이터자격검정에 목차가 자세히 나와있습니다.)
문제 : MASS 패키지의 Car93 데이터 셋에서 Origin 변수를 가변수(Dummy Variable) 처리하여
새 변수(Origin_dummy)를 생성하시오.
(단, USA를 1로 non-USA 를 0으로 변환할 것) 새 변수의 1 값의 개수를 출력하시오.
library(tidyverse)
library(MASS)
# 데이터 파악
df <- Cars93
glimpse(df) # 데이터 구조 파악, str() 함수
df$Origin %>% head(5) # Cars93 데이터 셋의 Origin 변수에서 상위 5개 값 출력
# 가변수 처리 후 새 변수 생성하기 (mutate 함수 이용)
df <- df %>%
mutate(Origin_dummy = ifelse(Origin=="USA", 1, 0))
# 가변수 처리 잘되었는지 확인 해보기
data.frame(df$Origin, df$Origin_dummy)
# 답안
print(sum(df$Origin_dummy==1))
이번 시험에서 tidyverse 패키지는 제공 되지 않더라고요. 이점 주의하시면 됩니다. ( glimpse( )함수 대신 str( )함수 사용하시면 됩니다.)