놀고 싶어요

[R Programming]data.table 본문

R

[R Programming]data.table

챌린지 2021. 5. 7. 13:08

 

encoding은 세상 다양한 언어를 컴퓨터가 처리할 수 있도록 코드화하는 방법으로 읽으려고 하는 파일이 R의 기본 인코딩방법과 달라 발생한다.

 

bike_data <- read.csv("data/bike_usage_0.csv")

 

R 파일을 읽는 함수를 다른 함수로 변경이 가능하다. (data.table 패키지)

 

data.table 패키지는 기본 R, RStudio에는 없는 패키지이므로 다운로드하여 사용해야 한다.

-> RStudio에서 바로 수행할 수 있다.

 

패키지 설치 및 사용

install.packages()

:함수로 패키지 설치, 패키지 이름에 따옴표(") 사용, 처음 한 번 만 설치

 

libarary()

해당 패키지 설치 후, libarary()를 사용하여 해당 패키지를 사용 공간으로 가져와야 한다. 이 때는 따옴표는 필요 없다.

R프로그램의 기본 패키지가 아니기 때문에 다시 시작할 때마다 다시 읽어들여와서 설정해야 한다.

 

fread()로 읽을 경우, encoding='UTF-8' 필수로 사용

 

 

 

설치

install.packages("data.table")

install.packages("data.table", type = "source",

                 repos = "https://Rdatatable.gitlab.io/data.table")

 

설치 후 사용할 때 반드시 해당 함수로 설치한 패키지를 불러와야 함

library(data.table)

 

설치 후 데이터 읽어오기

population <- fread("data/population_by_Gu.txt", encoding='UTF-8')

population

 

fread()함수

: 파일을 읽어서 메모리에 data.table 클래스로 저장

data.frame의 속성을 그대로 상속+data.table 특유의 기능과 성격을 추가한 형태

> 객체지향 프로그래밍의 특징

 

클래스에 따라 사용 가능한 함수가 다르고, 결과값을 보여주는 형식이 다를 수 있다.

 

fread()함수로 읽어온 데이터 클래스값을 조회해보면 "data.frame" "data.table" 두 개가 조회된다. 

(read.csv() 함수로 읽어온 경우 "data.frame"만 존재)