Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- core.autocrlf
- 한글깨지는문제
- summary()
- Rstudio
- R명령어
- DTO사용이유
- git오류
- cor()
- queryDSL
- 알고리즘
- 머신러닝
- 자바
- LIKE검색
- git
- R프로그래밍
- java
- 이클립스
- 이중배열
- Q타입클래스
- programmers
- 머신러닝프로세스
- 프로그래머스
- Spring
- JPA
- RProgramming
- querydsl적용하기
- r
- Eclipse
- str()
- stepfilter
Archives
- Today
- Total
놀고 싶어요
[R Programming] R 기본 명령어 정리 본문
unique(dataframe변수): 수치형 데이터가 아닌 컬럼의 값을 확인한다.
unique(dataframe변수$컬럼): 유니크한 값들을 추려서 보여줌
na.rm
R은 결측값이 있는 경우 계산을 수행하지 못한다. -> NA를 반환한다. -> NA를 제외하고 계산을 수행해야 한다.
na.rm NA remove
Ex) sum(dataframe변수$Carbon_amount, na.rm = TRUE)
table
전체 데이터에서 타입별 수를 확인한다.
head(dataframe변수): 최초 여섯 줄을 읽어옴
tail(dataframe변수): 마지막 줄부터 6개의 행 데이터를 가져온다.
dim(dataframe변수): dim은 dimension을 의미. 행과 열의 크기를 가져온다. 행 열 순서로 나타난다.
str(dataframe변수): str은 structure를 의미. 데이터의 전반에 대한 정보를 알려준다.
-> NA 인 데이터가 있는 열에 대해서 결측값 처리시 확인이 필요하다.
problems(dataframe변수): 잘못된 데이터에 대한 정보를 파악할 수 있다.
summary(dataframe변수): 기본적인 기술통계값을 알 수 있다. 최소값, 최대값, 사분위수 등의 요약 정보를 알려주는 함수
names(dataframe변수): 해당 dataframe이 갖고 있는 컬럼 이름들을 나열한다.
names(dataframe변수)[3] <- 'Tistory': 3번째 컬럼 이름을 'Tistory'로 바꾼다.
추가 중..
'R' 카테고리의 다른 글
[R Programming] 다중회귀분석: 독립변수가 범주형 데이터 (0) | 2021.05.20 |
---|---|
[R Programming] 회귀분석 - 독립변수가 1개인 회귀분석 (0) | 2021.05.19 |
[R Programming] 상관분석 (Correlation Analysis) (1) | 2021.05.18 |
[R Programming] 카이제곱분포 Chi-square Distribution, 카이제곱 독립성 검정 (0) | 2021.05.18 |
[R Programming] 분산분석 (0) | 2021.05.17 |