일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- git
- summary()
- core.autocrlf
- java
- JPA
- git오류
- Q타입클래스
- stepfilter
- LIKE검색
- programmers
- cor()
- R명령어
- DTO사용이유
- 자바
- str()
- R프로그래밍
- Spring
- queryDSL
- 머신러닝
- 프로그래머스
- querydsl적용하기
- 이중배열
- 알고리즘
- r
- 머신러닝프로세스
- 한글깨지는문제
- RProgramming
- Eclipse
- Rstudio
- 이클립스
- Today
- Total
목록summary() (2)
놀고 싶어요
tidyverse 사용 장점 1. data.frame의 특성을 그대로 사용할 수 있다. 2. 쉬워진 데이터 정비 및 재구조화 3. 결과창에 표시되는 깔끔한 내용 -> 사용자의 편리성 대폭 개선 함수 1. problems(): 잘못된 데이터 정보를 파악할 수 있다. 2. str(): 데이터 전반에 대한 정보를 알려준다. 3. summary(): 기본적인 기술통계값을 알 수 있다. 최소값, 최대값, 사분위수 등의 요약 정보를 알려주는 함수 install.packages("tidyverse") 하위 패키지가 80개가 넘는 패키지로 설치하는데 오래 걸린다. library(tidyverse) tidyverse를 attach한다. bike_data_tb 데이터 타입만 가져가게 됨 na.rm NA remove를 의미..
summary() summary(): 모든 컬럼에 대한 요약 정보를 보여준다. 문자열 데이터일 경우, Length(길이), Class, Mode(타입)을 보여주고 수치형 데이터인 경우, 최소값(Min.), 1사분위수(1st Qu.), 중앙값(Median), 평균(Mean), 3사분위수(3rd Qu.), 최대값(Max.) 을 보여준다. 왜 다양한 값을 계산해볼 수 있어야 할까? 최대값, 최소값, 범위 등 데이터 값이 어떤 범위에 해당하느냐에 따라 데이터가 적정한지 알 수 있다. ex) 서울의 온도 최대 50도 일 때, 섭씨인지 화씨인지? 섭씨 50도일 경우 일반적, 정상적 범위가 아니라는 걸 알 수 있다. 최대값~최소값 사이를 4개로 나누어 데이터 전체를 분포로 개략적으로 빠르게 이해할 수 있도록 도와줌 ..