일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- stepfilter
- queryDSL
- R명령어
- 이중배열
- 이클립스
- Spring
- 자바
- RProgramming
- programmers
- 머신러닝프로세스
- core.autocrlf
- 알고리즘
- 한글깨지는문제
- summary()
- DTO사용이유
- r
- cor()
- Eclipse
- str()
- 프로그래머스
- git오류
- R프로그래밍
- LIKE검색
- JPA
- java
- querydsl적용하기
- Rstudio
- Q타입클래스
- git
- 머신러닝
- Today
- Total
목록R (25)
놀고 싶어요

summary() summary(): 모든 컬럼에 대한 요약 정보를 보여준다. 문자열 데이터일 경우, Length(길이), Class, Mode(타입)을 보여주고 수치형 데이터인 경우, 최소값(Min.), 1사분위수(1st Qu.), 중앙값(Median), 평균(Mean), 3사분위수(3rd Qu.), 최대값(Max.) 을 보여준다. 왜 다양한 값을 계산해볼 수 있어야 할까? 최대값, 최소값, 범위 등 데이터 값이 어떤 범위에 해당하느냐에 따라 데이터가 적정한지 알 수 있다. ex) 서울의 온도 최대 50도 일 때, 섭씨인지 화씨인지? 섭씨 50도일 경우 일반적, 정상적 범위가 아니라는 걸 알 수 있다. 최대값~최소값 사이를 4개로 나누어 데이터 전체를 분포로 개략적으로 빠르게 이해할 수 있도록 도와줌 ..
encoding은 세상 다양한 언어를 컴퓨터가 처리할 수 있도록 코드화하는 방법으로 읽으려고 하는 파일이 R의 기본 인코딩방법과 달라 발생한다. bike_data RStudio에서 바로 수행할 수 있다. 패키지 설치 및 사용 install.packages() :함수로 패키지 설치, 패키지 이름에 따옴표(") 사용, 처음 한 번 만 설치 libarary() 해당 패키지 설치 후, libarary()를 사용하여 해당 패키지를 사용 공간으로 가져와야 한다. 이 때는 따옴표는 필요 없다. R프로그램의 기본 패키지가 아니기 때문에 다시 시작할 때마다 다시 읽어들여와서 설정해야 한다. fread()로 읽을 경우, encoding='UTF-8' 필수로 사용 설치 install.packages("data.table")..

읽어올 파일을 R 파일에 data 폴더를 만들어서 파일을 넣어둔다. 1. File > New File > R Script 로 새로운 파일을 생성한다. 2. getwd()를 이용하여 working directory 확인을 하고, 세팅되어 있지 않는 경우 setwd() 를 이용하여 디렉토리 이동을 해준다. ex) setwd("~/R") or setwd("C:Users/사용자명/Documents/R") 3. read.csv()를 이용하여 파일을 읽어온다. ex) bike_data bike_data 전체를 볼 수 없기 때문에 다른 방법을 이용하는 걸 권장한다. ex) sum함수 사용: R에서는 TRUE=1, FALSE=0으로 취급하기 때문에 진리값도 합계가 가능 => 0이 나오면 NA가 없는 것, 1 이상의 값..

R에서 변수 선언 시 내용에 따라 데이터 타입이 정해진다. 변수 네이밍 규칙 1. 문자 또는 점으로 시작되어야 함 2. 언더스코어(_) 포함 특수문자 사용 불가능 3. 예약어 사용 불가능 (ex. if, for.. 문법적 용도 있으므로) 4. 대소문자 구분함 정의하는 방법 변수명 =,

R은 통계적 분석 목적의 프로그래밍 언어이다. 발표된지는 약 30년정도 된 언어로 비영리 조직인 R 파운데이션에서 유지, 관리 하고 있으며 free software foundation 산하의 프로젝트이기도 하다. 모든 os에서 실행이 가능하다. 오픈소스로 유지되고 있어 모두 무료로 사용 가능하다. - 꾸준하게 기능 업데이트가 아직도 진행되고 있으며 패키지라는 방식으로 모든 사용자가 참여해서 기능을 개발, 패키지로 등록하고 누구나 패키지를 설치하여 고급 기능을 사용할 수 있다. 인터프리터 방식의 언어로 대화형 프로그래밍 언어이다. (한 줄씩 실행됨) ( 컴파일러: 컴퓨터가 이해할 수 있는 기계어 수준으로 한 번에 번역해서 실행) 통계적 분석과 데이터 과학 을 주 대상 업무로 사용하는 경우 인터프리터 방식이..