일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- R프로그래밍
- stepfilter
- str()
- 한글깨지는문제
- DTO사용이유
- cor()
- queryDSL
- Rstudio
- r
- 이중배열
- core.autocrlf
- 머신러닝프로세스
- 이클립스
- Spring
- 자바
- summary()
- Eclipse
- RProgramming
- JPA
- programmers
- LIKE검색
- java
- Q타입클래스
- querydsl적용하기
- 머신러닝
- git
- 알고리즘
- 프로그래머스
- R명령어
- git오류
- Today
- Total
목록머신러닝 (2)
놀고 싶어요

머신러닝: 의사결정나무 입력데이터에 대해 까다로운 점이 없어 널리 사용되고 있다. 다만, 과적합이 발생하기 쉬워서 보완이 필요할 수도 있는 방법이다. (과적합: 학습정확도는 높은 반면에 예측정확도가 낮아지는 상황을 말한다.) Tree 그리기 예제) 대여 건수가 500건이 넘는지 안넘는지? install.packages("tree") library(tree) set.seed(1234) 데이터를 나누기 전, set.seed()라는 함수를 사용하여 결과가 항상 동일할 수 있도록 출발점을 고정 set.seed()함수는 난수를 사용해서 랜덤하게 만드는 기능을 활용하는 모든 경우에 출발점을 고정함으로써 항상 동일한 결과가 나오도록 하는 기능이다. 1234로 값을 고정한 경우, 1234가 아닌 다른 숫자를 사용한 경..

회귀분석 Regression analysis 세상의 많은 일들이 회귀분석으로 설명될 수 있다. 그러나 대개는 설명력이 부족하고 예측력이 낮아 하나의 독립변수로는 설명할 수 없다. 또한 수치형 데이터가 아닌데 회귀관계가 존재하는 경우가 있다. Yes or no로 대답할 수 있는게(범주형 데이터) 종속변수에는 영향이 지대한 경우가 있을 수 있다. 머신러닝 Machine learning : 기계가 많은 데이터를 사용해서 결과를 설명할 수 있는 특징, 패턴, 수식 등을 찾아내도록 하는 것 다양한 기법이 존재하고 기법마다 다른 접근법을 사용하지만 대개의 경우 그 하부에는 통계적 기법이나 통계적 아이디어가 있고 그것을 구현하는 관점에서 알고리즘, 컴퓨터 수학 그리고 수학이 어우러져 있다. 통계 관점에서 다루던 회귀..