왜 ? R 인가
- 데이터 분석을 위한 도구로 많이 쓰이고 있다.
- R은 통계, 머신러닝, 금융, 바이오인포머틱스, 그래픽스에 이르는 다양한 통계 패키지를 갖고 있다.
- RHive를 사용하면 Hive 환경에서 R을 사용할 수 있다.
- Python에도 pydata라 불리는 numpy, scipy, pandas, matplotlib, sciki-learn의 라이브러리 등이 있지만 pydata에는 R의 다양한 통계 기능에 대응되는 기능은 없다.
공부의 목적
- R의 함수나 패키지에 대해서 다루고 짧은 시간 내에 살펴 볼 수 있도록 정리한다.
정리 방법
- RStudio의 R Markdown을 통해서 코드의 결과 값을 같이 출력 하여 HTML형태로 변환, Github에 기록한다.
추론 통계 분석
예측 분석 - 로지스틱 회귀분석
분류 분석