목차
시작
모든 개발의 시작은 데이터를 필요에 따라 커스터마이징 하는 것이라고 생각한다. 데이터 분석을 검색하면 늘 상위에 뜨는 언어 R과 python이 있다. 공부하고자 하는 R 언어는 통계학자가 통계 분석을 목적으로 만든 프로그래밍 언어이다. 엑셀로 하기 힘든 대용량 데이터 핸들링, 고급 통계 분석, 머신러닝, 딥러닝, 텍스트 마이닝 등을 수행할 수 있다.
실습 환경 구축 for windows
윈도우 10 환경에서 개발을 진행한다.
R 설치 파일과 패키지는 CRAN(The Comprehensive R Archive Network)라는 R 및 R 패키지 저장소에서 설치할 수 있다.
R 설치하기
- 시작버튼 - 설정 - 사용자 정보에서 계정이 영문 명으로 작성되어 있는지 확인(한글일 경우 변경 필요)
- https://cran.r-project.org/ 접속하여 Downloa R for Windows 클릭
- base - Download R 4.1.1 for Windows 클릭
- 다운로드 진행되는 .exe 파일을 설치한다.
R 스튜디오
R 을 위한 통합 개발환경(IDE) 이다.
R 스튜디오는 오픈 소스이다.
- https://www.rstudio.com/products/rstudio/download/
- RStudio Desktop (open source license) 다운로드
프로젝트 생성하기
- File - New Project - New Directory
- .Rproj 파일 생성 ( 프로젝트 생성 완료 )
- 예제와 같이 code, data 로 디렉토리를 나눈다.
한글 인코딩
- Tools - Global Options...
- Code - Saving - default text encodding 항목에서 change 클릭
- UTF-8 선택
혹은 File - Reopen with Encoding... 에서 UTF-8 선택하여 프로젝트를 다시 오픈한다.
패키지
R 에서 데이터 분석을 손쉽게 하기 위해서 여러 외부 패키지를 제공한다. GUI 환경에서 설치를 할 수도 있고, 명령어로 설치할 수 있다.
참고
나성호의 R 데이터 분석 입문 도서
https://github.com/HelloDataScience/DAwR
'Programming Language > etc' 카테고리의 다른 글
ISO 8601, 세계협정시(UTC) (0) | 2022.10.06 |
---|---|
[R.입문] R 프로그래밍 (0) | 2021.10.10 |
[R.입문] R 자료구조 - 리스트와 데이터프레임 (0) | 2021.10.06 |
[R.입문] R 자료구조 - 벡터(vector) (0) | 2021.10.05 |