티스토리 뷰
1. 작업 directory 설정 및 현재 directory 확인
- R을 활용할 때 작업 디렉토리 변경의 필요성이 있음
- 기본 작업경로가 길고 복잡한 경우에는 경로를 일일이 찾아 지정하는 것이 매우 번거로울 수 있으므로 작업디렉토리를 변경
- ex ) D 드라이브 하에 “datav” 라는 directory가 만들어져 있다고 가정할 경우, 아래와 같은 명령으로 작업 디렉토리를 설정 및 향후 접근 가능
- ex ) setwd('D:\\datav'), setwd(‘D:/datav’)
- serwd는 Set Working Directory의미
- 현 작업 디렉토리의 확인은 getwd( ) 함수를 이용
2. c( ) 함수를 이용한 데이터 입력
- c( ) 함수는 가장 기본적인 데이터 입력 방법
- 좌측에 벡터 이름( 객체명 )이 위치하며 ‘←’ 나 ‘=’ 연산자는 데이터가 할당됨을 의미하고 우측에는 입력대상이 되는 데이터의 관측값이 c 함수 내에 나타나게 됨
3. c( ) 함수 예제
- 10, 20, 30, 40, 50 다섯 개의 관측값을 갖는 벡터 y를 생성하고 입력결과를 바로 화면에 출력
- ex ) ( y ← c(10,20,30,40,50) )
- 두 개의 벡터 x 와 y를 결합하여 dat 라는 객체 생성
- ex ) x ← c(1,2,3,4,5) // x 객체 생성
- ex ) dat ← cbind(x,y) // 결합
4. scan 함수를 이용한 데이터 입력
- R 에서는 scan 함수를 활용하여 바로 데이터를 입력할 수 있음
- 함수를 실행하면 실행 프롬프트가 " 1: " 으로 바뀌게 되는데
- 이때 자료를 하나씩 입력하고 Enter 키를 치면 다음 값을 입력할 수 있게 됨
5. scan( ) 함수 예제
- scan( ) 함수를 이용하여 23,4,5,6,7 다섯 개의 관측값을 갖는 벡터 w1 생성
- ex ) w1 ← scan( ) 1: 23 2: 4 3: 5 4: 6 5: 7 6: Read 5 items
- w1 <- scan(sep=",")를 통해서 한번에 여러 값을 입력도 가능
6. edit 함수를 이용한 입력
- edit( ) 함수를 이용하여 데이터프레임을 생성하기 위해 빈 객체를 데이터프레임으로 지정해 준 뒤 창을 열어 데이터를 입력할 수 있음
- ex ) dat3 ← data.frame( )
- ex ) dat3 = edit( dat3 )
7. sink( ) 함수를 이용한 출력결과 파일 저장
- 함수 sink( )를 활용하여 화면에 출력된 모든 결과를 파일로 저장
- 시작 시 저장할 파일명을 지정하고 원하는 함수를 실행시킨 뒤 종료 시 sink( )로 마감
- ex ) sink('파일명') summary(데이터셋) sink( )
- 저장된 파일을 열면 기술통계량이 저장되어 있음을 확인 가능
8. write.csv( ) 함수를 이용한 데이터 저장
- R에서 생성된 객체( Object )는 외부 파일로 저장할 수 있음
- 다른 경로가 지정되어 있지 않다면 이 파일은 기 설정된 작업 Directory에 저장
- ex ) write.csv(저장하려는 객체명,'파일명')
- 데이터 포맷 csv ( comma separated values )는 엑셀, 노트패드 등 다양한 프로그램에서 쉽게 저장 및 편집을 할 수 있는 데이터 포맷으로 비교적 적은 용량으로 데이터를 저장할 수 있다는 장점이 있음
9. write.csv( ) 함수 예제
- R의 작업경로가 "D:/datav"로 지정되어있다고 할 때, dat 객체를 이 directory에 “dat_exam1.csv” 라는 파일로 저장
- ex ) write.csv(dat, 'dat_exam1.csv')
10. write.table( ) 함수를 이용한 데이터 저장
- write.table( )함수도 R의 객체를 외부로 저장한다는 점에서는 write.csv( )와 유사하지만, 기본적으로 지정되어 있는 옵션 상 차이 존재
- write.table(dat,'dat_exam2.txt')
- 각 원소의 값을 구분하는 ,가 존재 X
- 각 원소의 값을 공백으로 구분
- 기본적으로 콤마 대신 공백( 탭 )을 기준으로 관측값을 구별하므로 콤마를 기준으로 관측값을 구별하려면 sep=“,” 라는 옵션을 추가해야 함
- ex ) write.table(dat,'dat_exam2.txt', sep=“,”)
- sep는 Separate 의미
11. read.csv( ) 함수를 이용한 데이터 불러오기
- R에서 csv 형식의 데이터 파일을 불러올 때 read.csv( ) 함수를 사용
- ex ) dat2 ← read.csv('dat_exam1.csv')
- 변수명이 없었던 첫 번째 column은 X라는 변수명이 자동 할당됨
12. read.csv( ) 함수 예제
- 현 작업 경로에 USArrestd.csv라는 데이터셋이 저장되어 있다고 가정할 때, read.csv() 함수를 이용하여 USArrestd.csv를 불러오고 us_dat라는 객체명으로 저장
- ex ) us_dat<-read.csv('USArrestd.csv',header=T)
- ex ) head(us_dat)
- header는 첫번째 행이 변수임을 알려주는 옵션
13. str( ) 함수를 이용하여 데이터 구조 확인하기
- R에서 불러온 자료구조를 확인하기 위해서는 str( ) 함수를 사용
- ex ) str(us_dat)
- State라는 변수는 자동으로 Factor( 범주형 )변수로 변환되었는데, 이를 방지하기 위해서는 “stringsAsFactors=F“ 라는 옵션을 추가하여 문자로 인식
- stringsAsFactors 해당 문자열은 Factor이 인지 아닌지를 알려주는 옵션
14. read.table( ) 함수를 이용한 데이터 불러오기
- 텍스트 파일은 read.csv( ) 함수 외에도 read.table( ) 함수를 이용하여 불러올 수 있음
- ex ) read.table('dat_exam2.txt',header=T)
- header 옵션 지정에 따라 첫째줄의 관측치를 변수명으로 인식하느냐 여부가 결정됨
15. na.strings 옵션을 이용한 결측치 지정
- R에서는 결측치가 ‘NA’로 표시되지만 데이터를 읽어오면서 na.strings와 같은 옵션을 지정해주면 특정한 문자를 결측치로 인식
- ex ) nadat ← read.table('dat3_exam1.txt',na.strings='aa',header=T)
- ex ) 'dat3_exam1.txt’ 파일을 읽을 때, 관측값 ‘aa’를 결측치로 인식하여 데이터 불러오기
- header 옵션 지정에 따라 첫째줄의 관측치를 변수명으로 인식하느냐 여부가 결정됨
16. ls( ) 함수를 이용한 개체 확인
- ls( ) 함수를 이용하면 현재까지의 작업 중 만들어진 object를 모두 확인 할 수 있음
- ex ) Is( )
17. rm( ) 함수를 이용한 모든 개체 삭제
- rm( ) 함수를 수행하면 생성된 모든 object를 삭제할 수 있음 ( Remove )
- ex ) rm( list=ls( ) )
728x90
'방송대 > R 컴퓨팅' 카테고리의 다른 글
5강. 데이터 구조 (2) (0) | 2025.03.23 |
---|---|
4강. 데이터 구조 (1) (0) | 2025.03.15 |
3강. 데이터 요약 2 (0) | 2025.03.06 |
2강. R 입문 ( 2 ) (0) | 2025.03.02 |
1강. R 입문( 1 ) (0) | 2025.02.23 |
댓글