본문 바로가기 메뉴 바로가기

티스토리 뷰

방송대/R 컴퓨팅

3강. 데이터 입력과 저장

monimoni 2025. 3. 9. 14:32

1. 작업 directory 설정 및 현재 directory 확인

R을 활용할 때 작업 디렉토리 변경의 필요성이 있음
- 기본 작업경로가 길고 복잡한 경우에는 경로를 일일이 찾아 지정하는 것이 매우 번거로울 수 있으므로 작업디렉토리를 변경
- ex ) D 드라이브 하에 “datav” 라는 directory가 만들어져 있다고 가정할 경우, 아래와 같은 명령으로 작업 디렉토리를 설정 및 향후 접근 가능
- ex ) setwd('D:\\datav'), setwd(‘D:/datav’)
- serwd는 Set Working Directory의미
현 작업 디렉토리의 확인은 getwd( ) 함수를 이용

2. c( ) 함수를 이용한 데이터 입력

c( ) 함수는 가장 기본적인 데이터 입력 방법
좌측에 벡터 이름( 객체명 )이 위치하며 ‘←’ 나 ‘=’ 연산자는 데이터가 할당됨을 의미하고 우측에는 입력대상이 되는 데이터의 관측값이 c 함수 내에 나타나게 됨

3. c( ) 함수 예제

10, 20, 30, 40, 50 다섯 개의 관측값을 갖는 벡터 y를 생성하고 입력결과를 바로 화면에 출력
- ex ) ( y ← c(10,20,30,40,50) )
두 개의 벡터 x 와 y를 결합하여 dat 라는 객체 생성
- ex ) x ← c(1,2,3,4,5) // x 객체 생성
- ex ) dat ← cbind(x,y) // 결합

4. scan 함수를 이용한 데이터 입력

R 에서는 scan 함수를 활용하여 바로 데이터를 입력할 수 있음
- 함수를 실행하면 실행 프롬프트가 " 1: " 으로 바뀌게 되는데
- 이때 자료를 하나씩 입력하고 Enter 키를 치면 다음 값을 입력할 수 있게 됨

5. scan( ) 함수 예제

scan( ) 함수를 이용하여 23,4,5,6,7 다섯 개의 관측값을 갖는 벡터 w1 생성
- ex ) w1 ← scan( ) 1: 23 2: 4 3: 5 4: 6 5: 7 6: Read 5 items
w1 <- scan(sep=",")를 통해서 한번에 여러 값을 입력도 가능

6. edit 함수를 이용한 입력

edit( ) 함수를 이용하여 데이터프레임을 생성하기 위해 빈 객체를 데이터프레임으로 지정해 준 뒤 창을 열어 데이터를 입력할 수 있음
- ex ) dat3 ← data.frame( )
- ex ) dat3 = edit( dat3 )

7. sink( ) 함수를 이용한 출력결과 파일 저장

함수 sink( )를 활용하여 화면에 출력된 모든 결과를 파일로 저장
시작 시 저장할 파일명을 지정하고 원하는 함수를 실행시킨 뒤 종료 시 sink( )로 마감
- ex ) sink('파일명') summary(데이터셋) sink( )
저장된 파일을 열면 기술통계량이 저장되어 있음을 확인 가능

8. write.csv( ) 함수를 이용한 데이터 저장

R에서 생성된 객체( Object )는 외부 파일로 저장할 수 있음
다른 경로가 지정되어 있지 않다면 이 파일은 기 설정된 작업 Directory에 저장
- ex ) write.csv(저장하려는 객체명,'파일명')
데이터 포맷 csv ( comma separated values )는 엑셀, 노트패드 등 다양한 프로그램에서 쉽게 저장 및 편집을 할 수 있는 데이터 포맷으로 비교적 적은 용량으로 데이터를 저장할 수 있다는 장점이 있음

9. write.csv( ) 함수 예제

R의 작업경로가 "D:/datav"로 지정되어있다고 할 때, dat 객체를 이 directory에 “dat_exam1.csv” 라는 파일로 저장
- ex ) write.csv(dat, 'dat_exam1.csv')

10. write.table( ) 함수를 이용한 데이터 저장

write.table( )함수도 R의 객체를 외부로 저장한다는 점에서는 write.csv( )와 유사하지만, 기본적으로 지정되어 있는 옵션 상 차이 존재
- write.table(dat,'dat_exam2.txt')
- 각 원소의 값을 구분하는 ,가 존재 X
- 각 원소의 값을 공백으로 구분
기본적으로 콤마 대신 공백( 탭 )을 기준으로 관측값을 구별하므로 콤마를 기준으로 관측값을 구별하려면 sep=“,” 라는 옵션을 추가해야 함
- ex ) write.table(dat,'dat_exam2.txt', sep=“,”)
- sep는 Separate 의미

11. read.csv( ) 함수를 이용한 데이터 불러오기

R에서 csv 형식의 데이터 파일을 불러올 때 read.csv( ) 함수를 사용
- ex ) dat2 ← read.csv('dat_exam1.csv')
변수명이 없었던 첫 번째 column은 X라는 변수명이 자동 할당됨

12. read.csv( ) 함수 예제

현 작업 경로에 USArrestd.csv라는 데이터셋이 저장되어 있다고 가정할 때, read.csv() 함수를 이용하여 USArrestd.csv를 불러오고 us_dat라는 객체명으로 저장
- ex ) us_dat<-read.csv('USArrestd.csv',header=T)
- ex ) head(us_dat)
header는 첫번째 행이 변수임을 알려주는 옵션

13. str( ) 함수를 이용하여 데이터 구조 확인하기

R에서 불러온 자료구조를 확인하기 위해서는 str( ) 함수를 사용
- ex ) str(us_dat)
State라는 변수는 자동으로 Factor( 범주형 )변수로 변환되었는데, 이를 방지하기 위해서는 “stringsAsFactors=F“ 라는 옵션을 추가하여 문자로 인식
- stringsAsFactors 해당 문자열은 Factor이 인지 아닌지를 알려주는 옵션

14. read.table( ) 함수를 이용한 데이터 불러오기

텍스트 파일은 read.csv( ) 함수 외에도 read.table( ) 함수를 이용하여 불러올 수 있음
- ex ) read.table('dat_exam2.txt',header=T)
- header 옵션 지정에 따라 첫째줄의 관측치를 변수명으로 인식하느냐 여부가 결정됨

15. na.strings 옵션을 이용한 결측치 지정

R에서는 결측치가 ‘NA’로 표시되지만 데이터를 읽어오면서 na.strings와 같은 옵션을 지정해주면 특정한 문자를 결측치로 인식
- ex ) nadat ← read.table('dat3_exam1.txt',na.strings='aa',header=T)
- ex ) 'dat3_exam1.txt’ 파일을 읽을 때, 관측값 ‘aa’를 결측치로 인식하여 데이터 불러오기
- header 옵션 지정에 따라 첫째줄의 관측치를 변수명으로 인식하느냐 여부가 결정됨

16. ls( ) 함수를 이용한 개체 확인

ls( ) 함수를 이용하면 현재까지의 작업 중 만들어진 object를 모두 확인 할 수 있음
- ex ) Is( )

17. rm( ) 함수를 이용한 모든 개체 삭제

rm( ) 함수를 수행하면 생성된 모든 object를 삭제할 수 있음 ( Remove )
- ex ) rm( list=ls( ) )

728x90

'방송대 > R 컴퓨팅' 카테고리의 다른 글

5강. 데이터 구조 (2) (0)	2025.03.23
4강. 데이터 구조 (1) (0)	2025.03.15
3강. 데이터 요약 2 (0)	2025.03.06
2강. R 입문 ( 2 ) (0)	2025.03.02
1강. R 입문( 1 ) (0)	2025.02.23

댓글

최근에 올라온 글

Total

Today

Yesterday

공지사항

티스토리툴바