티스토리 뷰
1. 통계적 추론
- 통계적 추론
- 표본의 관측값( 데이터 )으로 모집단의 모수를 추측, 판단하는 방법 → 통계적 사고
- 통계적 추론
- 추정( 추측 )
- 점추정, 구간추정
- ex ) 여론조사
- 검정( 판단 )
- ex ) 비타민 C의 감기예방효과
- 추정( 추측 )
2. 모집단과 표본
- 모집단( population )
- 알고 싶은 모든 개체의 집합
- 표본( sample )
- 모집단의 일부
- 임의 추출해서 모집단을 대표
3. 확률변수와 데이터
- 확률변수( random variable )
- 모집단 특성 나타내는 변수 → 불확실( 확률분포 )
- 확률변수와 데이터( 관측값 )
- 확률변수와 데이터는 관측의 유무에 따라서 구분
4. 확률분포
- 확률분포
- 몇 개 모수를 가지는 수리적 함수
- 확률변수의 분포 아는 것
- == 모수( parameter )를 아는 것
- 확률변수의 모수
- 이항분포 : 모비율 𝐵(𝑛, 𝑝)
- 정규분포 : 모평균과 모분산 𝑁(𝜇, σ²)
5. 통계적 추정 1
- 표본( 확률변수 )으로 모집단의 모수를 추측
- 모수는 고정된 상수이지만 알 수 없다고 가정
- 통계량( statistic ) : 표본 확률변수의 함수
- 모수를 추정하기 위한 도구 → 추정량
- 표본분포( sampling distribution ) : 통계량의 분포
- 추정값 : 추정량( 수식 )에 관측값( 데이터 )를 대입
- 모집단에서 표본 : X₁, X₂, ⋯, Xₙ ~ N(μ, σ²)
- 관측값 : x₁, x₂, ⋯, xₙ
- 통계량(추정량) : X̄ = (1/n) ∑ (i=1 to n) Xᵢ ~ N(μ, σ²/n)
모수 | 추정량 | 추정값 | 표본분포 |
모평균 | X̄ = (1/n) ∑ (i=1 to n) Xᵢ | X̄ = 170.1 cm | 정규분포 |
모분산 | S² = (1/(n-1)) ∑ (i=1 to n) (Xᵢ - X̄)² | S² = 2.54 | χ²분포 |
6. 통계적 추정 2
- 점추정( point estimation )
- 표본의 정보로부터 모집단의 모수를 하나의 값으로 추정
- 구간추정( interval estimation )
- 추정값에 대한 신뢰도를 제시하면서 범위로 모수를 추정
- 100(1 − 𝛼)% 신뢰구간
- P(L < θ < U) = 1 - α
- L : 하한
- θ : 모수
- U : 상한
- P(L < θ < U) = 1 - α
7. 표본평균
- 모집단에서 표본 : X₁, X₂, ⋯, Xₙ
- 표본분포 : X̄ = (1/n) ∑(i=1 to n) Xᵢ
- 표본의 관측값: x₁, x₂, ⋯, xₙ
- x̄ = (1/n) ∑(i=1 to n) xᵢ → 조사할 때마다 결과가 다름
8. 표본평균의 특성
- 표본평균은 모평균의 불편추정량 : E(X̄) = μ
- 표본평균의 분산은 표본수가 커지면서 작아짐
- Var(X̄) = σ² / n
- 중심극한정리
- 표본평균은 표본 수가 커지면서 모집단 분포와 관계없이 정규분포를 따름
- √n (X̄ - μ) → N(0, σ²)
9. 표본평균의 분포
- X₁, X₂, ⋯, Xₙ ~ (μ, σ²)
- 중심극한정리 : √n (X̄ - μ) → N(0, σ²)
- √n (X̄ - μ) / σ → N(0, 1)
- P(-1.96 < (X̄ - μ) / (σ / √n) < 1.96) = 0.95
10. 모평균의 신뢰구간
- P(X̄ - 1.96 × (σ / √n) < μ < X̄ + 1.96 × (σ / √n)) = 0.95
- μ의 95% 신뢰구간
- [X̄ - 1.96 × (σ / √n), X̄ + 1.96 × (σ / √n)]
- μ의 100(1-α)% 신뢰구간
- [X̄ - zα/2 × (σ / √n), X̄ + zα/2 × (σ / √n)]
- σ를 모를 때 표본표준편차 S를 이용
- 가정 : X₁, X₂, ⋯, Xₙ ~ N(μ, σ²) → 정규분포를 따른다고 가정
- √n (X̄ - μ) / S ~ tₙ₋₁ → t분포를 따름
- μ의 100(1 - α)% 신뢰구간
- [X̄ - tₙ₋₁,α/₂ * (S/√n), X̄ + tₙ₋₁,α/₂ * (S/√n)]
11. 신뢰수준과 신뢰구간
- 100(1 - α)% : 신뢰수준
- 신뢰수준이 클수록 신뢰구간에 모평균 포함될 가능성 증가
- 표본수 증가하면 tₙ₋₁,α/₂가 zα/₂에 근접
- 신뢰수준
- 무한히 반복해서 구한 신뢰구간중 모평균이 포함된 비율
- 신뢰구간
- 모수가 실제로 포함될 것으로 예측되는 범위
728x90
'방송대 > 통계학계론' 카테고리의 다른 글
9강. 추정 (2) (0) | 2025.04.16 |
---|---|
7강. 확률분포와 표본분포 (2) (0) | 2025.04.09 |
6강. 확률분포와 표본분포 (1) (0) | 2025.04.01 |
5강. 확률 및 확률 분포 함수 (2) (0) | 2025.03.23 |
4강. 확률 및 확률분포함수 (1) (0) | 2025.03.15 |
댓글