티스토리 뷰

방송대/통계학계론

8강. 추정 (1)

monimoni 2025. 4. 10. 11:31

1. 통계적 추론

  • 통계적 추론
    • 표본의 관측값( 데이터 )으로 모집단의 모수를 추측, 판단하는 방법 → 통계적 사고
  • 통계적 추론
    • 추정( 추측 )
      • 점추정, 구간추정
      • ex ) 여론조사
    • 검정( 판단 )
      • ex ) 비타민 C의 감기예방효과

2. 모집단과 표본

  • 모집단( population )
    • 알고 싶은 모든 개체의 집합
  • 표본( sample )
    • 모집단의 일부
    • 임의 추출해서 모집단을 대표

3. 확률변수와 데이터

  • 확률변수( random variable )
    • 모집단 특성 나타내는 변수 → 불확실( 확률분포 )
  • 확률변수와 데이터( 관측값 )
    • 확률변수와 데이터는 관측의 유무에 따라서 구분

4. 확률분포

  • 확률분포
    • 몇 개 모수를 가지는 수리적 함수
  • 확률변수의 분포 아는 것
    • == 모수( parameter )를 아는 것
  • 확률변수의 모수
    • 이항분포 : 모비율 𝐵(𝑛, 𝑝)
    • 정규분포 : 모평균과 모분산 𝑁(𝜇, σ²)

5. 통계적 추정 1

  • 표본( 확률변수 )으로 모집단의 모수를 추측
    • 모수는 고정된 상수이지만 알 수 없다고 가정
  • 통계량( statistic ) : 표본 확률변수의 함수
    • 모수를 추정하기 위한 도구 → 추정량
    • 표본분포( sampling distribution ) : 통계량의 분포
    • 추정값 : 추정량( 수식 )에 관측값( 데이터 )를 대입
  • 모집단에서 표본 : X₁, X₂, ⋯, Xₙ ~ N(μ, σ²)
    • 관측값 : x₁, x₂, ⋯, xₙ
  • 통계량(추정량) : X̄ = (1/n) ∑ (i=1 to n) Xᵢ ~ N(μ, σ²/n)
모수 추정량 추정값 표본분포
모평균 X̄ = (1/n) ∑ (i=1 to n) Xᵢ X̄ = 170.1 cm 정규분포
모분산 S² = (1/(n-1)) ∑ (i=1 to n) (Xᵢ - X̄)² S² = 2.54 χ²분포

6. 통계적 추정 2

  • 점추정( point estimation )
    • 표본의 정보로부터 모집단의 모수를 하나의 값으로 추정
  • 구간추정( interval estimation )
    • 추정값에 대한 신뢰도를 제시하면서 범위로 모수를 추정
    • 100(1 − 𝛼)% 신뢰구간
      • P(L < θ < U) = 1 - α
        • L : 하한
        • θ : 모수
        • U : 상한

7. 표본평균

  • 모집단에서 표본 : X₁, X₂, ⋯, Xₙ
    • 표본분포 : X̄ = (1/n) ∑(i=1 to n) Xᵢ
  • 표본의 관측값: x₁, x₂, ⋯, xₙ
    • x̄ = (1/n) ∑(i=1 to n) xᵢ → 조사할 때마다 결과가 다름

8. 표본평균의 특성

  • 표본평균은 모평균의 불편추정량 : E(X̄) = μ
  • 표본평균의 분산은 표본수가 커지면서 작아짐
    • Var(X̄) = σ² / n
  • 중심극한정리
    • 표본평균은 표본 수가 커지면서 모집단 분포와 관계없이 정규분포를 따름
    • √n (X̄ - μ) → N(0, σ²)

9. 표본평균의 분포

  • X₁, X₂, ⋯, Xₙ ~ (μ, σ²)
    • 중심극한정리 : √n (X̄ - μ) → N(0, σ²)
    • √n (X̄ - μ) / σ → N(0, 1)
    • P(-1.96 < (X̄ - μ) / (σ / √n) < 1.96) = 0.95

10. 모평균의 신뢰구간

  • P(X̄ - 1.96 × (σ / √n) < μ < X̄ + 1.96 × (σ / √n)) = 0.95
  • μ의 95% 신뢰구간
    • [X̄ - 1.96 × (σ / √n), X̄ + 1.96 × (σ / √n)]
  • μ의 100(1-α)% 신뢰구간
    • [X̄ - zα/2 × (σ / √n), X̄ + zα/2 × (σ / √n)]
  • σ를 모를 때 표본표준편차 S를 이용
    • 가정 : X₁, X₂, ⋯, Xₙ ~ N(μ, σ²) → 정규분포를 따른다고 가정
    • √n (X̄ - μ) / S ~ tₙ₋₁ → t분포를 따름
    • μ의 100(1 - α)% 신뢰구간
      • [X̄ - tₙ₋₁,α/₂ * (S/√n), X̄ + tₙ₋₁,α/₂ * (S/√n)]

11. 신뢰수준과 신뢰구간

  • 100(1 - α)% : 신뢰수준
    • 신뢰수준이 클수록 신뢰구간에 모평균 포함될 가능성 증가
    • 표본수 증가하면 tₙ₋₁,α/₂가 zα/₂에 근접
  • 신뢰수준
    • 무한히 반복해서 구한 신뢰구간중 모평균이 포함된 비율
  • 신뢰구간
    • 모수가 실제로 포함될 것으로 예측되는 범위
728x90
댓글
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
최근에 올라온 글
Total
Today
Yesterday
공지사항