본문 바로가기
데이터/통계

[통계학] 회귀분석 개념 정리

by dwoi 2023. 4. 12.

데이터 분석에 기본이 되는 통계학에 대한 기초를 공부하는 내용을 정리

 

목차

     


    통계학(statistics)

    사진: Unsplash 의 Justin Morgan

     


    1. 회귀 모형

    1.1. 회귀모형 (Regression model)

    반응 변수 Y와 독립 변수 X와의 관계가 다음과 같은 선형이라는 가정을 바탕으로 한다. 

    e는 관찰에 섞여있는 잡음

    1.2. 모형의 가정

    n개의 데이터가 관측되었다고 한다면, n개의 데이터 순서쌍 (x, y)들은 다음과 같이 모델링

    e는 서로 독립을 가정하고 평균은 0 분산은 σ²인 분포를 따를 때 가장 잘 설명하는 선형 모형은?

     

     

    2. 회귀 직선식의 추정(최소제곱법의 의미)

    2.1 회귀직선

    데이터와 직선사이의 수직거리 (error)의 제곱의 합을 최소화시키는 직선을 최적 직선


     

     

    3. 회귀직선식의 검정과 심뢰구간

    3.1 결정계수

    회귀분석 모델을 사용하므로써 얼마나 효용을 얻게 되었는지에 대한 측정값.

    표본 표준편차

    회귀 표준오차

    .

    3.2. 기울기에 대한 신뢰구간

    데이터가 바뀔때마다 회귀직선이 바뀜.

    신뢰구간이 필요

    3.3 예측에 대한 신뢰구간

     

    마무리

    표본의 표준편차 오차 같은 개념들이 혼동이 오는데

    여러 예제를 좀 접해가면서 혼돈되는 개념들을 줄일 필요가 있다고 보여짐.

     

    댓글