본문 바로가기
데이터/통계

[통계학] 로지스틱 회귀분석 기초 내용 정리

by dwoi 2023. 4. 12.

데이터 분석에 기본이 되는 통계학에 대한 기초를 공부하는 내용을 정리

 

목차

     


    통계학(statistics)

    사진: Unsplash 의 Justin Morgan

     


    1. 일반화 선형 모형

    1.1. 선형모형의 일반화

    회귀분석 모델을 일반화 시킨 모형

    일반화를 시키는 이유?

    • y의 값이 항상 실수를 갖는 것이 아님
      • 특정 경우에 따라서 반응 변수의 값은 양수인 정수 값을 갖는 경우가 있음
    • 반응 변수의 분산이 평균값에 따라서 변할 수 있음.
    • 선형 회귀 모형에서는 불가능 했었음

     

    1.2. 로지스틱 회귀모형

    일반화 선형모형의 한 종류로 반응 변수 Y가 두가지의 값(0과 1)을 가질 수 있음.

    위 선형회귀 모델을 0과 1로 보내는 방법은 없을까? 

    로지스틱 함수

     

     

    2. 베르누이 확률 변수와 선형 모형

    베르누이 확률변수는 0 과 1의 값을, 모수인 p는 0과 1사이의 값을 갖는다.

    • 로지스틱 회귀분석은 반응 변수 Y를 베르누이 확률변수로 모델링한다.
    • 모수 p를 로지스틱 함수를 사용해서 선형모형의 결과값과 연결해 준다.

     

     

    1. 관측값과 가능도함수를 통해 정의
    2. 로그
    3. 미분
    4. 경사하강법을 이용해서 미분가능한 함수의 최소값을 찾음
      • .특정 값에서의 그레디언트 벡터와 학습률을 곱한 것을 빼가면서 그레디언트가 낮은 값을 찾아나가는 과

    로지스틱 함수의 미


     

     

    마무리

     

     

     

     

    댓글