데이터 분석에 기본이 되는 통계학에 대한 기초를 공부하는 내용을 정리
목차
통계학(statistics)
1. 일반화 선형 모형
1.1. 선형모형의 일반화
회귀분석 모델을 일반화 시킨 모형
일반화를 시키는 이유?
- y의 값이 항상 실수를 갖는 것이 아님
- 특정 경우에 따라서 반응 변수의 값은 양수인 정수 값을 갖는 경우가 있음
- 반응 변수의 분산이 평균값에 따라서 변할 수 있음.
- 선형 회귀 모형에서는 불가능 했었음
1.2. 로지스틱 회귀모형
일반화 선형모형의 한 종류로 반응 변수 Y가 두가지의 값(0과 1)을 가질 수 있음.
위 선형회귀 모델을 0과 1로 보내는 방법은 없을까?
로지스틱 함수
2. 베르누이 확률 변수와 선형 모형
베르누이 확률변수는 0 과 1의 값을, 모수인 p는 0과 1사이의 값을 갖는다.
- 로지스틱 회귀분석은 반응 변수 Y를 베르누이 확률변수로 모델링한다.
- 모수 p를 로지스틱 함수를 사용해서 선형모형의 결과값과 연결해 준다.
- 관측값과 가능도함수를 통해 정의
- 로그
- 미분
- 경사하강법을 이용해서 미분가능한 함수의 최소값을 찾음
- .특정 값에서의 그레디언트 벡터와 학습률을 곱한 것을 빼가면서 그레디언트가 낮은 값을 찾아나가는 과
마무리
'데이터 > 통계' 카테고리의 다른 글
[통계학] 베이즈 통계 기초 (0) | 2023.04.12 |
---|---|
[통계학] 최대 우도 추정량에 대한 개념 정리 (0) | 2023.04.12 |
[통계학] 회귀분석 개념 정리 (0) | 2023.04.12 |
[통계학] 상관계수 기초 내용 정리 (0) | 2023.04.12 |
[통계학] t 검정 이론 내용 정리 (0) | 2023.04.12 |
댓글