본문 바로가기
데이터/통계

[통계학] 베이즈 통계 기초

by dwoi 2023. 4. 12.

데이터 분석에 기본이 되는 통계학에 대한 기초를 공부하는 내용을 정리

 

목차

     


    통계학(statistics)

    사진: Unsplash 의 Justin Morgan

     


    1. 베이즈 정리

    1.1. 베이즈 정리

    만약, P(A)가 0이 아니고, P(A|B)를 알고 있다면, P(B|A) 는 다음과 같이 나타 낼 수 있다.

    1.2. 조건부 확률

     

    확률의 곱셈법칙

    1.3. 전확률 법칙 (The law of total probability)

    표본 공간 S를 분할하는 사건 Bi들을 사용하여표본 공간의 다른 사건 A의 확률 P(A)를 조건부 확률을 사용하여 다음과 같이 나타낼 수 있다.

     

    2. 베이즈 정리를 이용한 사후 확률 계

    어느 반도체를 만드는 회사에 2개의 생산 공장 A, B가 있다고 하자. 공장 A는 전체 생산량의 60%를 생산하고, B는 40%를 생산한다. 공장 A에서 생산된반도체 중 1%는 결함이고, B에서 생산된 반도체의 결함율은 5%라고 한다.

    1. 반도체 회사 제품의 결함율은 얼마인가?

    0.6 * 0.01 + 0.4*0.05  
    2. 반도체 회사의 제품이 결함이라고 판별되었을 경우, 공장 B에서 만들어진 제품일 확률은 얼마인가?

    0.7692

     


     

     

    3. 베이지안 통계

    3.1 베이지안 통계학 (이산형)

    공장 정상 결함
    A 99 1
    B 95 5

    위 정보를 바탕으로 베르누이 확률변수- 0 (정상)과 1 (결함)-로 생각해볼 수 있다.

    이렇게 데이터의 발생에 관여하는 분포를 모델 분포 (Model distribution)라고 함.

    3.2. 사전 분포 (Prior distribution)

    모델 분포의 모수에 대한 우리의 사전 정보를 분포화 시킨 것을 모수에 대한 사전분포(prior distribution)

    3.3. 사후분포 (Posterior Distribution)

    자신이 이전에 가지고 있던 prior를 수정하여 얻어지는 분포

    3.4. 가능도 함수 (Likelihood function)

     

    사전 분포의 가능도 함수를 구해서

    베이즈 정리를 이용해 사후분포를 구한다고 이해.

     

    베이지안 통계학은 이러한 우리의 생각을 수식을 통하여 보여주고, 모수의
    정보를 반영해준다는데 큰 힘이 있다

     

    마무리

     

    확률을 통계적인 관점으로 보는 것에 대해 익숙해질 필요가 있음. 

    댓글