bayesian statistics - 1
2018-05-26
베이즈통계학 입문
wonseok Jung
- 베이즈 추정에서는 정보를 순차적으로 사용할 수 있다.
- 베이즈 추정은 정보를 얻을수록 더 정확해진다.
1. 베이즈 추정에서는 정보를 순차적으로 사용할 수 있다.
베이즈 추정에서는 이전의 정보를 잊어도 앞뒤가 들어 맞는다.
- 어떠한 정보 두개를 얻었을때의 베이즈에서 확률 변화
$Prior$ $\rightarrow_{info1}$ $\rightarrow$ $Posterior$ $\rightarrow_{info2}$ $\rightarrow$ $Another Posterior$
- Information 1 에 의해 확률이 바뀌었다.
- 새로운 Information2를 얻어 다시 확률이 바뀔때, Information1을 얻기 전의 확률 $prior$ 은 잊어도 된다.
- 질문 : 그렇다면 information1 이전의 확률 $prior$은 전혀 필요없는 확률일까?
Example - Email filter
$Prior$ $\rightarrow_{info1}$ $\rightarrow$ $Posterior$ $\rightarrow_{info2}$ $\rightarrow$ $Another Posterior$
- Prior and conditional probability about Link:
- $P(spam) = 0.5$
- $P(link \mid spam)=0.6$,
-
$P(Notlink \mid spam)=0.4$
- $P(Notspam) = 0.5$
- $P(link \mid Notspam) = 0.2$
- $P(Notlink \mid Notspam) =0.8$
Information1 - 링크 검출
- $P(spam) = 0.5$
-
$P(link \mid spam)=0.6$
- $P(Notspam) = 0.5$
-
$P(link \mid Notspam) = 0.2$
- 스팸일 확률 : 아닐확률 $0.5 \times 0.6 :0.5 \times 0.2$ $= 0.3 : 0.1$ $=\frac{3}{4}:\frac{1}{4}$ $= 75% : 25%$
Posterior을 Prior로 사용
- 위에서 구한 Posterior을 다시 Prior을 재설정한다.
- 이미 사전확률이라는 것은 근거없이 설정되어 있는 값
- 질문 : 너무 불확실한것 아닐까? 이렇게 계속 정보를 넣어가며 확률이 바뀌면 언젠가는 수렴하는가?
New Prior and condition probability about word “meet”
-
$P(spam) = 0.75$
- $P(meet \mid spam)=0.4$
-
$P(Nomeet\mid spam)=0.6$
-
$P(Notspam) = 0.25$
- $P(Meet\mid Notspam) = 0.05$
- $P(Nomeet \mid Notspam) =0.95$
Information2 - “meet” 단어검출
- $P(spam) = 0.75$
- $P(meet \mid spam)=0.4$
- $P(Notspam) = 0.25$
- $P(Nomeet \mid Notspam) =0.95$
- Spam일 확률 : Spam이 아닐 확률
$0.75 \times 0.4 : 0.25 \times 0.95$
$= 0.3 : 0.01$ $= \frac{0.3}{0.31} : \frac{0.01}{0.31}$
$= 0.97 : 0.03$
- Information2에 의해 새로운 Prior
두가지 방법
- Info1으로부터 수정한 Posterion을 Prior로 설정하고 또다른 Info2로 인해 수정된 Posterior
$Prior$ $\rightarrow_{info1}$ $\rightarrow$ $Posterior$ $\rightarrow_{info2}$ $\rightarrow$ $Another Posterior$
- Info1, Info2을 한번에 사용해서 구한 Posterior
$Prior$ $\rightarrow_{info1,info2}$ $\rightarrow Another Posterior$
- 두 방법을 통하여 구한 Posterior는 일치한다.
축차합리성 (영어로 무엇일까?)
- 두가지 정보를 한꺼번에 사용하여 추정한 결과와
- 첫번째 정보를 사용하여 추정 -> 그 추정 결과를 사전확률로 변경 -> 두번째 정보를 사용하여 추정한 결과가 완전히 일치
- 이러한 성질을 축차합리성 이라고 한다.
축차합리성 -2
- 이전에 사용한 정보는 잊어도 관계없다.
- 그것은 그로부터 얻은 사후확률에 반영
베이즈 추정은 정보를 얻을수록 더 정확해진다.
적당적당한 추측에서 더 정확한 추정으로 만들려면
-베이즈추정 정보가 더 많아질수록 더 정확한 추정을 한다.
Example - Bowl Problem
문제 :
- 눈앞에 Bowl가 하나 있다.
- Bowl A 혹은 Bowl B라는 사실은 알고 있지만 겉으로 봐서는 어느 쪽인지 알 수가 없다.
- 두개의 공을 뽑는데 처음 꺼낸 공을 다시 단지에 넣고 새로 공을 한깨 뽑는 경우 (independent)
- Bowl A
- White ball 9, Black ball 1
- Bowl B
- White ball 2, Black ball 8
Prior 설정 - $P(BowlA)$
- $P(BowlA) = 0.5$
- $P(black\mid BowlA)=0.1$
-
$P(white \mid BowlA) = 0.9$
Prior 설정 - $P(BowlB)$
- $P(BowlB) = 0.5$
- $P(black\mid BowlB)=0.8$
- $P(white \mid BowlB) = 0.2$
Information - 첫번째와 두번째 공 모두 Black 관측
- BowlA : BowlB
- $0.5 \times 0.1 \times 0.1 : 0.5 \times 0.8 \times 0.8$
- $0.005 :0.32$
- $P(BowlA)= 0.005/0.325 = 0.015384615384615384$
- $P(BowlB)= 0.32 / 0.325 =0.9846153846153846$
$0.015 : 0.984$
Information - 첫번째는 Blck, 두번째는 White 공이 관측
- BowlA : BowlB
- $0.5 \times 0.1 \times 0.9 : 0.5 \times 0.8 \times 0.2$
- $=0.045 : 0.08$
- $P(BowlA)= 0.045 / 0.125 = 0.36$
- $P(BowlB)= 0.08/ 0.125 = 0.64$
- 첫번째와 두번째 공이 모두 Black 공 관측
- P(BowlB)= 0.32 / 0.325 =0.98$
-
첫번째는 Blck, 두번째는 White 공 관측
- $P(BowlB)= 0.08/ 0.125 = 0.64$
- $0.98 \rightarrow 0.64$ 앞에있는 Bowl이 B일 것이라는 확률이 작아짐
최신 관측결과에 따라 결론이 달라진다.
- (n+1)번째 Posterior을 계산하기 위해 n번째까지의 공의 색을 열거한 필요는 없다.
- n번째의 Posterior에 그 모든 확률이 전부 반영되어있다.
Example n+1번째에 black 공을 뽑았을때 각 Bowl의 Posterior
(n+1)번째의 $P(BowlA)$ : ( n+1)번째의 $P(BowlB)$
$= a’ : b’$
$= a \times 0.1 : b \times 0.8$
$= a : 8b$
- Bowl A :Bowl B 8배의 비례관계
여러 번 관측할수록 추측은 진실에 가까워진다.
- 베이즈 추정은 관측을 많이 하면 할수록 정확한 결론을 내릴 수 있다.
- (정보가 많이 있으면) 더욱 올바른 결론을 내릴 수 있다.