확률과 통계 2 - 조건부 확률

2024. 8. 6. 00:50기계 학습 (Machine Learning)/수학 (Mathematics)

 

이 장에서 설명할 확률들은

우리를 놀리기에 최적화된 확률입니다.

처음 접하면 마냥 헷갈리죠.

 

천천히 따라오세요.

 

 


Independent

 

조건부 확률을 이해하는 걸 극복하려면

먼저 독립(independent)을 알아야 합니다.

 

아래 예시를 보죠.

상자에서 숫자 공을 뽑고, 공의 숫자에 따라 다음 원통에서 색깔 공을 뽑습니다.

 

1번 공을 뽑고 파란 공을 뽑을 확률은 무엇일까요?

 

1번 공 뽑고, 왼쪽 위 빨간공,

오른쪽 위 파란공,

...

2번 공 뽑고 왼쪽 위 빨간공...

 

일일이 세면 총 24개 경우의 수가 나오고

1번 공과 파란공을 뽑는 사건은 3개가 나오네요.

그래서 확률은 3/24입니다.

 

 

 

일일이 세서 풀었다면, 좋습니다.

하지만 매번 확률을 만날 때마다 손으로 셀 수는 없는 노릇이니

계산을 빨리하기 위해 약간의 논리를 가미해보죠.

(싫으면 앞으로 그냥 손으로 세도 됩니다)

 

우선, 색깔 공은 제쳐두고 숫자 공만 봅시다.

네모난 상자에서 숫자 1을 뽑을 확률은 1/6입니다.

 

우리는 어쨌든 숫자 1을 뽑아야 한다는 걸 알아야 합니다.

그래야 다음 단계로 진출하니깐요.

2를 뽑거나 3을 뽑는 건 아무런 의미가 없습니다.

 

자 이제, 숫자 상자는 집어치우고 색깔 원통만 봅시다.

1번 원통에서 파란공을 뽑을 확률은 3/4입니다.

 

마지막입니다. 이 둘을 결합해서 생각해봅니다.

1/6 확률로 1번 공을 뽑아서 다음 단계로 가고,

3/4 확률로 파란공을 뽑는 것이죠.

 

그래서 3/24라는 확률는 1/6와 3/4를 곱한 것입니다.

 

이해가 안되면, 아래 그림을 참고해도 좋습니다.

숫자공과 색깔공을 자유롭게 바꿔서 확률을 계산해도 좋습니다.

 

 

놀라운 사실 하나 알려드리자면,

숫자공을 뽑는 사건과

색깔공을 뽑는 사건은

아무런 관계가 없습니다.

 

마치 숫자공에 따라서 색깔 원통이 결정되니까

둘이 어떤 관계에 놓여져 있다고 생각할 수 있죠.

 

 

하지만 아닙니다.

우리는 사건 자체에 집중해야 합니다.

 

숫자공을 고를 때 색깔공이 갑자기 네모난 상자로 들어가서 1이 되진 않습니다.

반대로 숫자공이 원통 상자에 들어가 빨간공이 되지도 않고요.

따라서 공을 뽑는 건 엄연히 구분되어 있습니다.

 

이렇게 사건이 구분되어 있을 때 독립(independant)이라고 합니다.

 

 

 

사실 설명만 듣고 이해가 안되도 괜찮습니다.

관계가 있는 사건을 보면 바로 이해될 것입니다.

눈금과 얼굴이 그려져 있는 8개 카드 중 하나를 뽑습니다.

 

카드를 뽑았을 때, 천사 얼굴이 나올 확률은 4/8입니다.

총 8개 카드 중에 4개가 천사 얼굴이기 때문이죠.

 

카드를 뽑았을 때, 눈금이 2가 될 확률은 3/8입니다.

총 8개 카드 중에 3개가 눈금이 2이기 때문이죠.

 

 

그러면, 카드를 뽑았을 때 천사 얼굴과 눈금 2가 나올 확률은 어떻게 될까요?
4/8 곱하기 3/8이 되어야 하니까 12/64 = 3/16 인가요?

 

아닙니다. 답은 1/8이죠.

누가봐도 천사 얼굴을 했으면서 눈금이 2인건 8개 카드 중에 1개입니다.

우리가 헷갈렸던 이유는 카드를 뽑는 사건 하나를

마치 둘로 쪼개서 천사 카드를 뽑고 난 후 눈금 카드를 뽑는 것이라고 생각했기 때문입니다.

 

카드를 뽑을 때 얼굴과 눈금이 함께 나옵니다.

따라서 얼굴과 눈금은 서로 관계되어 있습니다.

이럴 때는 종속(dependant)라고 합니다.

 

다시 돌아가서, 숫자공을 뽑는데 보니까 색칠되어 있고 그런게 아닙니다.

숫자공을 뽑고, 색깔공을 뽑는 것입니다.

 

 

 

확률과 통계 1 - 확률 분포 글에서 우리는 확률 함수 표현에 대해서 배웠습니다.

따라서 숫자공과 색깔공을 각각 확률 변수로 만들어서 다음과 같이 확률을 표현할 수 있습니다.

1번공을 뽑고 파란공을 뽑을 확률은 아래처럼 만들 수 있죠.

두 확률 변수는 독립이라고 했으니, 이렇게 써도 됩니다.

 

 

하지만 카드 예시는 독립이 아니고 종속이므로 이렇게만 써야합니다.

 

 

 

 

 

 


Conditional Probability

 

조금 먼 길을 왔지만, 힘내봅시다.

다시 숫자공과 색깔공 예시를 봅시다.

상자에서 숫자 공을 뽑고, 공의 숫자에 따라 다음 원통에서 색깔 공을 뽑습니다.

 

자, 숫자공에서 숫자를 뽑았습니다.

2가 나왔네요!

 

이제 파란공을 뽑을 확률은 무엇일까요?

2/4입니다.

 


이때 숫자공을 뽑을 확률은 무시해도 됩니다.

숫자공을 이미 뽑았으니깐요.

 

이해를 쉽게 돕자면...

숫자 2인 공을 뽑을 확률은 1입니다.

반대로 숫자 1 또는 3인 공을 뽑을 확률은 0입니다.

왜냐하면 이미 숫자 2인 공을 뽑았었으니까요!

이 공이 갑자기 3이 되었다가 1이 되었다가 하진 않습니다.

 

따라서 우리는 2번 원통에 있는 색깔공만 생각해도 됩니다.

이것이 바로 조건부확률입니다.

 

일부러 어렵게 생각하지 말고,

| 뒤는 그냥 신경쓰지 않는 걸로 합니다.

 

 

 

 

 

 

 


Joint Probability

 

결합 확률은 2개 이상 확률 변수를

조건부확률을 이용해서 두 개 확률로 분리해놓은 것입니다.

2번 공을 뽑고, 파란색 공을 뽑을 확률은?

 

이걸 결합 확률 형태로 쓰면

이 됩니다.

 

 

역시 그림을 보고 이해하면 쉽습니다.

상자에서 숫자 공을 뽑고, 공의 숫자에 따라 다음 원통에서 색깔 공을 뽑습니다.

 

1번 공을 뽑을 확률을 계산합니다.

P(x=1)이죠.

 

1번 공을 뽑았으니 1번 원통 상자로 가서 색깔 공을 뽑습니다.

이때!

이 말을 다르게 말하면,

1번 공은 이미 뽑아놨으니 1번 원통에서 색깔 공을 뽑는다는 것입니다.

그래서 조건부확률로 쓸 수 있는 것입니다.

 

 

카드 예시로 가볼까요?

눈금과 얼굴이 그려져 있는 8개 카드 중 하나를 뽑습니다.

 

천사 얼굴과 눈금 2가 나올 확률을 생각해봅시다.

천사 얼굴이 나올 확률은 4/8입니다.

8장 중에 천사 얼굴이 4장이기 때문이죠.

 

이 천사 얼굴 4장 중에 눈금 2는 1장이므로 1/4이 됩니다.

따라서 4/8 * 1/4는 1/8이므로 정답입니다.

 

우리가 찾는 건 천사 얼굴과 눈금 2입니다.

이걸 찾을 때 우리는 천사 얼굴을 고르고,

이 중에 눈금 2를 찾아서 8장 중에 1장 있다는 결론을 내렸죠.

이때!

이미 1/2로 천사 얼굴을 골라놨으니

이 중에 눈금 2를 찾는 것입니다.
그래서 조건부확률로 쓸 수 있는 것입니다.

 

 

괜찮죠?