본문 바로가기
Math/확률과 통계

확률에서 독립(Independent)

by 컴돈AI 2023. 10. 10.

 

 

목차

    확률에서 독립이란?

    • 확률에서 독립의 의미국어사전에 올라있는 의미와는 다르므로 정확한 정의를 확인하고 가는 것이 중요합니다.
    • "독립"이라는 개념은 확률변수 전체에 대해서도, 그리고 확률변수의 특정 값(또는 사건)에 대해서도 사용될 수 있습니다. 만약 두 확률변수 가 독립이라면, 의 모든 가능한 값의 쌍에 대해서도 독립이어야 합니다. 반대로, 두 확률변수의 특정 값들만 독립인 경우, 그 확률변수 전체가 독립이라고 말할 수 없습니다. 즉, "확률변수의 독립"은 그 확률변수가 가질 수 있는 모든 값들의 쌍에 대한 독립성을 의미하며, "특정 값(또는 사건)의 독립"그 값 또는 사건에 한정된 독립성을 의미합니다.
      • 아래의 내용들은 특정 값의 독립을 기준으로 작성되었습니다.
    • 확률에서 독립의 정의
      • 확률에서 독립은 사건 A와 사건 B 사이에 전혀 상관관계가 없다는 뜻입니다. (즉, 독립이 아닐 경우 사건 A에 사건 B와 연관된 조건이 있다면, 확률값이 변화한다는 것입니다. 반대로 독립이라면 사건 A에 어떠한 사건 B와 연관된 조건이 추가되더라도 확률값은 그대로 유지가 됩니다. 아래 그림을 참고하면 조금 더 이해하기 쉬울 것입니다.)
      • 조건부 확률이 조건에 따라 다르지 않을 경우 독립이라고 합니다.(이는 정의이기 때문에 증명할 필요가 없습니다.) 아래의 경우 A와 B는 독립입니다.
      • P(A|B) = P(A|B아님)
      • A와 B를 바꿔서 작성해도 상관없습니다. A가 B으로부터 독립이라면 B는 A로부터 독립도 자동으로 성립합니다.
    • 독립의 다양한 표현
      • A와 B는 독립
      • P(A|B) = P(A|B아님)  (조건부 확률이 조건에 따라 다르지 않다.)
      • P(A|B) = P(A)  (조건을 달든 달지 않든 확률이 변하지 않는다.)
      • P(A, B) : P(A,B아님) = P(A아님,B) : P(A아님,B아님)  (결합 확률의 비율이 같다.)
      • P(A, B) = P(A)P(B)  (결합 확률이 주변 확률의 곱)
        • P(A|B) = P(A, B)/P(B) 
        • 여기서 독립일경우 P(A|B) = P(A)
        • 따라서, P(A,B) = P(A)P(B)가 됩니다.
      • 그림을 통한 이해
        • 독립인 경우 
        • 독립이 아닌 경우
    • 확률에서 독립으로 착각하기 쉬운 예시 (아래의 경우는 모두 확률에서 말하는 독립이 아닙니다.)
      • "균등분포"와의 혼동
        • P(Y=가 | X=OO) = P(Y=나 | X=OO) = P(Y=다 | X=OO) = ...
      • "동일분포"와의 혼동
        • P(X=가) = P(Y=가), P(X=나) = P(Y=나), P(X=다) = P(Y=다) , ...
      • "배반"과의 혼동
        • 독립은 "X=가 와 Y=가의 어느 한쪽만 일어난다"와 같은 배반의 의미가 아닙니다. 이런 배반성은 오히려 X와 Y가 독립이 아님을 나타냅니다. 실제로 배반의 경우는 만약 X=가 라는 것을 알면 Y는 가가 아니라는 것을 확실히 알게 됨으로 이는 X와 Y가 관련이 있음을 의미합니다.

    세 개 이상의 독립

    • 지금까지 두 확률변수의 특정값 쌍의 독립을 살펴보았습니다. 그렇다면은 A와 B가 독립, B와 C가 독립일 때 A와 C도 독립일까요? 
      • 정답은 아닙니다. 독립은 그냥 두 쌍 사이의 특정한 관계를 의미하는 것이지, 독립성이 다른 쌍과 연결되어 있지는 않습니다. (아래 그림을 보면 어떤 의미인지 감을 어느 정도 잡을 수 있습니다.)
    • 세 개의 독립이 성립하기 위해서는 다음과 같은 조건이 성립해야 합니다.(네 개 이상의 독립이 성립하기 위해서도 아래처럼 모든 조합에 대해서 독립이 성립해야 합니다.)
      • P(A, B, C) = P(A)P(B)P(C)
      • P(A, B) = P(A)P(B)
      • P(B, C) = P(B)P(C)
      • P(A, C) = P(A)P(C)
      • , , (이는 분모가 0이 되는 것을 방지하기 위한 조건입니다.)
    • 세 개 이상의 독립에서도 기존 정의와 마찬가지로 어떠한 조건이 오더라도 기존의 확률 값을 유지해야 합니다. 독립의 정의처럼 어떠한 다른 사건이 기존의 확률값에 영향을 미치지 않아야 합니다. 세 개 이상의 독립에서는 두 개 이상의 사건이 동시에 일어나더라도 기존의 확률값에는 영향을 미치지 않아야지 세 개 이상의 독립이 성립하게 되는 것입니다.
      • P(A|B, C) = P(A)
      • P(B|A, C) = P(B)
      • P(C|A, B) = P(C)
      • P(A|B) = P(A)
      • P(A|C) = P(A)
      • ...