주뇽's 저장소

3. 확률 본문

응용통계학

3. 확률

뎁쭌 2021. 10. 23. 22:16
728x90
반응형

3-1 표본공간과 사건

  • 표본공간(Sample space) : 실험(ex 동전, 주사위 던지기) 또는 관찰(ex 특정브랜드에 대한 선호 또는 거절)을 실시하여 나타날 수 있는 모든 결과의 집합 기호 S 를 사용
  • 원소 : 표본공간을 구성하고 있는 요소
  • 사건(event) : 표본공간을 구성하고 있는 원소 중에서 관심의 대상이 되는 원소들이며 사건은 표본공간부분집합
  • 여집합(complement) : S를 구성하고 있는 원소 중에서 사건 A에 포함되는 원소제외나머지 원소들의 집합
  • 교집합(intersection)  A∩B : A와 B동시에 발생할 수 있는 경우 (A and B) 
  • 합집합(union) A∪B : A 또는 B발생할 수 있는 경우 (A or B)
  • 서로 배반(mutually exclusive) A∩B=∅  : 두 집합 A와 B의 공통되는 원소없는 경우

ex) 주사위를 던지는 실험에서 표본공간 S = {1,2,3,4,5,6}이고 이 표본공간은 S는 1부터 6까지 6개의 원소로 구성

이 때 짝수가 나오는 결과에만 관심이 있다면 사건 A = {2,4,6} ,  A의 여집합 = {1,3,5}이다. 이 때 3의 배수에만 관심이 있는 사건 B = {3, 6} 가 있다고 했을 때  A와B의 교집합은 A and B = {6} , A와B의 합집합은 A or B = {2,3,4,6}이 된다.

 

# 사건 A ={짝수} , 사건 B ={홀수}일 때 두 사건의 공통되는 원소가 없으므로 서로 배반이다 .

 

3-2 확률의 정의

  • 고전적 확률의 개념(Classical definition of probability) : 프랑스의 수학자 피에르시몽 드 라플라스가 확률에 대한 개념의 필요성을 처음 주장
    1. 동전 던지기, 주사위 굴리기 등 표본공간이 유한할 때, 공간 내의 모든 사건이 동일하게 일어 날 수 있다 가정
    2. 어떤 사건의 발생 확률 = 그 사건이 일어날 수 있는 경우의 수 / 가능한 모든 경우의 
    3. 논리적으로 옳아 보이지만 동전을 100번 던지면 각 면이 반드시 절반씩 나온다는 법이 없음
    4. John Venn, George Boole을 포함한 19세기의 수학자들은 의심을 풀었음

ex ) 동전에는 앞면과 뒷면의 각 면이 나올 가능성이 동일 하기 때문에 확률은 1/2이 되지만 100번을 던졌을 경우 50번은 앞면이 나온지 않는다.

 

상대도수 확률

 

  • 빈도적 확률(frequentist probability) : 동전을 실제로 던져 보고 앞면이 나오는 횟수의 비율(상대도수)로 확률을 정해야 한다는 견해
    1. 동전을 던질 때마다 앞면이 나오는 횟수가 다르게 나오므로 한 개의 값으로 확률을 정할 수 없다는 문제점 존재
    2. 동전 던지는 일을 굉장히 많이 하면 상대도수 확률고전적 확률과 점차 가까워진다는 사실을 알게 됨

- 18세기 프랑스의 C.buffon은 4,040번의 동전을 던져 2,048번의 앞면을 얻어 그 상대도수 값이 0.5069가 됨을 얻음

- 1900년경 영국의 통계학자 K.Pearson은 24,000번의 동전을 던져 12,102번의 앞면을 얻어 0.5050의 상대도수을 얻음

- 2차 세계대전 중 독일군에 의해 포로가 된 남아프리카 통계학자 J.Kerrich는 수용소에서 생황을 하면서 10,000번의 동전을 던져 5,067번의 앞면 즉 0.5067의 상대도수 값을 얻음

 

대수의 법칙

  • Law of large number : 큰 수의 법칙
  • 동일한 분포에서 무작위로 뽑은 표본이 많을수록 그 표본의 평균값이론적인 값에 가깝게 된다.
  • 확률 = 상대도수의 극한 (n →∞)
  • 스위스 수학자 베르누이에 의해 1713년에 증명
    1. 성공 또는 실패만이 있는 시행을 생각
    2. 성공의 확률을 p라고 함
    3. 아주 많은 수의 반복 시행을 하면 성공이 나올 가능성이 p에 수렴

 

 

주사위를 여러 번 던졌을 때 평균치의 추이

확률의 정의

  • 표본공간의 부분집한인 어떤 사건이 발생할 수 있는 가능성을 수치로 나타낸 것
  • 표본공간의 모든 원소에 대한 확률의 합이 1이 되도록 배분
  • 확률은 언제나 0이상 1이하의 값을 가짐
  • 사건 A의 확률 P(A), P(S) =1 , 0 ≤ P(A) ≤ 1 , P(∅) = 0

합집합 사건의 확률 : A 사건 또는 B사건이 일어날 확률

  • 표본공간 S의 부분집합 사건 A, B에 대해 𝐴 ∪ B의 확률은

    –𝑃 (𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) 
    A 또는 B가 일어날 확률 = (A확률) + (B확률) - (A와B가 동시에 일어날 확률)
  • A,B가 서로 배반인 경우 𝑃 𝐴 ∩ 𝐵 = 𝑃 ∅ = 0,  𝑃(𝐴 ∪ 𝐵)= 𝑃 (𝐴) + 𝑃 (𝐵)
    서로 동시에 일어날 확률이 없으므로 각각의 확률 값만 더해준다.

(왼) 사건 A와 B의 합집합  (오) 사건 A와 B의 교집합

3-3 조건부 확률

결합확률

  • 가지 사건 동시에 일어날 확률 ( A and B) 
    ex) A사건 =3의 배수 , B사건 =짝수  주사위를 던졌을 때 두가지 사건이 동시에 일어날 확률

주변확률

  • 여러 사건이 동시에 일어날 수 있을 때, 하나의 사건이 일어날 확률 분포
  • 전체 확률 변수의 결합 분포를 기록한 표에서 각 행이나 열 단위로 원소들을 더한 값을 표의 주변에 써놓은 데에서 유래 하였다.
    ex) 짝수가 뽑힐 확률 = 3/6 ,  3의 배수가 뽑힐 확률 = 2/6 , 홀수가 뽑힐 확률 = 3/6

조건부 확률

  • 어떤 사건 A와 B가 있을 때 이미 어떤 사건(조건)이 일어났고 나머지 사건이 일어날 확률
    • 주어진 사건를 조건 혹은 사전 정보라고

ex) 주사위가 짝수 일 때(조건) 3의 배수가 나올 확률

 

조건부 확률

 

# P(A|B) B조건이 주어질 때 A사건이 일어날 확률   (조건부 확률)
   P(B) = B가 일어날 확률

   P(A ∩ B) = A사건과 B가 동시에 일어날 확률 (결합확률)

 

위 공식처럼 조건부 확률 = 특정사건A조건B동시에 일어날 확률B(조건)가 일어날 확률로 나눈 값이다

 

그렇다면 이제 배운것들을 종합해서  주사위가 짝수일 때 3의 배수가 나올 확률을 구해보면

일단 필요한 정보들을 정리해보면 다음과 같다.

 

# 조건부 확률 = P(B|A) : 주사위가 짝수일 때 3의 배수가 나올 확률 

  • S = 주사위 → {1, 2, 3, 4 ,5 , 6}
  • A = 주사위가 짝수 → {2, 4, 6}   
  • B = 주사위가 3의 배수 →{3, 6}
  • A ∩ B = 짝수이면서 3의 배수  →{6}
  • P(A) = 짝수가 나올 확률 →  1/2    (6개 중 3개) 
  • P(B) = 3의 배수가 나올 확률 →  1/3  (6개 중 2개)
  • P(A ∩ B) = 주사위가 짝수이고 3의 배수일 확률 → 1/6  (6개 중 1개)

이제 이 정보들을 공식에 그대로 대입시켜주자 

P(B|A) = 결합확률 / 조건확률 
(1/6) / (1/2) = 1/3 이 된다.

 

# P(B|A)일 때 B가 아닌 A가 조건이다 !! A가 주어질 때 B가 일어날 확률!! 혼동하지 않도록 조심하자

또한 이 공식을 이용하여 양 변의 조건확률을 곱해주면 결합확률을 구할 수 있다. 이 것을 승법공식이라 한다.

P(A and B) =  P(B|A) x P(A) 

 

 

사건의 독립

  • 어떤 사건 A,B에 대해 두 사건이 독립(independent)이면 
    –𝑃 (𝐵|𝐴)  = 𝑃(𝐵), 𝑃 (𝐴|𝐵) = 𝑃(𝐴)
  • 조건으로 주어진 사건 A/B가 다른 사건 B/A에 아무런 영향을 주지 못함(독립)
  • 두 사건이 서로 독립이면 조건부 확률의 정의에 따라

따라서 승법공식을 이용하여 결합확률을 구하면 
–𝑃 (𝐴 ∩ 𝐵) = 𝑃(𝐴) x 𝑃(𝐵)  결합확률 = 두 사건의 곱과 같다

 

# 사건이 독립일 때 두 사건의 결합확률은 두 사건의 곱과 동일하다.

 

 

'응용통계학' 카테고리의 다른 글

4. 확률변수와 확률분포  (0) 2021.10.24
2. 데이터의 정리와 요약  (0) 2021.10.23
제 1장 공학과 통계학  (0) 2021.10.17