Conditional probability


Bạn đọc nên xem lại hai bài sau

[1] https://nttuan.org/2024/01/24/naive-definition-of-probability/

[2] https://nttuan.org/2024/06/02/probability-space/

Nhiều phát biểu về cơ hội có dạng: Nếu B xảy ra thì xác suất để A xảy ra là p. Trong bài này ta sẽ quan tâm đến các phát biểu như vậy.

Ví dụ 1. Giả sử một lớp học có n học sinh, trong đó có n_1 bạn giỏi toán và n_2 bạn nữ. Chọn ngẫu nhiên một học sinh trong lớp. Gọi A là biến cố học sinh được chọn giỏi toán, và B là biến cố học sinh được chọn là nữ. Khi đó theo định nghĩa ngây thơ của xác suất, \mathbb{P}(A)=n_1/n\mathbb{P}(B)=n_2/n. Bây giờ ta tập trung vào nhóm các bạn học sinh nữ trong lớp. Xác suất để em được chọn trong nhóm này mà giỏi toán bằng m/n_2, ở đây m là số học sinh nữ trong lớp giỏi toán. Nếu kí hiệu \mathbb{P}(A\mid B) là xác suất này, thì

\displaystyle \mathbb{P}(A\mid B)=\frac{m}{n_2}=\frac{m/n}{n_2/n}=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)}. \Box

Ta có định nghĩa hình thức sau

Định nghĩa 1. Cho một không gian xác suất \displaystyle (\Omega,\mathcal{F},\mathbb{P}) và hai biến cố \displaystyle A, \displaystyle B với \displaystyle \mathbb{P}(B)>0. Xác suất của \displaystyle A biết \displaystyle B đã xảy ra, cũng được gọi là xác suất của \displaystyle A với điều kiện \displaystyle B, kí hiệu \displaystyle \mathbb{P}(A\mid B), được định nghĩa bởi

\displaystyle\mathbb{P}(A\mid B)=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)}.

Chú ý rằng \displaystyle\mathbb{P}(A\mid B) là xác suất của \displaystyle A khi biết \displaystyle B xảy ra, nó không phải là xác suất của biến cố \displaystyle A\mid B, không có biến cố \displaystyle A\mid B. Nếu \displaystyle \mathbb{P}(A)>0 thì \displaystyle \mathbb{P}(A\mid A)=1.

Ví dụ 2. Xét phép thử ngẫu nhiên: Tung lần lượt hai con xúc xắc cân đối. Biết rằng con xúc xắc đầu hiện \displaystyle 3 chấm, xác suất để tổng số chấm lớn hơn \displaystyle 6 là bao nhiêu?

Lời giải. Không gian mẫu của phép thử là \displaystyle \Omega=\{1,2,3,4,5,6\}^2. Như quy ước đối với không gian xác suất rời rạc, \displaystyle \mathcal{F} là họ tất cả các tập con của \displaystyle \Omega. Cuối cùng, \displaystyle \mathbb{P}(A)=\mid A\mid / 36 với mỗi \displaystyle A \subset \Omega.

Bây giờ gọi \displaystyle B là biến cố con đầu ra \displaystyle 3 chấm, và \displaystyle A là biến cố tổng các chấm lớn hơn \displaystyle 6. Khi đó

\displaystyle B=\{(3, b): 1 \leq b \leq 6\}, \quad A=\{(a, b): a+b>6\}, \displaystyle \quad A \cap B=\{(3,4),(3,5),(3,6)\}. Suy ra

\displaystyle \mathbb{P}(A \mid B)=\frac{\mathbb{P}(A \cap B)}{\mathbb{P}(B)}=\frac{|A \cap B|}{|B|}=\frac{3}{6}=\frac{1}{2}. \Box

Ví dụ 3. Rút ngẫu nhiên hai quân bài từ một bộ bài cho trước, mỗi lần rút một quân và không trả lại. Gọi \displaystyle A là sự kiện quân bài thứ nhất mang chất cơ và \displaystyle B là sự kiện quân bài thứ hai có màu đỏ. Tính \displaystyle \mathbb{P}(A\mid B)\displaystyle \mathbb{P}(B\mid A).

Lời giải. Không gian xác suất được xây dựng theo cách tự nhiên. Với không gian xác suất này, \displaystyle \mathbb{P}(A)=1/4, \displaystyle \mathbb{P}(B)=1/2, và \displaystyle\mathbb{P}(A\cap B)=\frac{25}{204}. Từ đây ta thu được

\displaystyle\mathbb{P}(A\mid B)=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)}=\frac{25}{102}\approx 0,25

\displaystyle\mathbb{P}(B\mid A)=\frac{\mathbb{P}(B\cap A)}{\mathbb{P}(A)}=\frac{25}{51}\approx 0,49. \Box

Từ định nghĩa của xác suất có điều kiện ta có

Định lý 1 (Công thức Bayes). Cho một không gian xác suất \displaystyle (\Omega,\mathcal{F},\mathbb{P}) và hai biến cố \displaystyle A, \displaystyle B với \displaystyle \mathbb{P}(A)\mathbb{P}(B)>0. Khi đó

\displaystyle\mathbb{P}(A\mid B)=\frac{\mathbb{P}(B\mid A)\mathbb{P}(A)}{\mathbb{P}(B)}.

Định lý 2 (Công thức xác suất toàn phần). Cho một không gian xác suất \displaystyle (\Omega,\mathcal{F},\mathbb{P}). Giả sử \displaystyle A_1, \displaystyle A_2, \displaystyle \ldots, \displaystyle A_n là một phân hoạch của \displaystyle\Omega sao cho \displaystyle \mathbb{P}(A_i)>0 với mọi \displaystyle i. Khi đó với mỗi biến cố \displaystyle B,

\displaystyle\mathbb{P}(B)=\sum_{i=1}^n\mathbb{P}(B\mid A_i)\mathbb{P}(A_i).

Công thức xác suất toàn phần cho một liên hệ giữa xác suất có điều kiện và xác suất không điều kiện. Để tính một xác suất, ta có thể dùng công thức này để chia bài toán thành các bài toán đơn giản hơn, và nó thường được sử dụng cùng với công thức Bayes.

Ví dụ 4. Có hai chiếc hộp, \displaystyle \alpha\displaystyle \beta, đựng các viên bi xanh và đỏ. Hộp \displaystyle \alpha chứa hai viên bi đỏ và ba viên bi xanh, hộp \displaystyle \beta chứa ba viên bi đỏ và bốn viên bi xanh. Một viên bi được lấy ngẫu nhiên từ hộp \displaystyle \alpha và bỏ vào hộp \displaystyle \beta. Sau đó, lấy ngẫu nhiên một viên bi trong hộp \displaystyle \beta và kiểm tra màu của nó. Xác suất để nó có màu xanh là bao nhiêu?

Lời giải. Không gian xác suất được mô tả theo cách tự nhiên. Gọi \displaystyle A là biến cố viên bi lấy sau mang màu xanh, và \displaystyle B là biến cố viên bi lấy trước mang màu xanh. Tính toán đơn giản ta được \displaystyle \mathbb{P}(B)=3/5>0\displaystyle\mathbb{P}(\overline{B})=2/5>0, do đó theo công thức xác suất toàn phần, ta có

\displaystyle\mathbb{P}(A)=\mathbb{P}(A\mid B)\mathbb{P}(B)+\mathbb{P}(A\mid \overline{B})\mathbb{P}(\overline{B}).

Mà ta lại có \displaystyle \mathbb{P}(A\mid B)=5/8\displaystyle \mathbb{P}(A\mid \overline{B})=1/2, suy ra \displaystyle \mathbb{P}(A)=23/40= 0,575. \Box

Ví dụ 5. Có hai nhà máy sản xuất cốc, nhà máy I và nhà máy II. Biết rằng \displaystyle 20\% số cốc từ nhà máy I và \displaystyle 5\% từ nhà máy II bị lỗi. Mỗi tuần, I sản xuất số lượng cốc gấp đôi II. Xác suất để một chiếc cốc được chọn ngẫu nhiên trong một tuần sản xuất đạt yêu cầu là bao nhiêu? Nếu chiếc cốc được chọn bị lỗi thì khả năng nó được sản xuất bởi I là bao nhiêu?

Lời giải. Gọi \displaystyle A là biến cố mà chiếc cốc được chọn là đạt yêu cầu, và gọi \displaystyle B là biến cố nó được sản xuất tại \displaystyle I. Khi đó

\displaystyle\mathbb{P}(A)=\mathbb{P}(A\mid B)\mathbb{P}(B)+\mathbb{P}(A\mid \overline{B})\mathbb{P}(\overline{B})

=\frac{4}{5}\cdot\frac{2}{3}+\frac{19}{20}\cdot\frac{1}{3}=\frac{51}{60}\approx 0,85.

Nếu chiếc cốc được chọn bị lỗi thì khả năng nó được sản xuất bởi I, theo công thức Bayes, là

\displaystyle \mathbb{P}(B\mid \overline{A})=\frac{\mathbb{P}(\overline{A}\mid B)\mathbb{P}(B)}{\mathbb{P}(\overline{A})}=\frac{\frac{1}{5}\cdot \frac{2}{3}}{1-\frac{51}{60}}=\frac{8}{9}\approx 0,889. \Box

Ví dụ 6. Có một đồng xu công bằng và một đồng xu không công bằng với xác suất hiện mặt sấp khi tung là \displaystyle 3/4. Chọn ngẫu nhiên một trong hai đồng xu và tung nó ba lần. Nó hiện mặt sấp cả ba lần. Tính xác suất để đồng xu được chọn là đồng xu công bằng.

Lời giải. Gọi \displaystyle A là biến cố đồng xu được chọn đều hiện mặt sấp khi tung ba lần, và \displaystyle B là biến cố đồng xu được chọn là đồng xu công bằng. Theo công thức Bayes và công thức xác suất toàn phần, ta có

\displaystyle \mathbb{P}(B \mid A)=\frac{\mathbb{P}(A \mid B) \mathbb{P}(B)}{\mathbb{P}(A)}=\frac{\mathbb{P}(A \mid B) \mathbb{P}(B)}{\mathbb{P}(A \mid B) \mathbb{P}(B)+\mathbb{P}\left(A \mid \overline{B}\right) \mathbb{P}\left(\overline{B}\right)}

=\frac{(1 / 2)^3 \cdot 1 / 2}{(1 / 2)^3 \cdot 1 / 2+(3 / 4)^3 \cdot 1 / 2}\approx 0.23. \Box

Ví dụ 7. Xét một trò chơi trong đó một người chơi phải chọn một trong ba cánh cửa. Một trong ba cánh cửa giấu một giải thưởng có giá trị là một chiếc ô tô mới, trong khi mỗi một trong hai cánh cửa còn lại giấu một chiếc bút chì. Sau khi người chơi lựa chọn, người dẫn chương trình (biết xe ở đâu) sẽ mở một trong hai cánh cửa mà người chơi không chọn và cho biết phía sau cánh cửa đó có một cái bút chì. Vào thời điểm này, người chơi phải lựa chọn giữa hai cánh cửa còn lại. Người chơi nên giữ nguyên lựa chọn hay thay đổi?

Lời giải. Bởi vì còn hai cách cửa, một chứa ô tô và cánh còn lại chứa bút chì, nên nhiều người cho rằng chọn lại hay giữ nguyên thì khả năng là như nhau. Đây là câu trả lời sai.

Gọi \displaystyle A_i là biến cố giải thưởng ô tô nằm sau cánh cửa \displaystyle i. Giả sử người chơi đã chọn cánh cửa \displaystyle 1. Gọi \displaystyle B là sự kiện người dẫn chương trình mở ra cánh cửa số \displaystyle 2 có giải thưởng là cái bút chì. Theo định nghĩa của xác suất có điều kiện và công thức xác suất toàn phần,

\displaystyle \mathbb{P}\left(A_1 \mid B\right)=\frac{\mathbb{P}\left(A_1 \cap B\right)}{\mathbb{P}(B)}=\frac{\mathbb{P}\left(B \mid A_1\right)\mathbb{P}\left(A_1\right)}{\mathbb{P}\left(B \mid A_1\right) \mathbb{P}\left(A_1\right)+\mathbb{P}\left(B \mid A_2\right) \mathbb{P}\left(A_2\right)+\mathbb{P}\left(B \mid A_3\right) \mathbb{P}\left(A_3\right)}.

Bây giờ lập luận đơn giản cho ta \displaystyle\mathbb{P}(A_i)=1/3 với mọi \displaystyle i, \displaystyle \mathbb{P}\left(B \mid A_1\right)=1 / 2, \displaystyle P\left(B \mid A_2\right)=0, và \displaystyle \mathbb{P}\left(B \mid A_3\right)=1. Suy ra \displaystyle \mathbb{P}\left(A_1 \mid B\right)=1/3\approx 0,333. Như vậy người chơi nên thay đổi lựa chọn của mình. \Box

Từ đầu cho đến thời điểm hiện tại ta đã thấy nhiều ví dụ mà \displaystyle \mathbb{P}(A\mid B)\not=\mathbb{P}(B), nghĩa là khi ta bổ sung thông tin \displaystyle B thì khả năng xảy ra \displaystyle A thay đổi. Nếu khi bổ sung \displaystyle B mà khả năng xảy ra \displaystyle A không thay đổi ta nói \displaystyle A\displaystyle B là độc lập.

Định nghĩa 2. Cho một không gian xác suất \displaystyle (\Omega,\mathcal{F},\mathbb{P}). Một họ các biến cố \displaystyle \{A_i\}_{i\in I} được gọi là độc lập nếu với mỗi tập con hữu hạn \displaystyle J của \displaystyle I,

\displaystyle\mathbb{P}\left(\bigcap_{j\in J}A_j\right)=\prod_{j\in J}\mathbb{P}(A_j).  

Từ định nghĩa này ta thấy nếu \displaystyle A\displaystyle B là hai sự kiện độc lập với \displaystyle \mathbb{P}(A)\mathbb{P}(B)>0 thì \displaystyle \mathbb{P}(A\mid B)=\mathbb{P}(A)\displaystyle \mathbb{P}(B\mid A)=\mathbb{P}(B).