05/04/2020
Cảm ơn page https://www.fb.com/maythosinhvien/ vì cuộc trao đổi thú vị 👍
***
Như nhiều người đã biết: bộ kit xét nghiệm COVID19 có độ chính xác không phải 100%, có nghĩa là nếu bạn may mắn xét nghiệm ra kết quả âm tính thì cũng đừng nên chủ quan vội, nhưng đặc biệt là nếu bạn bị kết luận "dương tính" thì khoan hãy hoảng hốt : vẫn có một xác suất không tồi là bạn chưa nhiễm 🦠 đâu (Disclaimer : tuy nhiên vẫn cần ngoan ngoãn làm theo các hướng dẫn y tế trước đã nhé!)
Một tính toán đơn giản [𝟭] cho thấy: nếu bạn sống trong một cộng đồng có 1% dân số bị nhiễm mà dùng bộ kit chính xác đến 99% thì nếu có ra kết quả "dương tính", bạn chỉ có xác suất 50% là bạn đã nhiễm 🦠 thật. Vâng, bạn không nghe nhầm đâu, xác suất 50:50 là bạn BỊ NHIỄM hoặc là KHÔNG, có nghĩa là trong trường hợp này thì kết quả test dương tính vẫn CHƯA GIÚP KẾT LUẬN ĐIỀU GÌ CẢ 💁♀️.
***
Vậy vấn đề nằm ở đâu? Nằm ở chỗ khi mẫu thử có quá nhiều người khỏe so với người nhiễm, con số khổng lồ này nhân lên với khả năng sai (dù là nhỏ) của máy thử cũng đủ tạo ra một lượng ca "dương tính giả" (false positive) nhiều ngang với lượng ca dương tính thật. Điều này thật khủng khiếp vì các bạn hãy tưởng tượng, với mỗi ca "được phát hiện dương tính" nhưng giả thì chúng ta phải làm gì với họ : nhốt họ lại, chăm sóc và theo dõi y tế, track lịch trình di chuyển và tiếp xúc, kế đến cách ly người thân họ rồi tiếp tục làm test tối thiểu 2 lần (thường là 3 lần) và lặp lại các bước y hệt với F1, F2, F3, F4... Tất cả chi phí cho những việc này là khổng lồ. Mới gần đây chúng ta đã cách ly phong tỏa cả một bệnh viện Bạch Mai, vài vạn đồng bào từ nước ngoài trở về, và thu được một số ít ca " được xét nghiệm dương tính", thả ra hàng ngàn vạn ca "được xét nghiệm âm tính". Hãy thử tưởng tượng bệnh nhân số 237 với lịch trình đi lại vô cùng phức tạp vừa được phát hiện, tưởng tượng số người sẽ bị cách ly vì anh này, và tưởng tượng tất cả công sức đó đổ ra cuối cùng chỉ để kết luận lại là không một ai trong số họ bị nhiễm COVID-19 cả vì kết quả dương tính của anh này là giả 😀
Nhưng đó chưa phải kịch bản thốn nhất : thốn nhất sẽ là khi trong số hàng ngàn người được cách ly theo dõi kể trên bỗng lòi ra một ca dương tính giả khác và câu chuyện sẽ buộc phải tiếp diễn, cho tới khi không còn sản xuất đủ bộ kit xét nghiệm cho số ca nghi nhiễm nữa...
***
Vậy phải làm thế nào mới hiệu quả? Tính toán tiếp [𝟮] cho thấy, “tỷ lệnh nhiễm” càng cao thì kết luận càng đúng. Nói nôm na là cần tăng “tỷ lệ nhiễm” bằng cách thu nhỏ nhóm người được test sao cho chỉ gồm những ca khả nghi nhất, loại bớt đi những ca ngoan ngoãn nằm nhà từ cả tháng nay. Hiển nhiên là chúng ta sẽ chẳng dại gì phát bộ kit cho tất cả 90 triệu dân Việt Nam 🇻🇳 (một nước mà “tỷ lệ nhiễm” thấp vào cỡ kỷ lục thế giới) cả, mà thay vào đó nhà nước sẽ chỉ test những người có khả năng nhiễm cao nhất. Họ là các đối tượng F0, F1, F2, F3,... và những người đến từ vùng có dịch (du học sinh, kiều bào,...). Và sau cùng phải test mỗi người đó 03 lần, vì cái gì quan trọng thì phải nhắc lại ba lần. 😁
❓ Nhưng đây đã là cách hiệu quả nhất (về mặt sử dụng bộ test) chưa ? Hãy xem phần chứng minh dưới đây, và làm thử một bài tập nhỏ để hiểu sâu thêm vấn đề này nhé.
***
*𝐐𝐔𝐈𝐙 : Tính xác suất để một BỆNH NHÂN lọt qua CẢ 03 LẦN XÉT NGHIỆM với kết quả ÂM TÍNH, biết người đó sống trong khu cách ly có tỷ lệ nhiễm là 0,02% (2 ca nhiễm trên 1 vạn người) và dùng máy thử chính xác đến 80%.
---
*𝐏𝐑𝐎𝐎𝐅 :
[𝟭] Nhắc lại định lý Bayes : P(A|B)*P(B) = P(A,B)
" bằng tích của nhân với ".
Ta gọi xác suất nhiễm là P(nhiễm) = n, xác suất không nhiễm là P(khỏe) = 1-n
Gọi độ chính xác của phét thử là P(đúng) = m,
lưu ý : P(đúng) := P(dương|nhiễm) = P(âm|khỏe), P(sai) = 1-m
Ta có theo định lý Bayes:
P(nhiễm|dương)*P(dương) = P(nhiễm,dương) = P(dương|nhiễm)*P(nhiễm) = mn
Mà dương thì bao gồm dương đúng (nhiễm mà test ra đúng) và dương sai (khỏe mà test ra sai) nên:
P(dương) = P(đúng)*P(nhiễm) + P(sai)*P(khỏe) = mn + (1-m)(1-n) = 1-m-n+2mn
Thay vào dòng đầu tiên ta có
P(nhiễm|dương) = P(nhiễm,dương)/P(dương) = mn/(1-m-n+2mn)
, thay số n = 0,01 và m = 0,99 ta có P(nhiễm|dương) = 0.5
[𝟮] Tìm để max của P(nhiễm|dương) theo n, ta tính đạo hàm
d(P(nhiễm|dương))/dn = d/dn (mn/(1-m-n+2mn) ) = [m*(1-m-n+2mn) - mn*(-1+2m)]/(1-m-n+2mn)^2
= m(1-m)/(...)^2 > 0 dưới mọi hình thức.
Vậy P(nhiễm|dương) là hàm luôn tăng của n, tức n càng cao thì kết luận "dương là nhiễm" càng chính xác (càng tiệm cận về 1).
---
*𝘾𝙤𝙢𝙢𝙚𝙣𝙩: Có lẽ vì hiểu được điều này (hoặc cũng có thể do trùng hợp) mà cách đây vài ngày, khi được phóng viên hỏi: "𝑂̂𝑛𝑔 𝑐𝑜́ 𝑐ℎ𝑜 𝑡𝑒𝑠𝑡 𝑡𝑜𝑎̀𝑛 𝑑𝑎̂𝑛 𝑘ℎ𝑜̂𝑛𝑔 ℎ𝑎𝑦 𝑐ℎ𝑖̉ 𝑐ℎ𝑜 𝑡𝑒𝑠𝑡 𝑁𝑒𝑤 𝑌𝑜𝑟𝑘 𝑣𝑎̀ 𝑣𝑎̀𝑖 𝑜̂̉ 𝑑𝑖̣𝑐ℎ 𝑡ℎ𝑜̂𝑖? 𝐿𝑜̛̃ 𝑐𝑜́ 𝑛𝑔𝑢̛𝑜̛̀𝑖 𝑏𝑎𝑛𝑔 𝑛𝑎̀𝑦 𝑐ℎ𝑎̣𝑦 𝑠𝑎𝑛𝑔 𝑏𝑎𝑛𝑔 𝑘ℎ𝑎́𝑐 𝑡ℎ𝑖̀ 𝑠𝑎𝑜?", tổng thống 🇺🇸 Donald Trump đã trả lời dõng dạc : "𝘐 𝘸𝘪𝘭𝘭 𝘯𝘰𝘵 𝘵𝘦𝘴𝘵 300 𝘮𝘪𝘭𝘭𝘪𝘰𝘯𝘴 𝘱𝘦𝘰𝘱𝘭𝘦, 𝘵𝘩𝘢𝘵 𝘪𝘴 𝘳𝘪𝘥𝘪𝘤𝘶𝘭𝘰𝘶𝘴!".
Trong một động thái tương tự, ở 🇫🇷 là một nước có lẽ không quá thiếu thốn bộ test, nhưng chính phủ cũng thà để cho bệnh nhân nhiễm COVID-19 tự cách ly tại nhà, đợi các biểu hiện ho, khó thở trở nên rõ mồn một, thậm chí nặng rồi mới cho cứu thương (15) đến lấy mẫu xét nghiệm và làm thủ tục nhập viện : chỉ có test trên người CHẮC CHẮN đã nhiễm thì kết luận dương tính của bộ kit mới tin được GẦN 100% !
09/04/2017
07/05/2016
29/11/2015
29/11/2015
29/11/2015
12/07/2015
23/02/2015