Monday, April 6, 2020

CORONAVIRUS : PHÉP THỬ NHÓM (Phan Dương Hiệu)






Liệu Việt Nam có thể áp dụng phép thử nhóm trên diện rộng với số lượng test hạn chế?

Hầu hết các nước đều khá đau đầu với việc số lượng test thử quá ít, có Hàn Quốc và Đức là có vẻ thử được khá nhiều giai đoạn đầu bùng dịch, và do đó tăng hiệu quả việc hạn chế lây lan và chữa bệnh. Một câu hỏi là với số lượng test hạn chế, nhưng số người bị còn ít, liệu chúng ta có thể thử trên diện rộng, có thể khoanh những vùng chưa bị dịch để đưa các hoạt động sớm trở lại? Phương pháp thử nhóm (Group Testing) có thể có ích trong việc này.

Phương pháp này không có gì mới, đã được dùng từ hồi thế chiến thứ 2 để xem ai nhiễm bệnh giang mai - một căn bệnh dễ lây và chưa có thuốc chữa khi đó. Số người bị khá ít và có nguy cơ lây nhiễm rộng, việc thử từng người là bất khả thi vì số test cần là quá lớn, trong khi việc mấy mẫu (lấy dịch) để thử thì đơn giản. Mấu chốt của phương pháp thử nhóm là gộp các mẫu vào với nhau để thử: tức là chẳng hạn lấy mẫu của k người rồi trộn với nhau, làm test 1 lần trên mẫu gộp, nếu negatif thì tất cả đều négatif, còn nếu positif thì có nghĩa là có ít nhất 1 trong k người là positif. Khi đó có thể thiết kế khá đơn giản việc trộn mẫu sao cho, nếu có d người trong tổng số N người bị positif thì số test cần thử là cỡ O(d^2log(N)) và việc từ đó tìm được d người bệnh là nhanh. Phương pháp này do đó hiệu quả khi số người bị bệnh d là nhỏ.

Nếu việc gộp các mẫu thử là dễ dàng với số lượng lớn, về lý thuyết, chúng ta có thể thấy vài ví du về sự hiệu quả:

- 7000 người ở bệnh viện Bạch Mai, có thể lấy dịch rồi tổng hợp lại. Chỉ test trên mẫu tổng hợp, nếu negatif sẽ có thể xác định toàn bộ 7000 người này đều negatif.

- Một công ty 1000 người muốn trở lại làm việc, nhưng không thể thử tất cả khi mỗi ngày cả nước chỉ có vài nghìn test thử. Họ có thể gộp lại thành một mẫu để thử, nếu negatif thì cả công ty có thể quay lại làm việc.

- Tương tự nếu ước đoán một làng, xã 50 000 người không có ai đang nhiễm, có thể tổng hợp làm 1 mẫu thử, ra negatif có thể kết luận cả làng chưa ai bị, có thể hoạt động cộng đồng chung, chỉ cần không giao tiếp với bên ngoài. Dần dần sẽ có nhiều làng, tỉnh được hoạt động trở lại.

- Nếu cả nước 100 triệu người, giả thiết có dưới 1000 người bị thì cần tầm vài chục nghìn test thay vì 100 triệu test là tìm ra tất cả người bị (tất nhiên vẫn phải lấy dịch tất cả mọi người).

- Khi chúng ta nghĩ là đã hết bùng dịch, có thể lấy ngẫu ngẫu nhiên 100 000 người rồi trộn với nhau để thử xem có ra negatif hay không. Sau nhiều lần thử có thể khá yên tâm là dịch đã được dập cơ bản. Mọi người nối vòng tay lớn hát (mà thôi, nhỡ test thiếu, sót).
Điểm thuận lợi là loại test PCR có thể áp dụng cho phép gộp mẫu. Tôi không rõ có thể gộp đến cao nhất là bao nhiêu mẫu với nhau, điều này cần hỏi chuyên gia y khoa. Nếu không trộn được quá nhiều thì làm trên từng nhóm 100-1000 người cũng có thể nâng hiệu quả lên đáng kể.

Phương pháp này rất hiệu quả khi số người bị là ít, như vậy Việt Nam khá là phù hợp. Ngay cả ở Pháp bị rất nhiều thì nhóm nghiên cứu ở trường Ecole Polytechnique và Toulouse cũng đang nghiên cứu áp dụng vào thực tế:
https://www.polytechnique.edu/…/covid-19-group-testing-key-…

Tất nhiên từ lý thuyết đến thực hành là một khoảng cách không nhỏ. Giải quyết các vấn đề kỹ thuật của việc trộn mẫu v.v cần chuyên môn y khoa. Nhưng đây có thể là một vấn đề đáng nghiên cứu để giúp việc chống dịch thêm hiệu quả. Ngay cả khi chỉ trộn được một số lượng nhỏ mẫu thì phương pháp này cũng có thể tiết kiệm được khá nhiều số test.

(Chuyện bên lề:

- anh Ngô Quang Hưng là một chuyên gia trong lĩnh vực thử nhóm, có cùng đồng nghiệp thiết kế một thuật toán giải mã nhanh tìm d người positif (xem chẳng hạn https://cse.buffalo.edu/~hungngo/papers/soda10.pdf).

- ở nhiều nước việc bảo vệ privacy cho người bị bệnh là rất quan trọng, việc thử nhóm đảm bảo privacy là có thể làm được trên cơ sở dữ liệu mã hoá, chúng tớ có đề xuất một lời giải cho bài toán này trong phần 5.2 cuối trang 11 của bài báo ở đây, dành cho bạn nào quan tâm : https://eprint.iacr.org/2018/1019.pdf )

*
2 April 2020







No comments: