Một chút lịch sử ‘randomization’

Mục lục
gs-nguyen-van-tuan-randomization
GS Nguyễn Văn Tuấn

Hôm nọ đọc trên Nature thấy tin tức về 3 khôi nguyên Nobel kinh tế (Abhijit Banerjee, Esther Duflo và Michael Kremer) và phương pháp “randomistas” [mà họ được trao giải] làm tôi tò mò tìm hiểu. Hoá ra, họ áp dụng khái niệm ‘randomization’ (ngẫu nhiên hoá) trong khoa học thống kê. Nhưng người có công lớn nhứt về khái niệm này phải nói là Ronald Fisher và Bradford Hill. Nhân dịp này, xin kể các bạn nghe về lịch sử của ngẫu nhiên hoá …

Ba nhà kinh tế được giải Nobel năm nay: Abhijit Banerjee, Esther Duflo và Michael Kremer. Họ được ghi nhận là những người đi tiên phong trong trào lưu “randomistas”.

Theo Nature, Kremer, Banerjee và Duflo ứng dụng các phương pháp trong thử nghiệm lâm sàng y khoa vào các nghiên cứu can thiệp qui mô xã hội nhằm giảm nghèo và cải thiện trình độ học vấn (1). Chẳng hạn như họ thực hiện một nghiên cứu trên 10,000 hộ ở 6 nước có thu nhập thấp hay trung bình, và kết luận rằng cung cấp cho những người nghèo một ‘gói hỗ trợ’ (bao gồm tiền mặt, thực phẩm, dịch vụ y tế, huấn luyện nghề và tư vấn) trong 2 năm có hiệu quả cải thiện cuộc sống sau đó.

Ngẫu nhiên hoá trong y khoa: mô hình RCT

Phương pháp thử nghiệm mà họ gọi là ‘randomistas’ đó thật ra bên y khoa gọi là ‘randomized controlled trial’ (hay RCT). Theo phương pháp RCT, để đánh giá hiệu quả và an toàn của một thuốc điều trị [chẳng hạn như] ung thư, bệnh nhân được chia thành 2 nhóm một cách hoàn toàn ngẫu nhiên: một nhóm được cho dùng thuốc và một nhóm chỉ chi uống nước đường (chỉ là ví dụ). Sau đó, theo dõi một thời gian [có thể là 3 năm], ghi nhận số ca tử vong của mỗi nhóm, và dùng phương pháp thống kê so sánh xác suất tử vong giữa 2 nhóm. Bởi vì bệnh nhân được phân nhóm ngẫu nhiên, nên tất cả các yếu tố ảnh hưởng đến tử vong đều tương đương nhau giữa 2 nhóm, và sự khác biệt về nguy cơ tử vong [nếu có] chỉ có thể là do thuốc điều trị. Phương pháp RCT được xem là chuẩn vàng để giúp nhà nghiên cứu suy luận nhân quả.

Mô hình RCT như cách tôi mô tả rất đơn giản, nhưng trong thực tế thì rất khó thực hiện và đắt tiền. Trong nghiên cứu y khoa ngày nay, một công trình RCT phải tuyển chừng 10,000 bệnh nhân từ hàng chục nước trên thế giới. Mỗi bệnh nhân phải được theo dõi và cho thuốc thử nghiệm, rất đắt tiền. Tính trung bình, chuyên ngành loãng xương, để làm một RCT trong 3 năm, nhà nghiên cứu phải mất chừng 15,000 USD cho mỗi bệnh nhân! Nếu nghiên cứu trên 10,000 bệnh nhân thì chi phí sẽ là 150 triệu USD! Không có nhà nước nào tài trợ cho nghiên cứu như thế, chỉ có … công ti dược mà thôi. Do đó, ý tưởng thì đơn giản, nhưng thực hiện thì vô cùng khó khăn.

Đọc thêm:  Có thể sai lầm nếu xét công nhận giáo sư dựa vào Scopus, Pubmed

Ronald Fisher và khái niệm ngẫu nhiên hoá

Người đề xướng khái niệm ngẫu nhiên hoá là nhà thống kê học thiên tài Ronald A. Fisher, và một nhà thống kê tài ba và trẻ hơn Fisher tên là A. Bradford Hill. Vào năm 1919, sau một thời gian 7 năm lang thang, Fisher được nhận vào làm việc cho trung tâm thí nghiệm Rothamsted, và trong vòng 15 năm sau đó, ông làm nên một cuộc cách mạng trong thống kê học và cho ra đời bộ môn khoa học thống kê (statistical science) như chúng ta biết ngày nay. Năm 1925, ông viết cuốn sách “Statistical Methods for Research Workers” và khái niệm “thiết kế thí nghiệm” ra đời. Khái niệm đó sau này được hoàn chỉnh trong cuốn “The Design of Experiments” vào năm 1935.

Ronald Fisher, một thiên tài thống kê học, được xem là ‘cha đẻ’ của khoa học thống kê hiện đại. Những công trình nghiên cứu của ông có số trích dẫn cao nhứt trong lịch sử khoa học.

Lúc đó, Rothamsted chủ yếu làm thí nghiệm liên quan đến nông nghiệp. Fisher đề nghị phân chia các giống cây vào các mẩu đất bằng phương pháp ngẫu nhiên hoá, và dùng phương pháp ông gọi là “test of significance” (Kiểm định Thống kê) để so sánh năng suất của các giống cây. Ông lí giải rằng chỉ có ngẫu nhiên hoá thì dữ liệu mới thích hợp cho phương pháp kiểm định thống kê và trị số P mới có ý nghĩa. Phương pháp ngẫu nhiên hoá và kiểm định thống kê sau này được áp dụng trong nghiên cứu y khoa.

Bradford Hill và RCT

Người đầu tiên áp dụng phương pháp ngẫu nhiên hoá trong y khoa là Bradford Hill, trẻ hơn Fisher 7 tuổi. Nhưng Hill không bao giờ trích dẫn khái niệm ngẫu nhiên hoá của Fisher, dù hai người chẳng có thù oán gì với nhau (Fisher có rất nhiều “kẻ thù”). Bradford Hill lúc đó là một phi công trong quân đội Anh, và ông chẳng may mắc bệnh lao phổi. Ông do đó không theo đuổi sự nghiệp y khoa như thân phụ, nhưng chọn học về kinh tế. Tuy học về kinh tế, nhưng ông rất đam mê ngành y tế và nghiên cứu y khoa. Sau khi tốt nghiệp (1930s) ông được nhận vào làm việc cho một trung tâm nghiên cứu y học ở Anh.

Đọc thêm:  Tại sao công bố trên tập san dỏm?

Vào thập niên 1930s, ông đề ra ý tưởng chia bệnh nhân thành 2 nhóm một cách ngẫu nhiên (như chúng ta làm ngày nay) để đánh giá hiệu quả của can thiệp. Nhưng ý tưởng đó bị giới y khoa cười mỉa mai vì họ cho rằng chỉ có người điên rồ mới làm như Hill đề xương, do bác sĩ điều trị bệnh nhân theo các yếu tố liên quan đến cá nhân. Năm 1946, Hill và đồng nghiệp y khoa thuyết phục giới chức có thẩm quyền để thực hiện công trình RCT về điều trị lao phổi bằng streptomycin (2). Đó là công trình RCT đầu tiên trong lịch sử y khoa.

Bradford Hill (1897-1991), người đầu tiên đề xướng phương pháp ngẫu nhiên hoá trong nghiên cứu y khoa, dẫn đến mô hình mà chúng ta dùng ngày nay.

Sau này, phương pháp RCT trở nên chuẩn vàng để đánh giá chứng cứ y học lâm sàng. Hầu như bất cứ loại thuốc nào trước khi đưa ra dùng cho bệnh nhân đều phải qua nghiên cứu RCT. Có thể nói rằng phương pháp RCT đã không chỉ là một cách mạng khoa học, mà còn giúp cứu sống biết bao nhiêu triệu người trên thế giới. Do đó, khoảng 20 năm trước, có người đề cử ông nhận giải Nobel Y sinh học, nhưng ông đã qua đời năm 1991, và Hội đồng giải Nobel không có qui định trao giải thưởng cho người đã chết. (Chuyện này tôi chỉ nghe trong hội nghị, chứ chưa thấy bài báo nào trong y văn nói đến). Thế là ông “lỡ chuyến đò”. Bradford Hill là người có nhiều đóng góp quan trọng cho y khoa, như tiêu chuẩn để suy luận nhân quả và nghiên cứu bệnh chứng (3).

Phương pháp hay mô hình RCT ngày nay không chỉ ứng dụng trong y khoa, mà còn cho rất nhiều lĩnh vực khác ngoài y khoa. Làm sao để biết sách giáo khoa mới là tốt hơn bộ sách cũ, làm thế nào để biết đánh giá mối liên quan giữa học đại học và trầm cảm, làm sao để biết gen A là nguyên nhân của bệnh X trong điều kiện thiếu thông tin sinh học, v.v. tất cả đều có thể trả lời bằng mô hình RCT. Bây giờ thì chúng ta cũng được biết rằng mô hình RCT đã đem đến 3 nhà kinh tế học giải Nobel. Có lẽ 3 nhà kinh tế này nhớ đến Ronald Fisher và nhất là nhà kinh tế Bradford Hill, hai người đã ‘champion’ phương pháp ngẫu nhiên hoá trong suy luận nhân quả chừng 100 năm trước.

Đọc thêm:  Những lỗi phổ biến trong trình bày bằng Powerpoint

Khái niệm và phương pháp thống kê đã giúp cho các nhà kinh tế được giải Nobel, nhưng những người đề ra hay đi đầu trong các phương pháp đó có khi không được giải. Trước đây, Daniel McFadden và James Heckman được trao giải Nobel năm 2000, nhờ các công trình về “selection bias”, một khái niệm được sử dụng trong nghiên cứu y khoa rất lâu trước đó (điển hình là mô hình “case control”). Hai người đi tiên phong về case-control model là Richard Doll và Bradford Hill, và công trình của họ giúp cứu hàng triệu người, nhưng họ không được giải Nobel dù nghe nói đã từng được đề cử nhiều lần. Tương tự, phương pháp “Cox’s regression” (Gs David R Cox đề xướng) cũng có ảnh hưởng vô cùng to lớn trong khoa học, nhưng ông cũng không được giải Nobel. Ở đời đúng là có khi thiếu công bằng.

===

(1) https://www.nature.com/articles/d41586-019-03125-y

(2) Medical Research Council Streptomycin in Tuberculosis Trials Committee. Streptomycin treatment for pulmonary tuberculosis. BMJ 1948;ii:769-82.

(3) Bradford Hill và Richard Doll là hai người đầu tiên trên thế giới chỉ ra mối liên quan giữa hút thuốc lá và ung thư phổi bằng một thí nghiệm mà ngày nay chúng ta gọi là “nghiên cứu bệnh chứng”.

Nguồn: Một chút lịch sử ‘randomization’ | Nguyễn Văn Tuấn (nguyenvantuan.info)

VNEconomics tổng hợp các bài viết của GS Nguyễn Văn Tuấn

# randomization

VNEconomics – Chúng tôi mong muốn đem tri thức khoa họccông nghệkinh tế đến với nhiều người Việt Nam. Đặc biệt là kiến thức về Blockchain & tiền mã hóa

VNEconomics là một dự án với mục đích chia sẻ những tri thức hữu ích về Kinh tế số – Nghiên cứu khoa học và Công nghệ, đặc biệt là những kiến thức về công nghệ Blockchain & ứng dụng của Blockchain tới đối tượng là nhà nghiên cứu và những cá nhân khác quan tâm tới những lĩnh vực này.

👉Tham gia cộng đồng của VNEconomics tại:
📍Website: https://vneconomics.com/
📍Twitter: https://twitter.com/vneconomics_com
📍Telegram: https://t.me/VNEconomic
📍Linked In: https://www.linkedin.com/company/vneconomics/
📍 Fanpage Facebook: https://www.facebook.com/vneconomics/
📍 Facebook Group: https://www.facebook.com/groups/blockchaindeco/

Miễn trừ trách nhiệm

Tất cả nội dung trên website này đều vì mục đích cung cấp thông tin và không phải là lời khuyên đầu tư. Người đọc nên tự tiến hành nghiên cứu trước khi đưa ra các quyết định có ảnh hưởng đến bản thân hay doanh nghiệp của mình và sẵn sàng tự chịu trách nhiệm cho những lựa chọn ấy.

Tin tức nổi bật khác

Bài viết nhiều lượt xem

Bài viết trending