Dữ liệu định lượng và định tính trong luận văn Y học.

lua-van-y-hoc-1

Dữ liệu định lượng và định tính trong luận văn Y học.

Tiếp tục loạt bài về luận văn, hôm nay Nhi tản mạn về bản chất định lượng, định tính của thông tin lâm sàng.

Đối tượng của nghiên cứu Y học là bệnh lý; tuy nhiên, bệnh lý là một khái niệm tương đối.

Tất cả những bệnh lý được định danh trên lâm sàng đều là kết quả của một quy ước nào đó, có khi dựa vào việc cắt thang đo 1 đại lượng thành 2 phần (thí dụ cao huyết áp, đái tháo đường); có khi dựa vào 1 bằng chứng trực quan (ung thư, xuất huyết, xơ phổi, đột biến nhiễm sắc thể, bệnh truyền nhiễm…), điểm số lâm sàng tổng hợp từ nhiều triệu chứng, xét nghiệm (thí dụ: suy thận, suy tim, rối loạn chức năng gan,…), có khi hoàn toàn chủ quan (thí dụ bệnh tâm thần, rối loạn hành vi).

Trong hệ thống sinh học/quần thể tự nhiên, bệnh lý chỉ là một không gian ảo, tương đối. Ranh giới của một căn bệnh có thể mở rộng hay thu hẹp, nhiều bệnh lý có thể giao thoa với nhau. Trong không gian này, tồn tại một mạng lưới liên hệ phức tạp giữa các yếu tố sinh lý, bệnh học, và biểu hiện thực thể, nguyên nhân và hậu quả… cấu trúc mạng lưới này là bản đồ của những xét nghiệm chẩn đoán và can thiệp điều trị, là đối tượng thực sự của nghiên cứu y học, là con đường sự nghiệp của các nhà khoa học.

Trạng thái sức khỏe/bệnh lý có thể được khảo sát theo cách chủ quan hay khách quan. Thí dụ về những phép đo chủ quan như: triệu chứng do bệnh nhân tự khai báo, bộ câu hỏi, thang điểm tự lượng giá. Phép đo khách quan là tất cả những xét nghiệm sinh lý, sinh hóa, tế bào học. Tuy nhiên, có những thông tin khách quan được sử dụng/diễn giải một cách chủ quan, thí dụ chẩn đoán hình ảnh, xét nghiệm mô học, đa ký giấc ngủ…

Đọc thêm  Mô tả kế hoạch phân tích trong nghiên cứu khoa học

Trong nghiên cứu, Nhi luôn ưu tiên dùng dữ liệu khách quan, vì dữ liệu chủ quan thường không đáng tin cậy, dễ bị sai lệch. Chính vì bias quá lớn, hầu hết phân tích thống kê dùng cho dữ liệu chủ quan đều thất bại, hoặc ra effect size yếu.

Mỗi hình thức khảo sát, lại có thể cung cấp dữ liệu định lượng, hoặc định tính. Hầu hết thông tin chủ quan là định tính và xét nghiệm khách quan thường sinh ra dữ liệu định lượng; tuy nhiên vẫn có thông tin định tính/khách quan như những triệu chứng được phát hiện do thăm khám bởi bác sĩ. Ngược lại, có những thứ định lượng nhưng chủ quan, thí dụ thang điểm đau, thang điểm xơ phổi, điểm số bảng câu hỏi…

Đôi khi cùng một dữ liệu có thể được sử dụng theo cách định tính hay định lượng, thí dụ kết quả điện tâm đồ, xét nghiệm dị ứng trên da.

Điều thú vị, đó là con người rất giỏi so sánh dựa vào con số, nhưng trong thực hành lâm sàng, mọi hành động và quyết định đều định tính, nhị phân; do đó các kết quả xét nghiệm định lượng đều được chuyển thành kết quả nhị phân: Âm tính/Dương tính, bình thường/bất thường, Tăng/giảm, Cao/thấp…

Đọc thêm  Những lỗi phổ biến trong trình bày bằng Powerpoint

Một điều tinh tế khác, đôi khi hiện tượng định tính mà ta quan sát được, là hậu quả của một quy trình bệnh học, mà trong quá trình này rất nhiều đại lượng trong cơ thể đã bị thay đổi, thí dụ triệu chứng viêm song hành với biến động tế bào miễn dịch, các biomarker trong bệnh ung thư có thể tăng từ trước khi khối u được nhìn thấy trên CT scan.

Có rất nhiều phương pháp thống kê từng được dùng trong nghiên cứu y học, điều này gây ngộ nhận rằng chúng khác nhau; có thực như vậy chăng ?

Giả sử bạn muốn kết nối 2 nút trên mạng lưới sinh lý bệnh học của 1 căn bệnh, X là một đại lượng quy ước, và Y là một đối tượng mới, mục tiêu cần nghiên cứu.

Một NCS so sánh trung bình Y giữa 2 phân nhóm Bệnh nhân và người khỏe mạnh; nhưng yếu tố phân nhóm này, chính là kết quả của việc cắt thang đo của X thành 2 phần (ngưỡng chẩn đoán). Như vậy NCS đó thực ra đang khảo sát hiệp phương sai giữa X và Y, với cùng thông điệp của một phân tích tương quan, hay mô hình hồi quy tuyến tính Y ~ X.

Trước kia, trong luận văn Y học rất dễ thấy bảng chéo và test Chi2, các bạn thường nghĩ rằng đang so sánh tỉ lệ Y cao/thấp giữa 2 nhóm có/không có bệnh, tuy nhiên đây là hình thức đơn giản nhất của khảo sát mối liên hệ giữa X và Y, vì bảng chéo 2×2 là hình ảnh của việc chia cắt không gian dữ liệu 2 chiều X,Y thành 4 cụm. Lại là tương quan.

Đọc thêm  Kinh nghiệm viết và công bố bài báo khoa học

Như vậy, luận văn tưởng dài, nhưng tác giả chỉ đang đi quanh quẩn đo lường hiệp phương sai giữa X và Y.

Nói theo Judea Pearl, dù bạn có bao nhiêu dữ liệu, và dùng công cụ thống kê nào, cũng không thoát ra khỏi khái niệm tương quan.

Tương lai của nghiên cứu y học không chỉ có mục tiêu phát hiện ra thật nhiều yếu tố Y1, Y2, … Yn, nhưng chúng ta cần đi xa hơn. Khi bạn chọn đề tài luận văn, hãy nghĩ về điều này.

Khảo sát toàn bộ mạng lưới giữa các nút, tái cấu trúc không gian về khái niệm bệnh học, tìm ra những kiểu hình lâm sàng mới, là những câu hỏi thú vị. Những quy ước hiện hành, chưa chắc là chân lý.

Ta lại thấy rằng, với tiến bộ của khoa học kỹ thuật, hình thức dữ liệu định lượng ngày càng phổ biến, vì máy móc và thuật toán trí tuệ nhân tạo dễ tiếp nhận và xử lý dữ liệu định lượng. Thí dụ, triệu chứng Parkinson có thể được đo định lượng bằng cảm biến gia tốc, những tiếng rale, khò khè của bệnh viêm phổi được xử lý trực tiếp bằng sóng âm thanh…

Như vậy: trong tương lai tất cả mọi hiện tượng sinh lý/bệnh học nên theo xu hướng được khảo sát một cách định lượng, tự động và khách quan hơn.

Nguồn: Lê Ngọc Khả Nhi

# luận văn Y học

VNEconomics – Chúng tôi mong muốn đem tri thức khoa họccông nghệkinh tế đến với nhiều người Việt Nam. Đặc biệt là kiến thức về Blockchain & tiền mã hóa

Leave a Reply