Mô hình được xây dựng dựa trên mức độ biểu hiện gen của CENPM và F12 từ mẫu máu của người Việt Nam. Sau đó, hai chỉ thị sinh học này được sử dụng để xây dựng mô hình học máy bằng thuật toán Mixture Discriminant Analysis (MDA) giúp chẩn đoán ung thư gan với độ chính xác cao.
Khác với các phương pháp truyền thống, mô hình cho kết quả vượt trội với AUC đạt 0,94 trên mẫu máu, vượt xa chỉ số AUC 0,53 của AFP, điều này cho thấy khả năng chẩn đoán vượt trội. Khi kiểm định trên các bộ dữ liệu quốc tế, mô hình vẫn giữ được độ chính xác cao, với AUC lần lượt là 0,84 (GSE49515) và 0,74 (GSE58208).
Đặc biệt, mô hình giúp phân biệt giữa mô ung thư và mô xơ gan, đây một thử thách lớn trong chẩn đoán lâm sàng do các tổn thương lành tính trong xơ gan có thể tạo hình ảnh hoặc biểu hiện tương tự ung thư. Điểm nổi bật của mô hình là khả năng chẩn đoán sớm HCC ở giai đoạn 0/A theo phân loại BCLC hoặc giai đoạn I/II theo TNM. Kết quả từ dữ liệu GSE14520 cho thấy mô hình đạt AUC = 0,89 trong phát hiện bệnh ở giai đoạn sớm, trong khi AFP chỉ đạt 0,67. Điều này có ý nghĩa cực kỳ quan trọng trong thực hành lâm sàng, bởi bệnh được chẩn đoán sớm là yếu tố tiên quyết để tăng tỷ lệ sống và đưa ra liệu pháp điều trị phù hợp.
Không dừng lại ở khả năng chẩn đoán, mô hình còn cho thấy giá trị tiên lượng rõ rệt. Bằng cách sử dụng chỉ số thang điểm để phân nhóm bệnh nhân thành nhóm nguy cơ cao và thấp, sau đó phân tích Kaplan-Meier trên hai tập dữ liệu có thông tin sống còn (GSE14520 và TCGA), mô hình đã chứng minh được khả năng phân biệt rõ giữa nhóm tiên lượng tốt và xấu với ý nghĩa thống kê (p < 0,001). Điều này cho phép ứng dụng mô hình như một công cụ hỗ trợ bác sĩ để theo dõi tiến triển bệnh và điều chỉnh kế hoạch điều trị phù hợp với từng bệnh nhân.
Mô hình không chỉ dự đoán nguy cơ mắc bệnh mà còn cung cấp thông tin chi tiết về tiên lượng bệnh, từ đó đề xuất phương pháp điều trị phù hợp nhất cho bệnh nhân với những bệnh nhân có chỉ số tiên lượng thấp thì phù hợp với điều trị bằng phương pháp TACE còn những bệnh nhân có chỉ số tiên lượng cao sẽ đáp ứng tốt với liệu pháp sorafenib. Đây không chỉ là một bước đột phá trong việc ứng dụng công nghệ hiện đại vào y học mà còn đánh dấu cột mốc quan trọng trong sự phát triển của y học chính xác tại Việt Nam.
Điểm nổi bật
Nghiên cứu nhằm tạo ra một hệ thống đánh giá toàn diện hỗ trợ chẩn đoán, tiên lượng và điều trị ung thư gan một cách hiệu quả hơn.
Điểm nổi bật đầu tiên của nghiên cứu là việc ứng dụng phân tích dữ liệu lớn (Big Data) để phân tích dữ liệu biểu hiện gen và thông tin lâm sàng của hơn 1600 mẫu liên quan tới ung thư gan từ các cơ sở dữ liệu quốc tế (TCGA, GEO). Việc khai thác nguồn dữ liệu phong phú này, kết hợp với các thuật toán học máy, không chỉ đơn thuần là sử dụng công nghệ hiện đại mà còn tối ưu hóa quy trình tìm kiếm chỉ dấu sinh học, thể hiện sự sáng tạo trong việc tích hợp y học, sinh học, tin sinh và thống kê.
Tính mới tiếp theo thể hiện ở việc sử dụng công nghệ tiên tiến trong phân tích dữ liệu, bao gồm kỹ thuật z-score normalization để chuẩn hóa dữ liệu biểu hiện gene, BRB-ArrayTool để trích xuất gene quan trọng và đặc biệt là tích hợp thuật toán Support Vector Machine (SVM) để nâng cao độ chính xác của mô hình.
Quan trọng hơn, nghiên cứu sử dụng thuật toán Mixture Discriminant Analysis (MDA) để xây dựng một mô hình đa chức năng, liên kết chặt chẽ giữa chẩn đoán, tiên lượng và dự đoán đáp ứng điều trị, một điều chưa từng được thực hiện trước đây. Mô hình không chỉ giúp dự đoán một người nào đó có nguy cơ bị ung thư gan hay không, nếu có thì tiên lượng của họ ra sao và ứng với tiên lượng đó thì bệnh nhân nên được điều trị bằng phương pháp nào sẽ có hiệu quả tốt nhất.
Đặc biệt nghiên cứu đã được thử nghiệm tại Bệnh viện Thống Nhất trên nhóm mẫu gồm 36 bệnh nhân ung thư gan và người khỏe mạnh, với kết quả đầy hứa hẹn. Mô hình đạt giá trị AUC lên tới 0,94 so với AFP là 0,53, điều này chứng minh khả năng vượt trội trong việc phát hiện ung thư gan, đặc biệt ở giai đoạn sớm.
Đây được coi là một bước đột phá trong lĩnh vực chẩn đoán, giúp khắc phục hạn chế của các phương pháp truyền thống như AFP. Việc ứng dụng mô hình không chỉ giúp phát hiện bệnh kịp thời mà còn mở ra cơ hội điều trị hiệu quả hơn, từ đó cải thiện đáng kể tỷ lệ sống sót và nâng cao chất lượng cuộc sống cho bệnh nhân.
Thành công này không chỉ củng cố tiềm năng ứng dụng của mô hình trong lâm sàng mà còn đặt nền móng cho những cải tiến quan trọng trong chẩn đoán và điều trị ung thư gan tại Việt Nam.
Thành tích
Với tính đột phá trên giải pháp đã được cộng đồng khoa học và công nghệ ghi nhận thông qua nhiều giải thưởng danh giá, phản ánh rõ tính mới, khả năng ứng dụng và giá trị thực tiễn. Cụ thể giải pháp đã đạt:
– Giải Nhất giải thưởng Sinh viên Nghiên cứu Khoa học Euréka lần thứ 25 năm 2023
– Giải Khuyến khích Cuộc thi Sáng kiến Khoa học 2024 do Bộ Khoa học và Công nghệ kết hợp Báo VnExpress tổ chức
– Giải Nhì Hội thảo khoa học “Ứng dụng chuyển đổi số và Trí tuệ nhân tạo trong chẩn đoán và điều trị bệnh”
– Giải Nhì Hội thảo khoa học “Khoa học sức khỏe trong kỷ nguyên số”
– Chứng nhận ươm tạo cuộc thi Tìm kiếm dự án đổi mới sáng tạo ứng dụng trí tuệ nhân tạo Thành phố Hồ Chí Minh – AI STAR 2024 do Sở Khoa học và Công nghệ TPHCM tổ chức
– Giải Ba cuộc thi Sáng kiến xây dựng thành phố thông minh – Smart city 2024
– Giải Nhì Hội thi Sáng tạo Kỹ thuật tỉnh Bình Dương Ủy ban Nhân dân tỉnh Bình Dương trao tặng (2025)
– Giải Ba Giải thưởng Sáng tạo Thành phố Hồ Chí Minh lần 4 năm 2025 Ủy ban Nhân dân Thành phố Hồ Chí Minh trao tặng.
Ngoài ra giải pháp được công nhận sáng kiến có hiệu quả áp dụng cấp cơ sở • Sáng kiến có hiệu quả áp dụng, phạm vi ảnh hưởng cấp cơ sở năm học 2022-2023 cho các cá nhân thuộc Khoa Y (Kèm theo Quyết định số 160/QĐ-KHSK ngày 24 tháng 5 năm 2023 của Khoa Y ĐHQG-HCM). Với tên sáng kiến “Ứng dụng phân tích Bigdata và học máy trong nghiên cứu và tìm kiếm các chỉ thị sinh học để chẩn đoán và tiên lượng ung thư gan nguyên phát” • Sáng kiến có hiệu quả áp dụng, phạm vi ảnh hưởng cấp cơ sở năm học 2023-2024 cho nhóm tác giả thuộc Trường Đại học Khoa học Sức khỏe (Kèm theo Quyết định số 127/QĐ-KHSK ngày 15 tháng 8 năm 2024 của Hiệu trưởng Trường Đại học Khoa học Sức khỏe). Với tên sáng kiến ” Xây dựng mô hình học máy giúp chẩn đoán sớm, tiên lượng và cá nhân hóa điều trị ung thư biểu mô tế bào gan” Bên cạnh đó giải pháp đang đăng ký sở hữu trí tuệ với mã hồ sơ: 1-2025-02818 và 1-2025-02822
Đội ngũ phát triển
TS. Nguyễn Minh Nam: Trưởng nhóm dự án, là giảng viên và nhà nghiên cứu với chuyên môn sâu trong lĩnh vực sinh học phân tử, y sinh học, di truyền, đặc biệt về ung thư học và sinh tin học
ThS. Bùi Thị Phường: Thạc sĩ Công nghệ Sinh học, với vai trò thiết kế và triển khai các thí nghiệm RT-qPCR, cũng như kiểm định hiệu quả của mô hình
CN. Nguyễn Thị Kim Nhường: Cử nhân Công nghệ Sinh học, phát triển và xây dựng mô hình học máy
CN. Nguyễn Thành Đạt: Cử nhân Công nghệ Sinh học, nghiên cứu viên về phân tích dữ liệu tin sinh học và lập trình
Nguyễn Lê Phú Quí: Sinh viên Y đa khoa, xây dựng website và phân tích dữ liệu tin sinh
https%3A%2F%2Fvnexpress.net%2Fung-dung-ai-trong-xay-dung-mo-hinh-da-muc-tieu-giup-chan-doan-tien-luong-va-ca-nhan-hoa-4914018.html