Nghiên cứu ứng dụng trí tuệ nhân tạo phát hiện COVID-19
Cập nhật vào: Thứ tư - 21/07/2021 01:43
Cỡ chữ
Nhóm các nhà khoa học gồm Tiến sĩ Vũ Xuân Sơn (Đại học Umea-Thụy Điển), Tiến sĩ Vũ Hữu Tiệp (kỹ sư Machine Learning tại Google), Tiến sĩ Harry Nguyen (Đại học Glassgow-Anh) và các nhà khoa học khác đã bắt tay triển khai dự án nghiên cứu ứng dụng trí tuệ nhân tạo (AI) phát hiện COVID-19, thông qua phân tích tiếng ho.
Theo nhóm xử lý dữ liệu dự án có tên AICovidVN, đây là một dự án tình nguyện do hơn 200 kỹ sư, nhà nghiên cứu và những người có chuyên môn về công nghệ, AI lập nên. Mục đích của dự án là cố gắng tạo ra một mô hình AI có khả năng tiền chẩn đoán xác suất nhiễm COVID-19 của một người thông qua tiếng ho, tiếng thở và các thông tin dịch tễ khác. Nhóm nghiên cứu sẽ tận dụng các kết quả từng được công bố của các nhà khoa học tại Học viện Công nghệ Massachusetts (MIT). Theo đó, khác với tiếng ho của người thường, tiếng ho của người mắc COVID-19 có thể được phát hiện ra thông qua 4 dấu ấn sinh học. Các dấu ấn này bao gồm sự loạn dưỡng cơ bắp, thoái hóa, nhão cơ (Muscular degradation), sự thay đổi về âm thanh được phát ra từ dây thanh quản (Changes in vocal cords), sự thay đổi về sự diễn cảm/biểu đạt trạng thái cảm xúc (Changes in sentiment/mood) và sự thay đổi về âm thanh từ phổi cùng đường hô hấp (Changes in the lungs and respiratory tract).
Nhóm nghiên cứu sẽ sử dụng thuật toán AI để phân tích hàng ngàn mẫu tiếng ho của người dương tính với COVID-19 và hàng ngàn mẫu ho của người không bị bệnh hay bị các bệnh gây tổn thương phổi khác để tìm ra người mắc COVID-19. Thuật toán sẽ tự động nhận diện các đặc điểm tổn thương chỉ do COVID-19 gây ra. Đó là những dấu hiệu thương tổn mà tai người không thể phát hiện được. Đây là sức mạnh của công nghệ AI. Để ra được kết quả chính xác, nhóm nghiên cứu cần sử dụng phương pháp AI phù hợp, cùng với đó là nhiều bộ lọc phức tạp.
Nhóm nghiên cứu đang kêu gọi thu thập tiếng ho bằng điện thoại hoặc các thiết bị ghi âm và gửi về cơ sở dữ liệu. Tính đến tháng 6/2021, dự án đã xử lý làm sạch và gắn nhãn được 7.000 mẫu dữ liệu. Theo đội ngũ nghiên cứu dự án, giải pháp của họ sẽ giúp phân loại, tìm ra người nhiễm COVID-19 nhanh chóng và không cần xét nghiệm. Cách làm này cũng giúp hạn chế nguy cơ lây nhiễm chéo tại khu vực xét nghiệm khi phải tập trung đông người. Hiện dự án đã tiếp cận được với nguồn dữ liệu là 1.700 mẫu ghi âm tiếng ho của người nhiễm COVID-19. Đây là những mẫu ghi âm tiếng ho của các bệnh nhân tại Thụy Sĩ và Ấn Độ. Ngoài ra, AICovidVN còn có thêm dữ liệu tiếng ho của một số nguồn mở khác. Tuy nhiên, để kiểm tra và tiếp tục đào tạo hệ thống AI của mình với bệnh nhân COVID-19 tại Việt Nam, dự án sẽ cần tới 10.000 mẫu tiếng ho, trong đó ít nhất 100-500 mẫu của các bệnh nhân dương tính với COVID-19. Việc ghi âm qua điện thoại (Facebook và Zalo) về mặt kỹ thuật là vẫn bảo đảm được chất lượng âm thanh tối thiểu để có thể phân tích, miễn là người thu âm thực hiện ở trong môi trường yên tĩnh, ít tiếng ồn.
Khi xây dựng cơ sở dữ liệu giọng ho cho người Việt, thách thức khó khăn nhất với các thành viên dự án là tìm được những cá nhân F0, F1 cùng tham gia đóng góp. Nhóm dự án hiện đang kêu gọi người dân đóng góp tiếng ho của mình vào cơ sở dữ liệu. AICovidVN cho biết họ đang lập kế hoạch để sử dụng kho dữ liệu tiếng ho của người Việt, giúp nâng khả năng chẩn đoán chính xác COVID-19 lên mức 95-97%. Dự kiến, đến cuối tháng 8/2021, giải pháp này sẽ được chuyển giao cho các cơ quan chức năng thẩm định và nâng cấp.
P.A.T (NASATI)