Một số dữ liệu dự án bộ gen của Hàn Quốc được công bố

Mới đây, dự án Bộ gen Hàn Quốc (Korea1K) đã được nhóm các nhà nghiên cứu cùng với các thành viên liên kết với một số lượng lớn các tổ chức ở Hàn Quốc và Hoa Kỳ công bố dữ liệu giai đoạn đầu. Trong bài báo được công bố trên tạp chí Science Advances, nhóm nghiên cứu lưu ý rằng dữ liệu bao gồm thông tin mô tả 1.094 bộ gen cùng với 79 đặc điểm lâm sàng định lượng.

Nguồn: Muff Public Domain

Korea1K là dự án giải trình tự bộ gen lớn nhất được thực hiện cho đến nay tại Hàn Quốc, nó đã bắt đầu được thực hiện trở lại vào năm 2006 và được hỗ trợ bởi nhiều nguồn khác nhau kể từ thời điểm đó. Mục tiêu của dự án là thu thập, phân tích và phân phối thông tin bộ gen của Hàn Quốc để sử dụng trong các nghiên cứu lâm sàng và dân tộc học. Một trong những ứng dụng chính của dữ liệu dự kiến ​​sẽ nằm trong lĩnh vực nghiên cứu ung thư.

Trong giai đoạn đầu tiên của dự án, 1.094 toàn bộ bộ gen đã được giải trình tự với độ ‘chuyên sâu’ trung bình là 31 lần. Dữ liệu cho mỗi bộ gen được giải trình tự đã được ghép nối với 79 đặc điểm liên quan từ người có bộ gen được giải trình tự. Trong bài báo của họ, nhóm nghiên cứu nhấn mạnh đến các chi tiết đáng chú ý của dữ liệu.

Một số ví dụ về các chi tiết đáng chú ý: 39 triệu biến thể nucleotide đơn và indel (Thêm bớt là một thuật ngữ về đột biến gen trong sinh học phân tử, nói về loại đột biến thêm hoặc bớt một hay nhiều nuclêôtit của phân tử axit nucleic) đã được xác định, một nửa trong số đó được tìm thấy là cặp đôi hoặc singletons. Các nhà nghiên cứu cũng phát hiện ra rằng độ chính xác của Hàn Quốc1K có độ chính xác cao hơn so với bảng Genome 1000, giúp lọc các mẫu ung thư hiệu quả hơn. 1.007 bộ gen được giải trình tự thuộc một phần của dự án đã được tạo mới và thông tin trong dữ liệu bao gồm các đặc điểm của các indel, SNVs, chèn phân tử chuyển vị, biến thể số có thể sao chép và các loại kháng nguyên bạch cầu của người, và đã được so sánh với dữ liệu từ các quần thể khác.

Các nhà nghiên cứu cũng lưu ý rằng hơn 70% các cặp song sinh hoặc singletons đã được xác định cho đến nay chưa từng được báo cáo trước đó và dưới 20% trong số này được xác định là phổ biến. Họ cũng phát hiện thấy rằng có nhiều đứt đoạn hơn so với chèn đoạn trong indels, gợi ý đến khuynh hướng sai lệch của các biến thể.

Bộ dữ liệu sẽ cung cấp một bảng tham chiếu mạnh mẽ trong tương lai, từ đó tăng cường các ứng dụng y tế cá nhân hóa cho người dân Hàn Quốc, nhóm nghiên cứu cho biết.

P.T.T (NASATI), theo https://medicalxpress.com/news/2020-05-korean-genome.html, 28/5/2020