Whole genome sequencing là gì?
ADN và gen
ADN hay axit deoxyribonucleic là vật liệu di truyền của người và đa số các sinh vật khác (bao gồm cả nấm và vi khuẩn). Đối với người, phần lớn ADN gấp cuộn nhiều lần thành nhiễm sắc thể trong nhân tế bào. Một lượng nhỏ ADN hiện diện trong ti thể được gọi là mtDNA.
ADN được cấu tạo từ 4 loại đơn phân (nucleotide) bao gồm adenine (A), guanine (G), cytosine (C) và thymine (T) liên kết với khung đường phosphate.

Nguồn: Labster Theory pages
Gen là những đoạn ADN chứa thông tin mã hóa quyết định phần lớn kiểu hình của sinh vật. Thông tin mã hóa được lưu trữ dưới dạng trình tự các đơn phân nucleotide. Do đó, giải trình tự bộ gen người là chìa khóa quan trọng trong nghiên cứu và chẩn đoán bệnh.
ADN trong nhân (còn gọi là genome) có 2 loại trình tự gồm:
- Vùng exon: cung cấp hướng dẫn mã hóa ra protein
- Vùng intron: không có chức năng mã hóa protein
Bộ gen của con người chứa khoảng 3,2 tỉ nucleotide và hơn 23.500 gen. Mỗi gen có các vùng mã hóa protein được gọi là exon. Exome là tập hợp tất cả các đoạn exon (khoảng 180.000 đoạn, chiếm 1% bộ gen tương đương với 30 triệu nucleotide).
Whole genome sequencing
Whole genome sequencing (WGS) là giải trình tự toàn bộ bộ gen của bất kì một sinh vật nào, bao gồm cả người. Do đó, kĩ thuật này khó, đòi hỏi kiến thức chuyên môn và trình độ cao do kích thước toàn bộ gen của sinh vật cực lớn.
Thông tin về bộ gen là cơ sở để xác định bệnh di truyền, mô tả đặc điểm của các đột biến thúc đẩy sự tiến triển của ung thư và theo dõi sự bùng phát của bệnh.
Quy trình WGS
Giải trình tự toàn bộ bộ gen bao gồm 5 bước cơ bản sau:
1.Tách chiết ADN
ADN được lưu trữ trong nhân tế bào. Sau khi thu nhận mẫu, kĩ thuật viên thực hiện các phản ứng hóa học phá vỡ màng và nhân tế bào. Tiếp theo, ADN được giải phóng và tinh sạch để loại bỏ tạp chất.

Nguồn: ihope
2.Phân cắt ADN
ADN sau tách chiết được phân cắt thành những đoạn có độ dài xác định. Enzyme cắt giới hạn được sử dụng để nâng cao độ chính xác. Những enzyme này tạo ra từ vi khuẩn cổ có khả năng nhận diện trình tự đặc hiệu trên ADN. Sau đó, các enzyme cắt giới hạn tiến hành thủy phân liên kết cộng hóa trị (photphodieste) giữa 2 phân tử nucleotide liền kề.

Nguồn: ihope
Ngoài ra, tác động cơ học cũng có thể được sử dụng để làm đứt gãy các đoạn ADN. Tuy nhiên, sự phân cắt này diễn ra ngẫu nhiên và khó kiểm soát.
3.Tạo thư viện ADN
Những đoạn ADN ngắn được tạo ra nhiều bản sao bằng kĩ thuật PCR. Tập hợp các bản sao này gọi là thư viện ADN.

Nguồn: ihope
4.Giải trình tự
Thư viện ADN được nạp vào máy giải trình tự. Từ đó, người ta ghi nhận lại trình tự A, T, G, C của từng đoạn gen đã cắt ban đầu. Kết quả mỗi đoạn gọi là điểm đọc. Bước này có thể sử dụng kĩ thuật Sanger hoặc giải trình tự gen thế hệ mới.

Nguồn: ihope
5.Phân tích dữ liệu
Dựa vào tin sinh học, hàng triệu điểm đọc được sắp xếp theo đúng trình tự. Từ đó, những đoạn gen ngắn được lắp ghép thành đoạn ADN dài.

Nguồn: ihope
Đối với công nghệ giải trình tự gen thế hệ mới NGS (Next Generation Sequencing), độ phủ (coverage) và độ sâu (depth) cần được chú ý.
Vai trò của WGS
Bằng công nghệ NGS, giải trình tự toàn bộ bộ gen hiện nay có chi phí thực hiện giảm mạnh và thời gian xét nghiệm được rút gọn nhanh chóng. Do đó, WGS được ứng dụng đa dạng và linh hoạt trong nhiều lĩnh vực cuộc sống.
WGS trong chẩn đoán bệnh di truyền
Chẩn đoán di truyền là bước quan trọng trong quá trình chăm sóc sức khỏe. Đối với những bệnh nhân có bất thường trong gen, chẩn đoán di truyền có thể xác định nguyên nhân gây bệnh và yếu tố nguy cơ trong gia đình. Ngoài ra, kĩ thuật này tạo điều kiện cho các thử nghiệm điều trị như liệu pháp oligonucleotide antisense (*).
WGS giúp bác sĩ phát hiện những nguyên nhân di truyền tiềm ẩn nhanh chóng và chính xác, đặc biệt các bệnh đơn gen.
WGS và ung thư
Ung thư là bệnh nan y do nhiều nguyên nhân phức tạp. Trong phần lớn trường hợp, đột biến gen khiến tế bào bất thường dẫn đến tăng sinh không ngừng rồi hình thành khối u. Do đó, thông tin di truyền của tế bào ung thư nắm vai trò thiết yếu trong chẩn đoán, điều trị và nghiên cứu.
Giải trình tự toàn bộ bộ gen ung thư kết hợp NGS cung cấp thông tin tổng thể về những đột biến đặc biệt hiện diện trong khối u. Phương pháp này có khả năng phát hiện đột biến đơn điểm (SNV), bất thường số lượng bản sao, lặp hoặc mất đoạn.
Thông qua WGS, bác sĩ xác định được các đột biến trên gen gây ra ung thư. Từ đó, quá trình điều trị được cá thể hóa cho từng bệnh nhân. Ngoài ra, vai trò của đột biến trong quá trình hình thành ung thư cũng được phát hiện.
Xem thêm: Chẩn đoán ung thư FoundationOne CDx
Quản lý an toàn thực phẩm bằng WGS
PulseNet International là mạng lưới phòng thí nghiệm quốc gia và khu vực chuyên theo dõi các bệnh lây nhiễm qua thực phẩm trên toàn thế giới. Mỗi phòng thí nghiệm sử dụng các phương pháp xác định kiểu gen được tiêu chuẩn hóa và chia sẻ thông tin theo thời gian thực.
Tại Hoa Kì, PulseNet sử dụng kĩ thuật điện di xung trường (pulsed-field gel electrophoresis – PEGE) để kiểm soát và ngăn chặn mối nguy hại của vi sinh vật trong thực phẩm. Tuy nhiên, phương pháp này không thể xác định đặc tính phân tử và phân nhóm vi khuẩn gây bệnh chính xác.
Do đó, WGS cung cấp thông tin mầm bệnh mức độ ADN với chi phí tiết kiệm và nhanh chóng. Ngoài ra, WGS thay thế các phương pháp phân tích vi sinh truyền thống trong quá trình xác định kiểu huyết thanh, kháng kháng sinh và lập hồ sơ độc lực. Tất cả diễn ra trong một quy trình WGS duy nhất.
Ưu điểm và nhược điểm của WGS
Ưu điểm
WGS tạo điều kiện thuận lợi cho nhiều phân tích khác nhau bao gồm:
- Phát hiện thay đổi các vùng trình tự không mã hóa (vùng khởi động, vùng điều hòa)
- Xác định bất thường cấu trúc kích thước lớn (mất hoặc chèn đoạn, đảo đoạn, lặp đoạn, chuyển vị)
- Xác định sự hiện diện và vị trí của bộ gen virus
- Kiểm tra các thay đổi gen của ti thể
- Phân tích miễn dịch gen như phân loại HLA
- Chẩn đoán và điều trị các khối u di truyền theo dòng mầm
- Khảo sát dược động học và khả năng gây ung thư bằng phân tích dấu hiệu đột biến
Nhược điểm
Tuy nhiên, WGS vẫn còn một số hạn chế như sau:
- Độ sâu (depth read) không cao có thể dẫn đến kết quả âm tính giả, đặc biệt những trường hợp có độ không đồng nhất trong khối u cao
- Mô khối u cần được đông lạnh trong phân tích, do đó hạn chế triển khai lâm sàng tại nhiều cơ sở y tế
- Khối lượng dữ liệu sau giải trình tự cực lớn dẫn đến chi phí phân tích và lưu trữ cao
- Khó đánh giá những đột biến mới chưa được nghiên cứu
Kết luận
WGS là phương pháp toàn diện để phân tích toàn bộ bộ gen. Thông tin về ADN giúp xác định các bệnh di truyền, mô tả đặc điểm của đột biến thúc đẩy tiến triển ung thư và theo dõi bùng phát của bệnh. Kĩ thuật giải trình tự thế hệ mới NGS giúp WGS giảm chi phí và thời gian thực hiện. Do đó, hiện nay WGS trở thành công cụ mạnh mẽ và hiện đại trong di truyền học và y học.
References
- National Library of Medicine. Whole Genome Shotgun Submissions. Retrieved April 26, 2024 from https://www.ncbi.nlm.nih.gov/genbank/wgs/
- National Library of Medicine. Clinical Interpretation and Implications of Whole-Genome Sequencing. Retrieved April 26, 2024 from https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4119063/
- U.S National Library of Medicine. What is DNA?. Retrieved April 26, 2024 from https://medlineplus.gov/genetics/understanding/basics/dna/
- National Library of Medicine. Whole-Genome Sequencing in Cancer. Retrieved April 26, 2024 from https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6396343/
- National Library of Medicine. Use of Whole-Genome Sequencing for Food Safety and Public Health in the United States. Retrieved April 26, 2024 from https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6653787/
- National Library of Medicine. A step-by-step beginner’s protocol for whole genome sequencing of human bacterial pathogens. Retrieved April 26, 2024 from https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6706130/
- National Library of Medicine. Overview: Gene Structure. Retrieved April 26, 2024 from https://www.ncbi.nlm.nih.gov/books/NBK12983/
- National Library of Medicine. Whole-genome sequencing. Retrieved April 26, 2024 from https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8543191/
- National Library of Medicine. Next-generation sequencing approach for the diagnosis of human diseases: open challenges and new opportunities. Retrieved April 26, 2024 from https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5949614/
- National Library of Medicine. Current and future trends in whole genome sequencing in cancer. Retrieved April 26, 2024 from https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10875287/
