Mặc dù chúng ta đã có những bước tiến dài trong việc xác định các đột biến gen đơn lẻ mà có ảnh hưởng gây bệnh rõ rệt đối với một bệnh cụ thể (ví dụ như đột biến CFTR với chứng xơ u nang và đột biến HEXA với bệnh Tay-Sachs), số lượng các đột biến nguy hại như vậy nói chung là rất nhỏ. Hơn nữa, sự thay đổi gen đơn lẻ có mức độ ảnh hưởng rất yếu đối với bệnh di truyền và với hầu hết các bệnh phổ biến người ta tin rằng các thay đổi di truyền trong một cá thể cùng nhau và/hoặc sự thay đổi di truyền cùng với các nhân tố môi trường gây ra bệnh. Trái ngược với bệnh di truyền đơn gen (hay còn gọi là bệnh di truyền Mendelian), chúng ta đang nhắc đến những bệnh di truyền được gây ra bởi nhiều yếu tố (cả di truyền lẫn môi trường) như là các bệnh di truyền phức hợp (complex genetic disease). Những ví dụ cho bệnh di truyền phức hợp có rất nhiều, ví dụ như tiểu đường tuýp 2, tự kỷ, tinh thần phân liệt, mất trí nhớ Alzheimer, động mạch vành và trầm cảm. 

Như đã thảo luận ở bài trước, khoảng 70%~75% các ca bệnh, các đột biến gây ra các bệnh di truyền bí ẩn thường không tìm thấy. Có nhiều lý do cho sự bế tắc này. Một nguyên nhân quan trọng đó là có rất nhiều biến dị cùng tồn tại khiến cho việc khoanh vùng để tìm các gen gây bệnh trở nên khó khăn. Bằng cách tập trung vào các biến dị mà được dự đoán là có ảnh hưởng tiêu cực (ví dụ như làm bất hoạt sản phẩm của gen), số lượng biến dị ứng viên cho việc gây ra bệnh sẽ bị thu hẹp, nhưng con số này vẫn thường từ 5 tới hơn 20 đột biến. 

Cho đến hiện nay, đối với đại đa số các bệnh di truyền Mendelian, giải mã hệ gen hoặc hệ exon đã thành công trong việc xác định các đột biến gây bệnh trong khoảng 25%~30% các ca bệnh. Hơn nữa, khi mà một đột biến gây bệnh được xác định, thì lượng thông tin thu được chỉ có giá trị cho việc tối ưu điều trị chỉ cho một nhóm nhỏ các bệnh nhân. Thường thì giải mã hệ gen hoặc hệ exon sẽ giúp thu hẹp danh sách các đột biến gây bệnh; do đó làm giảm số lượng các xét nghiệm và kiểm nghiệm. Tuy nhiên, cũng đã có một số ca thành công mỹ mãn. 

Nói chung, mức độ khó dễ để xác đinh căn nguyên di truyền của bệnh phụ thuộc vào mức độ phổ biến của biến dị gây ra bệnh trong quần thể lớn, vào lịch sử bệnh của cả gia đình cùng với khả năng thu mẫu DNA từ các gia đình khác để phân tích, và vào kiểu di truyền (như Mendelian, đa gen, và/hoặc mức độ xâm lấn bệnh mạnh hay yếu).

Theo thống kê tới tháng 7 năm 2014, có khoảng 7300 bệnh di truyền Mendelian đã được ghi nhận. Trong đó, có 3969 bệnh đã xác định được gen gây bệnh và đột biến gây bệnh. Trong thời gian tới, với việc ứng dụng kỹ thuật đọc trình tự và phân tích hệ gen vào lâm sàng, số lượng bệnh di truyền Mendelian sẽ được ghi nhận và xác định được gen gây bệnh nhiều hơn. Đối với nhiều gen, các đột biến di truyền khác nhau có thể gây ra các ảnh hưởng khác nhau đối với protein của nó, dẫn tới các đặc tính bệnh khác biệt hoàn toàn. Ví dụ, các đột biến khác nhau có thể dẫn tới lượng protein biểu hiện nhiều ít khác nhau và/hoặc mức độ hoạt tính mạnh yếu khác nhau. Thực vậy, trong số 3969 bệnh đã xác định được gen gây bệnh thì chỉ có 2776 gen liên quan trực tiếp bởi vì đột biến khác nhau trên cùng một gen có thể gây ra các đặc tính bệnh khác nhau (nhưng vẫn liên quan).

Rất có thể là còn nhiều bệnh di truyền Mendelian nữa mà chúng ta chưa biết, chưa ghi nhận được. Trong hệ gen người có khoảng 20.000 gen mã hóa protein, các đột biến trên các gen này có thể sẽ gây ra bệnh nào đó. Hơn nữa, các đột biến trên những gen chỉ mã hóa RNA cũng có thể là nguyên nhân của các bệnh di truyền; tuy nhiên, hiện chưa có nghiên cứu cụ thể và các con số thống kê còn hạn chế. Chỉ biết rằng sẽ có nhiều bệnh nữa được ghi nhận trong thời gian tới. Tất nhiên, một vài đột biến rất nguy hại có thể dẫn tới bệnh di truyền làm chết bào thai sẽ không được ghi nhận trong cộng đồng dân cư. 

(Dịch từ sách "Genomics & Personalized Medicine: What everyone Needs to Know, Michael Snyder)

Trang www.bioinformatics.vn được xây dựng và phát triển bởi Phòng Tin sinh học (LoBi), Viện CNSH, VAST.

Nghiên cứu

Chúng tôi nghiên cứu và phân tích dữ liệu thu được từ thiết bị đọc trình tự thế hệ mới (Next Generation Sequencing như là Illumina, ionTorrent PGM, Solid 454, ...) với các định hướng chính sau:

  • Genomics: lắp ráp, chú giải và lập bản đồ hệ gen (de novo), phân tích hệ gen (re-sequencing / targeted sequencing) như phân tích đa hình đơn điểm (SNP), INDEL, ...
  • Metagenomics: Đánh giá đa dạng và chú giải chức năng hệ gen của hệ vi sinh vật môi trường.
  • Transcriptomics: Lắp ráp, chú giải hệ phiên mã (de novo), đánh giá biểu hiện, phân tích chức năng hệ phiên mã.

Đào tạo

Với mong muốn tạo ra cộng đồng Tin sinh học Việt Nam đông và mạnh, chúng tôi luôn mong muốn chia sẻ kiến thức và kinh nghiệm thu được trong suốt quá trình nghiên cứu, thực hiện dự án Tin sinh học với tất cả các bạn, các đồng nghiệp quan tâm. Chúng tôi đã xây dựng và triển khai thành công các khóa học:

  • Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen.
  • Tin sinh học: Phân tích và đánh giá biểu hiện hệ phiên mã bằng RNA-seq

Dịch vụ

Chi phí đọc trình tự bằng công nghệ NGS ngày càng rẻ sẽ là động lực làm gia tăng các dự án Tin sinh học trong nước. Tuy nhiên, việc xây dựng ý tưởng, giải pháp khả thi và triển khai dự án TSH còn khá mới ở Việt Nam. Vì vậy, với kinh nghiệm xây dựng và triển khai thành công nhiều dự án TSH, chúng tôi luôn sẵn sàng chia sẻ và hỗ trợ với các dịch vụ:

  • Tư vấn: Xây dựng ý tưởng, phương án khả thi
  • Phân tích dữ liệu: Với hệ thống máy chủ tính toán hiệu năng cao, chúng tôi luôn sẵn sàng xử lý các khối dữ liệu sinh học khổng lồ giúp bạn. 

Xem Danh sách dịch vụ

Chúng tôi luôn mong muốn cùng cộng tác với các cơ quan, tổ chức để phát triển các dự án Tin sinh học và đào tạo nguồn nhân lực cho Tin sinh học Việt Nam. 

Xin vui lòng liên hệ:

TS. Nguyễn Cường
Trưởng phòng, Phòng Tin sinh học, 
Viện Công nghệ sinh học, Viện Hàn lâm KH&CN Việt Nam.
P.208, Nhà B4, 18 Hoàng Quốc Việt, Cầu giấy, Hà Nội.
Email: cuongnguyen(at)ibt.ac.vn