Giáo trình Sinh học phân tử - Chương 2: Cấu trúc genome
Genome (hệ gen, bộ gen) là thuật ngữ được dùng với các nghĩa khác
nhau như sau:
- Nguyên liệu di truyền của một cơ thể: 1) nhiễm sắc thể trong tế bào
vi khuẩn (hoặc một trong mỗi loại nhiễm sắc thể nếu hơn một loại có mặt, ví
dụ: các nhiễm sắc thể lớn hoặc bé của Vibrio cholerae), 2) DNA hoặc RNA
trong một virion, 3) nhiễm sắc thể cùng với mọi plasmid được kết hợp (ví
dụ: nhiễm sắc thể và hai plasmid nhỏ trong vi khuẩn Buchnera).
- Tất cả các gen (khác nhau) trong tế bào hoặc virion.
- Bộ nhiễm sắc thể đơn bội hoặc genome đơn bội trong tế bào.
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Sinh học phân tử - Chương 2: Cấu trúc genome", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Giáo trình Sinh học phân tử - Chương 2: Cấu trúc genome
Sinh học phân tử 26 Chương 2 Cấu trúc genome Genome (hệ gen, bộ gen) là thuật ngữ được dùng với các nghĩa khác nhau như sau: - Nguyên liệu di truyền của một cơ thể: 1) nhiễm sắc thể trong tế bào vi khuẩn (hoặc một trong mỗi loại nhiễm sắc thể nếu hơn một loại có mặt, ví dụ: các nhiễm sắc thể lớn hoặc bé của Vibrio cholerae), 2) DNA hoặc RNA trong một virion, 3) nhiễm sắc thể cùng với mọi plasmid được kết hợp (ví dụ: nhiễm sắc thể và hai plasmid nhỏ trong vi khuẩn Buchnera). - Tất cả các gen (khác nhau) trong tế bào hoặc virion. - Bộ nhiễm sắc thể đơn bội hoặc genome đơn bội trong tế bào. Chuỗi genome hoàn chỉnh (nghĩa là trình tự hoàn chỉnh của các nucleotide trong genome) đã được công bố cho một số loài vi khuẩn. Các trình tự khác cũng đã được công bố, ví dụ genome của cây cúc dại (Arabidopsis thaliana) và genome người. Genome chứa toàn bộ thông tin di truyền và các chương trình cần thiết cho cơ thể hoạt động. Ở các sinh vật nhân thật (eukaryote), 99% genome nằm trong nhân tế bào và phần còn lại nằm trong một số cơ quan tử như ty thể và lạp thể. Đa số genome vi khuẩn và phần genome chứa trong các cơ quan tử thường có kích thước nhỏ và ở dạng vòng khép kín. Ngược lại, phần genome trong nhân thường rất lớn và phân bố trên các nhiễm sắc thể dạng thẳng. Dự án genome là dự án xác định cấu trúc di truyền chính xác của một genome cơ thể sống, nghĩa là trình tự DNA của tất cả các gen của nó. Dự án genome của một số sinh vật mô hình (model organisms) đã được hoàn thành như sau: - Các genome vi khuẩn. Các trình tự hoàn chỉnh của genome Escherichia coli đã được xác định theo phương thức tổ hợp/tập hợp (consortium) của các phòng thí nghiệm. Năm 1995, hai trình tự genome hoàn chỉnh của vi khuẩn Haemophilus influenzae và Mycoplasma genitalium cũng được hoàn thành. Loài M. genitalium có một genome đơn Sinh học phân tử 27 giản (khoảng 580.067 base), do nó dựa vào vật chủ để vận hành nhiều bộ máy trao đổi chất của mình. Loài H. influenzae là một vi khuẩn đặc trưng hơn, và có genome khoảng 1.830.121 base với 1.749 gen. - Chuỗi genome hoàn chỉnh của nấm men Saccharomyces cerevisiae đã được hoàn chỉnh trong năm 1996, nhờ một consortium của các phòng thí nghiệm. Genome của chúng dài 12.146.000 base. - Các dự án genome ở động vật như: chuột, cừu, lợn, giun tròn (Caenorhabditis elegans), ruồi giấm (Drosophila melanogaster), hoặc ở thực vật như: lúa nước, lúa mì, ngô, táo, cúc dại, mà nổi bật nhất trong số đó là dự án genome người cũng đã được thực hiện. Ngày 12. 2. 2001 genome người đã được công bố với khoảng 30.000 gen, ít hơn nhiều so với dự kiến trước đây (hàng trăm ngàn gen), và chỉ gấp hai lần giun tròn hoặc ruồi giấm. Người ta đã xác định hệ gen người giống 98% so với tinh tinh và có đến 99% là giống nhau giữa các dân tộc, các cá thể. Do đó, vấn đề hình thành và phát triển nhân cách, chỉ số thông minh... phải chủ yếu trên cơ sở xã hội và sự rèn luyện của từng người để phát triển tiềm năng sinh học của bản thân. Trình tự genome của những sinh vật mô hình rất có ý nghĩa trong những nghiên cứu của một chuyên ngành khoa học mới đó là genome học (genomics). Dựa vào đây, các nhà sinh học phân tử có thể phân tích cấu trúc, hoạt động và chức năng của các gen, làm sáng tỏ được vai trò của DNA lặp lại, DNA không chứa mã di truyền, DNA nằm giữa các gen... Điều đặc biệt có ý nghĩa là khi so sánh các genome với nhau, có thể hiểu được hoạt động của genome trong các cơ thể sống, mối quan hệ giữa chúng, sự đa dạng sinh học và mức độ tiến hóa. Kết quả bước đầu so sánh genome giữa các loài sinh vật với nhau đã cho thấy có ba đặc điểm nổi bật: 1) các gen phân bố trong genome không theo qui luật, 2) kích thước của genome thay đổi không tỷ lệ thuận (tương quan) với tính phức tạp của loài, 3) số lượng nhiễm sắc thể cũng rất khác nhau ngay giữa những loài rất gần nhau. I. Thành phần và đặc điểm của genome Genome chứa mọi thông tin di truyền đặc trưng cho từng loài, thậm chí cho từng cá thể trong loài. Genome có thể bao gồm các phân tử DNA Sinh học phân tử 28 hoặc RNA. Đối với sinh vật bậc cao, kích thước genome thay đổi từ 109 bp (động vật có vú) đến 1011 bp (thực vật). Khác với tế bào tiền nhân (prokaryote), các gen trong genome của eukaryote thường tồn tại nhiều bản sao và thường bị gián đoạn bởi các đoạn mã mù không mang thông tin di truyền (các intron). Vì vậy, một trong những vấn đề đang được quan tâm là cần phải biết số lượng các gen khác nhau có mặt trong genome cũng như số lượng các gen hoạt động trong từng loại mô, từng giai đoạn phát triển và tỷ lệ các gen so với kích thước genome... 1. Genome của cơ quan tử Hầu hết genome của cơ quan tử, nhưng không phải luôn luôn, có dạng phân tử DNA mạch vòng đơn của một chuỗi duy nhất. Genome của cơ quan tử mã hóa cho một số, không phải tất cả, các protein được tìm thấy trong cơ quan tử. Do có nhiều cơ quan tử trong một tế bào, cho nên có nhiều genome của cơ quan tử trên một tế bào. Mặc dù bản thân genome của cơ quan tử là duy nhất. Nhưng nó cấu tạo gồm một chuỗi lặp lại1 liên quan với mọi chuỗi không lặp lại2 của nhân. Về nguyên tắc, các gen cơ quan tử được phiên mã và dịch mã bởi các cơ quan tử. 1.1. Genome của ty thể DNA ty thể (mitochondrial DNA-mtDNA) là một genome độc lập, thường là mạch vòng, được định vị trong ty thể. - DNA ty thể của tế bào động vật mã hóa đặc trưng cho 13 protein, 2 rRNA và 22 tRNA. - DNA ty thể của nấm men S. cerevisiae dài hơn mtDNA của tế bào động vật năm lần do sự có mặt của các đoạn intron dài. Các genome ty thể có kích thước tổng số rất khác nhau, các tế bào động vật có kích thước genome nhỏ (khoảng 16,5 kb ở động vật có vú) (Hình 2.1). Có khoảng một vài trăm ty thể trên một tế bào. Mỗi ty thể có 1 DNA lặp lại mô tả các chuỗi hiện diện hơn một bản sao trong mỗi genome. 2 DNA không lặp lại chứa các chuỗi duy nhất: chỉ có một bản sao trong genome đơn bội. Sinh học phân tử 29 nhiều bản sao DNA. Số lượng tổng số của DNA ty thể so với DNA nhân là rất nhỏ (<1%). Trong nấm men S. cerevisiae, genome ty thể có kích thước khá lớn (khoảng 80 kb) và khác nhau tùy thuộc vào từng chủng. Có khoảng 22 ty thể trên một tế bào, tương ứng khoảng 4 genome trên một cơ quan tử. Ở những tế bào sinh trưởng, tỷ lệ mtDNA có thể cao hơn (khoảng 18%). Kích thước của genome ty thể ở các loài thực vật là rất khác nhau, tối thiểu khoảng 100 kb. Kích thước lớn của genome đã gây khó khăn cho việc phân lập nguyên vẹn DNA, nhưng bản đồ cắt hạn chế (restriction map) trong một vài loài thực vật đã cho thấy genome ty thể thường là một chuỗi đơn, được cấu tạo như một mạch vòng. Trong mạch vòng này có những chuỗi tương đồng ngắn và sự tái tổ hợp giữa chúng đã sinh ra các phân tử tiểu genome (subgenome) mạch vòng nhỏ hơn, cùng tồn tại với genome “chủ” (master genome) hoàn chỉnh, đã giải thích cho sự phức tạp của các DNA ty thể ở thực vật. Hình 2.1. DNA ty thể của người. Bao gồm 22 gen tRNA, 2 gen rRNA, và 13 vùng mã hóa protein. D-loop 16,6 kb 16S rRNA 12S rRNA ND6 ND4L ND1 ND2 CO1 CO2 ATPase 8 ATPase 6 CO3 ND3 ND4 ND5 Cyt b Các gen tRNA Các vùng mã hóa Hướng của gen, 5’ đến 3’ CO: cytochrome oxidase ND: NADH dehydrogenase Sinh học phân tử 30 Bảng 2.1 tóm tắt sự phân công của các gen trong một số genome ty thể. Tổng số gen mã hóa protein là khá ít, và không tương quan với kích thước của genome. Ty thể động vật có vú sử dụng các genome 16 kb của chúng để mã hóa cho 13 protein, trong khi đó ty thể nấm men S. cerevisiae dùng các genome từ 60-80 kb mã hóa cho khoảng 8 protein. Thực vật với genome ty thể lớn hơn nhiều mã hóa cho nhiều protein hơn. Các intron được tìm thấy trong hầu hết các genome của ty thể, nhưng lại không có trong các genome rất nhỏ của động vật có vú. Hai rRNA chính luôn được mã hóa bởi genome ty thể. Số lượng các tRNA được mã hóa bởi genome ty thể dao động từ không cho đến đầy đủ (25-26 trong ty thể). Nhiều protein ribosome được mã hóa trong genome ty thể của thực vật và sinh vật nguyên sinh, nhưng chỉ có một ít hoặc không có trong genome của nấm và động vật. Bảng 2.1. Các genome ty thể có các gen mã hóa cho các protein, rRNA và tRNA Ty thể mã hóa cho các RNA và protein Loài Kích thước (kb) Các gen mã hóa protein Các gen mã hóa RNA Nấm 19-100 8-14 10-28 Sinh vật nguyên sinh 6-100 3-62 2-29 Thực vật 186-366 27-34 21-30 Động vật 16-17 13 4-24 1.2. Genome của lạp thể DNA lạp thể (chloroplast DNA-ctDNA) cũng là một DNA genome độc lập, thường là mạch vòng, được tìm thấy trong lạp thể của thực vật. - Genome của lạp thể rất khác nhau về kích thước, nhưng đủ lớn để mã hóa cho khoảng 50-100 protein cũng như rRNA và tRNA. Sinh học phân tử 31 - DNA lạp thể dài từ 120-190 kb. Các genome của lạp thể đã được phân tích trình tự cho thấy có khoảng 87-183 gen. Bảng 2.2 mô tả các chức năng được mã hóa bởi genome lạp thể ở cây trồng. Bảng 2.2. Genome của lạp thể ở các cây trồng mã hóa cho 4 rRNA, 30 tRNA và khoảng 60 protein Các lạp thể có hơn 100 gen Các gen - Mã hóa RNA 16S rRNA 23S rRNA 4,5S rRNA 5S rRNA tRNA - Biểu hiện gen Các r-protein RNA polymerase Khác - Các chức năng của lạp thể Rubisco và thylakoids NADH dehydrogenase Nói chung, các đặc điểm của genome lạp thể tương tự ở ty thể, ngoại trừ lạp thể mang nhiều gen hơn. Genome lạp thể mã hóa cho tất cả các loại rRNA và tRNA cần thiết trong tổng hợp protein, và cho khoảng 50 protein, bao gồm cả RNA polymerase và các protein ribosome. Các intron trong lạp thể được chia thành hai nhóm: 1) những intron ở trên các gen tRNA thường (mặc dù không chắc chắn) được định vị trong vòng anticodon, giống như các intron được tìm thấy trong các gen tRNA Sinh học phân tử 32 của nhân nấm men S. cerevisiae; 2) những intron trong các gen mã hóa protein tương tự với các intron của các gen ty thể. Vai trò của lạp thể là thực hiện quá trình quang hợp. Do đó, nhiều gen của nó mã hóa cho các protein của các phức hợp định vị trong các màng thylakoid. Một vài phức hợp protein của lạp thể giống các phức hợp protein của ty thể: có một số tiểu đơn vị được mã hóa bởi genome của cơ quan tử và một số khác được mã hóa bởi genome của nhân. Nhưng các phức hợp còn lại được mã hóa hoàn toàn bởi genome lạp thể. 2. Động học của phản ứng lai DNA Bản chất chung của eukaryotic genome được phản ánh qua động học của sự tái liên kết các DNA (DNA reassociation kinetics) bị biến tính. Sự tái liên kết giữa các chuỗi DNA bổ sung xảy ra nhờ bắt cặp base, ngược lại với quá trình biến tính (denaturation) mà nhờ đó chúng được tách rời (Hình 2.2) để thực hiện sự tái bản hoặc phiên mã. Động học của phản ứng tái liên kết phản ánh sự khác nhau của các chuỗi hiện diện, vì thế phản ứng này có thể được dùng để định lượng các gen và các sản phẩm RNA của chúng. Hình 2.2. DNA có thể biến tính và hồi tính Biến tính DNA sợi đôi DNA sợi đơn Hồi tính DNA được hồi tính Sinh học phân tử 33 Bảng 2.3 mô tả phản ứng tái liên kết. Sự hồi tính của DNA (renaturation) phụ thuộc vào sự va chạm ngẫu nhiên của các chuỗi bổ sung. Phản ứng của các DNA riêng biệt có thể được mô tả bằng các điều kiện cần thiết cho sự hoàn thành một nửa (half-completion). Đây là tích số của C0 t1/2 và được gọi là C0t1/2. Giá trị này tỷ lệ nghịch với hằng số tốc độ. Do C0t1/2 là tích số của nồng độ và thời gian yêu cầu cho một nửa đường, nên một giá trị C0t1/2 lớn hơn dẫn đến một phản ứng chậm hơn. Bảng 2.3. Một phản ứng tái liên kết của DNA được mô tả bởi C0t1/2 Phản ứng lai phụ thuộc vào C0t Tốc độ phản ứng Phản ứng theo phương trình bậc hai 2kC dt dC C là nồng độ của DNA sợi đơn ở thời điểm t. K là hằng số tốc độ tái liên kết. Tiến độ phản ứng Lấy tích phân phương trình tốc độ giữa các giới hạn: nồng độ ban đầu của DNA = C0 ở thời điểm t = 0; nồng độ duy trì sợi đơn = C sau thời gian t tC.1 1 C C 00 k Thông số tới hạn là C0t1/2 Khi phản ứng hoàn thành một nửa ở thời điểm t = ½ 1/200 tC.1 1 2 1 C C k Vì thế C0t1/2 = k 1 tC 1/20 Sinh học phân tử 34 Sự hồi tính của DNA thường có dạng đường cong C0t, đường cong biểu diễn đồ thị phân số của DNA được tái liên kết (1-C/C0) theo log của C0t. Hình 2.3 trình bày đường cong C0t của một số genome đơn giản. Các đường cong có dạng tương tự nhau, nhưng giá trị C0t1/2 của mỗi đường là khác nhau. Các genome trong hình 2.3 đại diện cho các nguồn DNA khác nhau (PolyU:PolyA, thực khuẩn thể MS2, thực khuẩn thể T4 và vi khuẩn E. coli). C0t1/2 liên quan trực tiếp với lượng DNA trong genome. Điều này phản ánh tình trạng khi genome trở nên phức tạp hơn, thì sẽ có thêm một số bản sao của một vài chuỗi đặc biệt trong một lượng DNA có trước. Ví dụ: nếu C0 của DNA là 12 pg, thì nó sẽ chứa khoảng 3.000 bản sao của mỗi trình tự trong genome vi khuẩn. Hình 2.3. C0t1/2 phụ thuộc vào độ phức tạp của genome. PolyU:PolyA, thực khuẩn thể MS2, thực khuẩn thể T4 và vi khuẩn E. coli. 3. Kích thước của genome Không phải tất cả các đoạn DNA trong genome đều tương ứng với các gen (mã hóa cho protein hoặc một sản phẩm cần thiết cho hoạt động sống của tế bào). Từ những năm 1970, bằng các thí nghiệm gây bão hòa đột biến người ta đã có thể xác định được số gen nằm trên một đoạn nhiễm sắc thể. Ngày nay, nhờ các kỹ thuật phân tích DNA và RNA hiện đại (Southern blot, Northern blot, microarray...) các nhà khoa học có thể xác định số gen hoạt Sinh học phân tử 35 động trong một tế bào. Ví dụ: ở tế bào nấm men S. cerevisiae (sinh vật eukaryote bậc thấp) có khoảng 4.000 gen hoạt động, còn tế bào động vật có vú khoảng 10.000-15.000 gen. Như vậy, nếu độ dài trung bình của một gen khoảng 10 kb thì tổng số chiều dài các gen hoạt động trong một tế bào cũng chỉ chiếm 1-2% genome. Hay nói cách khác, chỉ một phần rất nhỏ genome mang thông tin di truyền cần thiết cho hoạt động sống của tế bào. Vậy phần genome còn lại có vai trò gì, và tính phức tạp của loài có liên quan gì với kích thước genome hay không? Để làm sáng tỏ vấn đề trên, chúng ta cần xem xét kích thước genome của một số loài gần nhau trong bậc thang tiến hóa (có độ phức tạp loài tương tự nhau) cũng như genome của những loài xa nhau (có tính phức tạp khác nhau). Chẳng hạn: - Genome của người có kích thước khoảng 3,3 109 bp, trong khi đó genome của những loài lưỡng cư dài khoảng 3,1 109 bp hoặc thực vật có thể lên đến 1011 bp. Như vậy, có phải là các loài lưỡng cư có tính phức tạp tương tự cơ thể chúng ta? - Hay là ngay trong cùng một loại, chúng ta cũng nhận thấy có sự mâu thuẫn về kích thước genome? Ví dụ: ruồi nhà (Musca domestica) có genome khoảng 8,6 108 bp, lớn gấp sáu lần kích thước genome của ruồi giấm khoảng 1,4 108bp. Ngoài ra, trong các loài lưỡng cư kích thước genome của chúng cũng thay đổi khá lớn từ 109-1011 bp. Vì sao ngay trong cùng một loại mà kích thước genome lại biến thiên nhiều như vậy, có phải ruồi nhà có cấu tạo phức tạp hơn nhiều so với ruồi giấm? Từ những dữ liệu trên, chúng ta có thể nhận định rằng tính phức tạp của loài không liên quan đến kích thước của genome. Tuy nhiên, vai trò ... njugation) giữa hai tế bào do cảm ứng sản phẩm gen virB mà thành. Khi T-DNA đã được chuyển giao vào tế bào thực vật, chúng nhanh chóng hợp nhất vào genome tế bào thực vật được ổn định và di truyền như các gen bình thường khác. Sinh học phân tử 49 V. Sắp xếp và khuếch đại các gen trong genome 1. Sắp xếp lại các gen Nói chung, genome có cấu trúc và tổ chức bền vững. DNA của genome thường không bị biến đổi bởi sự phát triển vô tính, nhưng thỉnh thoảng các trình tự của chúng cũng có thể bị chuyển chỗ trong gen, bị cải biến, khuếch đại hoặc thậm chí biến mất, như là một trường hợp tự nhiên. Trao đổi chéo trong phân bào giảm nhiễm là một trong những nguyên nhân gây ra biến đổi của genome. Tuy nhiên, điều này xảy ra chủ yếu trong tế bào sinh dục mà không có trong các tế bào soma. Việc sắp xếp lại genome sẽ dẫn đến những thay đổi sau: - Tạo ra các gen mới cần thiết cho sự biểu hiện trong các trường hợp đặc biệt. - Sự tái sắp xếp có thể đáp ứng cho việc mở hoặc đóng gen. Đây cũng chính là cơ chế của sự điều hòa biểu hiện gen. Một ví dụ điển hình là hiện tượng sắp xếp lại các gen trong genome của nấm men S. cerevisiae và của ký sinh trùng Trypanosome châu Phi khi gây chứng ngủ li bì ở vật chủ. 1.1. Chuyển đổi dạng giao phối của nấm men Nấm men có thể tồn tại ở cả hai dạng đơn bội hoặc lưỡng bội. Các dạng lưỡng bội là dị hợp tử ở trường hợp locus kiểu giao phối, và các tế bào đơn bội có thể hoặc là MATa hoặc MATα. Việc chuyển đổi trạng thái được thông qua giao phối, kết hợp các bào tử đơn bội thành lưỡng bội và qua việc tái tạo giao tử mới. Tuy nhiên, giao phối chỉ xảy ra giữa hai loại tế bào đơn bội a và α. Các tế bào đơn bội cùng loại không thể kết hợp với nhau tạo thành tế bào lưỡng bội. MAT (mating type locus) là vị trí hoạt động hay cassette hoạt động: một vùng đặc biệt của nhiễm sắc thể số 3 chứa các gen qui định dạng giao phối (a và α). Các gen này còn tồn tại ở hai vị trí khác trong genome. Tuy nhiên, ở đó chúng đều bị bất hoạt. Hai vị trí này được gọi là hai vị trí tĩnh (hay cassette tĩnh HML và HMR). Mỗi vị trí tĩnh chỉ mang các gen qui định cho một dạng giao phối. Khi các gen được sao chép từ một vị trí tĩnh vào vị trí hoạt động thì mRNA mới được tổng hợp từ các gen đó. Như vậy, quá Sinh học phân tử 50 trình sao chép quyết định dạng giao phối của nấm. Bản gốc luôn được bảo tồn ở vị trí tĩnh và bản thứ hai xuất hiện ở vị trí hoạt động. Nếu vị trí tĩnh có mang đột biến thì chúng sẽ được sao chép vào vị trí hoạt động. Tuy nhiên, nếu xảy ra đột biến ở cassette MAT thì tính trạng mới xuất hiện không bền. Một khi dạng giao phối chuyển đổi thì các gen cũ ở vị trí MAT bị thay thế bởi bản sao của vị trí tĩnh khác. Lúc đó, đột biến bị loại đi và tính trạng mới sẽ biến mất. So sánh giữa các dạng cùng sợi nấm (homothallic) và khác sợi nấm (heterothallic) người ta nhận thấy dạng heterothallic có gen HO hoạt động và có thể chuyển đổi tự động giữa các kiểu giao phối, và vì thế một bào tử đơn có thể làm tăng quần thể tự phối, trong khi dạng homothallic không có gen HO và duy trì cùng một kiểu giao phối trong suốt chu trình sinh trưởng đơn bội. Phân tích di truyền cho thấy các gen sau đây cần cho việc chuyển đổi kiểu giao phối: - MAT - HO, mã hóa cho enzyme endonuclease - HML (cho MATa chuyển thành MAT ) - HMRa (cho MAT chuyển thành MATa) Trình tự các nucleotide ở vị trí tĩnh và vị trí hoạt động chỉ khác nhau một đoạn ngắn ký hiệu là Ya và Yα (Hình 2.8). Enzyme HO-endonuclease nhận biết vị trí đặc hiệu tại ranh giới phân cách giữa Z và Y và của cassette hoạt động MAT và cắt cả hai sợi DNA tại đó. Điều đặc biệt là enzyme này không cắt DNA khi chúng hiện diện ở cassette tĩnh. Sau khi đoạn Y của vùng MAT bị phân hủy hết, đoạn Y của một trong hai cassette tĩnh được dùng làm khuôn mẫu để sao chép vào vị trí bị phân hủy (Hình 2.8). Nếu đột biến xuất hiện ở vùng MAT (đoạn Y), tính trạng mới chỉ biểu hiện tạm thời. Một khi dạng giao phối chuyển đổi, các gen bình thường được sao chép vào vùng MAT và đột biến bị loại đi. 1.2. Chuyển đổi gen ở Trypanosome Trypanosome có khả năng lẩn tránh được hệ thống miễn dịch của vật chủ thường bằng cách thay đổi kháng nguyên bề mặt (surface antigen) của chúng. Mỗi loại kháng nguyên được tổng hợp nhờ hoạt động của một gen Sinh học phân tử 51 tương ứng tại vị trí hoạt động. Gen này có thể bị thay thế bởi một gen mã hóa cho loại kháng nguyên khác nằm ở một vị trí tĩnh nào đó trong genome. Mỗi vị trí tĩnh chứa một gen ở trạng thái không hoạt động. Gen này chỉ được mở khi chuyển đến vị trí hoạt động. Trong genome của Trypanosome, có rất nhiều vị trí tĩnh nhưng chỉ có một vị trí hoạt động. Hình 2.8. Quá trình chuyển đổi dạng giao phối từ a sang α nhờ trao đổi gen giữa vùng MATa và HMLα trên nhiễm sắc thể số 3 Bình thường, Trypanosome sẽ trải qua một số lần biến đổi hình thái khi được truyền từ ruồi châu Phi sang vật chủ. Bề mặt của tế bào Trypanosome được bao bọc một lớp đơn gồm 5×106 phân tử của một loại glycoprotein (VSG-variable surface glycoprotein). Đây chính là kháng nguyên bề mặt của Trypanosome khi chúng xâm nhập vào vật chủ. Điều đáng chú ý là chúng có khả năng thay đổi kháng nguyên bề mặt, do đó tránh được phản ứng miễn dịch của tế bào vật chủ. Quá trình thay thế kháng nguyên bề mặt phụ thuộc vào sự chuyển đổi các gen mã hóa cho chúng xảy W X Y Z HML MATa Ya Cắt HO Xâm lấn sợi Kéo dài đầu 3’ Chuyển trạng thái Y HML Y MAT Sinh học phân tử 52 ra ở một vị trí đặc biệt trong genome (vị trí hoạt động). Chuyển đổi gen mã hóa kháng nguyên bề mặt nhằm mục đích hoạt hóa gen mã hóa kháng nguyên bề mặt mới thay thế cho kháng nguyên tồn tại trước đó. Khi một gen đang hoạt động bị thay thế bởi một gen khác sẽ tương ứng với việc xuất hiện kháng nguyên mới và loại bỏ kháng nguyên cũ. - Cấu trúc của một VSG ở Trypanosome Cấu trúc chung của một VSG được mô tả trên hình 2.9 và 2.10. Một VSG vừa được tổng hợp dài khoảng 500 amino acid gồm tín hiệu N- terminus, tiếp theo là đoạn peptide quyết định tính kháng nguyên; đoạn peptide bảo thủ giữa các VSG và đuôi kỵ nước. Phân tử này được tổng hợp dưới dạng protein tiền thân (pre-protein). Do đó, chúng phải trải qua biến đổi ở hai đầu NH2 và COOH để trở thành dạng protein hoàn chỉnh (mature form). Dạng này được đính vào màng tế bào ở đầu COOH. Một loại Trypanosome có thể tạo ra ít nhất khoảng 100 VSG từ khi nhiễm cho đến khi gây chết vật chủ. Số gen mã hóa cho VSG có thể nhiều hơn 1.000 gen, tất cả các gen này đều nằm trong genome. Tuy nhiên, tại một thời điểm bất kỳ chỉ có một gen hoạt động tổng hợp nên một loại VSG. Do đó, sự thay đổi kháng nguyên tương ứng với sự thay đổi hoạt động của gen. Khi một gen mới được mở, gen hoạt động trước nó phải bị ức chế hoàn toàn. Lúc đó, một kháng nguyên mới sẽ thay thế kháng nguyên tồn tại trước nó. Hình 2.9 cho thấy chuỗi polypeptide chứa khoảng 500 amino acid. N- terminus chứa một peptide tín hiệu cho sự vận chuyển qua ER (lưới nội sinh chất, endoplasmic reticulum) và tới màng plasma, được tách ra khỏi protein hoàn chỉnh. Vùng biến thiên là khác nhau ở mỗi VSG, điều đó cho thấy các VSG có ít hoặc không có tính đồng nhất. Hướng tới phần C-terminus, chuỗi polypeptide được bảo toàn tốt hơn và phần này được gọi là vùng tương đồng. Đuôi kỵ nước chứa một tín hiệu nhận biết để gắn với mỏ neo glycolipid (glycolipid anchor) (Hình 2.10). Khi mỏ neo được gắn thì 20 amino acid cuối cùng sẽ được tách ra. Glycoprotein biến đổi bề mặt (VSG) được gắn với màng thông qua một mỏ neo glycolipid chứa ethanolamine, một cấu trúc glycan mang một số gốc mannose (mannose moiety), một glucosamine và một phosphoinositol liên kết với 1,2-dimyristoyglycerol có gai trong màng plasma. Gốc glycolipid là yếu tố quyết định phản ứng lai (cross-reacting) Sinh học phân tử 53 (CRD) được nhận biết bằng các kháng thể phản ứng với tất cả dạng biến đổi của VSG, nhưng chỉ khi VSG được phóng thích khỏi màng. Màng liên kết với VSG không được nhận biết bởi các kháng thể anti-CRD. Sự phóng thích VSG được xúc tác bởi hoạt tính của trypanosome-specific phospholipase C được giả định là hiện diện ở mặt bên trong (inner face) của màng plasma. Người ta không biết rằng enzyme có thể cắt liên kết phosphoester trên mặt khác của màng như thế nào. Hình 2.9. Sơ đồ minh họa chuỗi protein của một VSG đặc trưng Hình 2.10. Cấu trúc của mỏ neo glycolipid của VSG - Hoạt động của gen VSG Gen mã hóa cho một VSG được gọi là bản gen gốc (basic copy gene). Các gen này được phân thành hai nhóm tùy thuộc vào vị trí của chúng trên nhiễm sắc thể. Vùng biến thiên Vùng tương đồng 20 360 100 20 Đuôi kỵ nước C-terminus Peptide tín hiệu N-terminus H2N COOH Protein C-terminal amino acid Ethanolamine Glycan Glucosamine Inositol Phospholipase C Màng 1,2-Dimyristoylglycerol Sinh học phân tử 54 + Các gen nằm ở telomere (khoảng 5-15 kb)>200 gen. + Các gen nằm cách telomere hơn 50 kb. Tương tự như ở nấm men, các gen mã hóa cho VSG nằm rải rác trong genome và ở trạng thái không hoạt động. Một gen bất kỳ được hoạt hóa chỉ khi nó được sao chép vào vị trí hoạt động (expression site) trong khi nguyên bản của nó vẫn được bảo tồn ở vị trí tĩnh. Bản sao của bản gen gốc vào vị trí hoạt động được gọi là ELC (bản sao hoạt động-expression linked copy). Vị trí hoạt động nằm ở gần telomere. Như vậy, việc chọn một bản gen gốc để sao chép tạo bản sao hoạt động sẽ phụ thuộc vào vị trí của bản gen gốc ở telomere hoặc nằm phía trong telomere. Có hai giả thiết để một gen trở nên hoạt hóa như sau: - Vị trí hoạt động không thay đổi mà chỉ có các ELC thay thế cho nhau. Bản sao của một bản gen gốc sẽ thay thế cho bản sao của một gen khác ở tại vị trí đó, điều này xảy ra tương tự như các gen ở cassette tĩnh được sao chép vào cassette hoạt động trong trường hợp với nấm men. - Vị trí hoạt động thay đổi, khi cần tổng hợp một VSG mới, gen ở vị trí hoạt động cũ bị ngừng và gen ở một vị trí khác (gần telomere) được khởi động. Một số phân tử mRNA tương ứng với các VSG khác nhau được phân lập và được xác định trình tự nucleotide (thông qua cDNA). Điều ngạc nhiên là phần oligonucleotide ở đầu 3’ của mọi gen VSG đều khác với phần 3’ của các mRNA được phiên mã từ các gen đó. Mặt khác, các gen này không có phần 5’ giống như các mRNA. Như vậy, các mRNA không được tổng hợp hoàn toàn trên khuôn mẫu các gen này. Phần 3’ của các mRNA tương ứng với phần 3’ của vị trí hoạt động ELC, trong khi phần 5’ (gồm 35 nucleotides) được tổng hợp từ những đoạn DNA khác và được gắn vào mRNA (hiện tượng trans-splicing). 2. Khuếch đại các gen Số lượng bản sao của một số gen cũng có thể được tăng lên tạm thời trong quá trình phát triển các tế bào soma. Việc tăng số lượng của một gen đặc biệt nào đó phụ thuộc vào từng điều kiện cụ thể của tế bào và xảy ra không phổ biến. Các bản sao có thể nằm tập trung thành một nhóm gồm bản sao này nối tiếp bản sao khác hoặc có thể tồn tại như những đoạn DNA có khả năng tái bản độc lập. Chẳng hạn: Sinh học phân tử 55 - Sự nhân bản của gen mã hóa cho rRNA ở trứng ếch. Trứng ếch có đường kính khoảng 2-3 mm, dự trữ rất nhiều rRNA. Chúng được phiên mã từ rất nhiều gen rDNA. Các gen này được nhân lên (khoảng 2.000 lần) theo cơ chế “vòng tròn quay” (xem chương 4) trong quá trình phát triển và tồn tại dưới dạng các vòng tròn khép kín. - Khi nuôi cấy các tế bào động vật có vú trong môi trường đặc biệt, DNA tại một số vị trí trong genome được nhân lên. Ví dụ: nuôi cấy các tế bào ung thư trong môi trường chứa độc tố methotrexate. Chất này ức chế hoạt tính của enzyme dihydrofolate reductase (DHFR) giữ vai trò trong tổng hợp các nucleotide của DNA. Các tế bào ung thư nuôi cấy trong môi trường có chất độc này phát triển thành các quần lạc tế bào kháng lại độc tố. Khi nồng độ chất độc tăng dần, nồng độ DHFR cũng tăng theo, có thể đạt tới 1.000 lần lớn hơn mức bình thường. Nồng độ enzyme tăng do số lượng các gen mã hóa cho chúng tăng. Cơ chế chính xác của hiện tượng này chưa rõ ràng, nhưng có thể xảy ra theo hai cách: - Trao đổi chéo không cân bằng giữa hai nhiễm sắc tử (chromatid) của nhiễm sắc thể dẫn đến một số tế bào không có gen dhfr và một số khác có hai bản sao của gen này. Trong môi trường có độc tố, trao đổi chéo không cân bằng được lặp đi lặp lại và các tế bào chứa nhiều gen dhfr vẫn phát triển tốt trong môi trường này. - Các đoạn DNA (100-1.000 kb) chứa 2-4 gen dhfr (~31 kb/gen) được sao chép từ nhiễm sắc thể bình thường tạo ra các nhiễm sắc thể rất nhỏ, không có tâm động. Các nhiễm sắc thể nhỏ này ghép vào các nhiễm sắc thể bình thường khác. Quá trình này lặp đi lặp lại và qua một số lần phân bào nguyên nhiễm, tế bào nào mang số lượng lớn các gen dhfr càng có điều kiện phát triển thuận lợi trong môi trường có chứa độc tố. 3. Biến nạp gen Một phương thức tăng khả năng di truyền là ứng dụng các tương tác vật chủ cộng sinh-ký sinh, trong đó DNA lạ được chuyển vào tế bào vật chủ từ một vi khuẩn. Cơ chế này tương tự với sự tiếp hợp của vi khuẩn. Sự biểu hiện của DNA vi khuẩn trong vật chủ mới của nó sẽ làm thay đổi kiểu hình Sinh học phân tử 56 của tế bào. Ví dụ điển hình là vi khuẩn A. tumefaciens cảm ứng tạo khối u ở tế bào thực vật bị chúng xâm nhiễm. Khi DNA lạ được đưa vào tế bào eukaryote, nó có thể tồn tại ngoài nhiễm sắc thể hoặc được hợp nhất trong genome. Nếu xảy ra theo trường hợp thứ hai, genome sẽ mang những đột biến di truyền và nhiều khi DNA lạ vẫn tiếp tục hoạt động làm xuất hiện các tính trạng mới. Việc đưa các gen lạ vào tế bào soma hoặc tế bào sinh dục mà vẫn duy trì hoạt động của những gen đó được gọi là chuyển nhiễm (transfection). Cá thể biểu hiện tính trạng mới nhờ hoạt động của gen lạ đưa vào tế bào sinh dục được gọi là cá thể chuyển gen. Quá trình này có thể làm thay đổi sự ổn định của genome. DNA sau khi được tiêm vào trong các tế bào trứng động vật có thể được hợp nhất trong genome và truyền cho thế hệ sau như một thành phần di truyền bình thường. Khả năng đưa một gen chức năng đặc trưng có thể trở thành một kỹ thuật y học sử dụng cho việc chữa bệnh di truyền. Tài liệu tham khảo/đọc thêm 1. Võ Thị Thương Lan. 2002. Sinh học phân tử. NXB Đại học Quốc gia Hà Nội, Hà Nội. 2. Alberts B, Bray D, Lewis J, Raff M, Roberts K and Watson JD. 2002. Molecular Biology of the Cell. 3 rd ed. Garland Publishing, Inc. New York, USA. 3. Cantor CR and Smith CL. 1999. Genomics. John Wiley & Sons, Inc. New York, USA. 4. Dale JW and Von Schanzt M. 2002. From Gene to Genome. John Wiley & Sons, Ltd. West Sussex, UK. 5. Lewin B. 2000. Gene VII. Oxford University Press, Oxford, UK. 6. Lodish H, Berk A, Matsudaira P, Kaiser CA, Krieger M, Scott MP, Zipursky SL and Darnell J. 2004. Molecular Cell Biology. 5 th ed. WH Freeman and Company, New York, USA. 7. Watson JD, Baker TA, Bell SP, Gann A, Levine M and Loscik R. 2004. Molecular Biology of the Gene. The Benjamin Cummings/Cold Spring Habor Laboratory Press, San Francisco, CA, USA. 8. Weaver RF. 2003. Molecular Biology. 2 nd ed. McGraw-Hill Company Inc. New York, USA.
File đính kèm:
- giao_trinh_sinh_hoc_phan_tu_chuong_2_cau_truc_genome.pdf