Giáo trình Sinh học phân tử - Chương 2: Cấu trúc genome

Genome (hệ gen, bộ gen) là thuật ngữ được dùng với các nghĩa khác

nhau như sau:

- Nguyên liệu di truyền của một cơ thể: 1) nhiễm sắc thể trong tế bào

vi khuẩn (hoặc một trong mỗi loại nhiễm sắc thể nếu hơn một loại có mặt, ví

dụ: các nhiễm sắc thể lớn hoặc bé của Vibrio cholerae), 2) DNA hoặc RNA

trong một virion, 3) nhiễm sắc thể cùng với mọi plasmid được kết hợp (ví

dụ: nhiễm sắc thể và hai plasmid nhỏ trong vi khuẩn Buchnera).

- Tất cả các gen (khác nhau) trong tế bào hoặc virion.

- Bộ nhiễm sắc thể đơn bội hoặc genome đơn bội trong tế bào.

pdf 31 trang kimcuc 10040
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Sinh học phân tử - Chương 2: Cấu trúc genome", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Giáo trình Sinh học phân tử - Chương 2: Cấu trúc genome

Giáo trình Sinh học phân tử - Chương 2: Cấu trúc genome
 Sinh học phân tử 26 
Chương 2 
Cấu trúc genome 
Genome (hệ gen, bộ gen) là thuật ngữ được dùng với các nghĩa khác 
nhau như sau: 
- Nguyên liệu di truyền của một cơ thể: 1) nhiễm sắc thể trong tế bào 
vi khuẩn (hoặc một trong mỗi loại nhiễm sắc thể nếu hơn một loại có mặt, ví 
dụ: các nhiễm sắc thể lớn hoặc bé của Vibrio cholerae), 2) DNA hoặc RNA 
trong một virion, 3) nhiễm sắc thể cùng với mọi plasmid được kết hợp (ví 
dụ: nhiễm sắc thể và hai plasmid nhỏ trong vi khuẩn Buchnera). 
- Tất cả các gen (khác nhau) trong tế bào hoặc virion. 
- Bộ nhiễm sắc thể đơn bội hoặc genome đơn bội trong tế bào. 
Chuỗi genome hoàn chỉnh (nghĩa là trình tự hoàn chỉnh của các 
nucleotide trong genome) đã được công bố cho một số loài vi khuẩn. Các 
trình tự khác cũng đã được công bố, ví dụ genome của cây cúc dại 
(Arabidopsis thaliana) và genome người. 
Genome chứa toàn bộ thông tin di truyền và các chương trình cần thiết 
cho cơ thể hoạt động. Ở các sinh vật nhân thật (eukaryote), 99% genome 
nằm trong nhân tế bào và phần còn lại nằm trong một số cơ quan tử như ty 
thể và lạp thể. Đa số genome vi khuẩn và phần genome chứa trong các cơ 
quan tử thường có kích thước nhỏ và ở dạng vòng khép kín. Ngược lại, phần 
genome trong nhân thường rất lớn và phân bố trên các nhiễm sắc thể dạng 
thẳng. 
Dự án genome là dự án xác định cấu trúc di truyền chính xác của một 
genome cơ thể sống, nghĩa là trình tự DNA của tất cả các gen của nó. Dự án 
genome của một số sinh vật mô hình (model organisms) đã được hoàn thành 
như sau: 
- Các genome vi khuẩn. Các trình tự hoàn chỉnh của genome 
Escherichia coli đã được xác định theo phương thức tổ hợp/tập hợp 
(consortium) của các phòng thí nghiệm. Năm 1995, hai trình tự genome 
hoàn chỉnh của vi khuẩn Haemophilus influenzae và Mycoplasma 
genitalium cũng được hoàn thành. Loài M. genitalium có một genome đơn 
 Sinh học phân tử 27 
giản (khoảng 580.067 base), do nó dựa vào vật chủ để vận hành nhiều bộ 
máy trao đổi chất của mình. Loài H. influenzae là một vi khuẩn đặc trưng 
hơn, và có genome khoảng 1.830.121 base với 1.749 gen. 
- Chuỗi genome hoàn chỉnh của nấm men Saccharomyces cerevisiae 
đã được hoàn chỉnh trong năm 1996, nhờ một consortium của các phòng thí 
nghiệm. Genome của chúng dài 12.146.000 base. 
- Các dự án genome ở động vật như: chuột, cừu, lợn, giun tròn 
(Caenorhabditis elegans), ruồi giấm (Drosophila melanogaster), hoặc ở 
thực vật như: lúa nước, lúa mì, ngô, táo, cúc dại, mà nổi bật nhất trong số 
đó là dự án genome người cũng đã được thực hiện. 
Ngày 12. 2. 2001 genome người đã được công bố với khoảng 30.000 
gen, ít hơn nhiều so với dự kiến trước đây (hàng trăm ngàn gen), và chỉ gấp 
hai lần giun tròn hoặc ruồi giấm. Người ta đã xác định hệ gen người giống 
98% so với tinh tinh và có đến 99% là giống nhau giữa các dân tộc, các cá 
thể. Do đó, vấn đề hình thành và phát triển nhân cách, chỉ số thông minh... 
phải chủ yếu trên cơ sở xã hội và sự rèn luyện của từng người để phát triển 
tiềm năng sinh học của bản thân. 
Trình tự genome của những sinh vật mô hình rất có ý nghĩa trong 
những nghiên cứu của một chuyên ngành khoa học mới đó là genome học 
(genomics). Dựa vào đây, các nhà sinh học phân tử có thể phân tích cấu 
trúc, hoạt động và chức năng của các gen, làm sáng tỏ được vai trò của 
DNA lặp lại, DNA không chứa mã di truyền, DNA nằm giữa các gen... Điều 
đặc biệt có ý nghĩa là khi so sánh các genome với nhau, có thể hiểu được 
hoạt động của genome trong các cơ thể sống, mối quan hệ giữa chúng, sự đa 
dạng sinh học và mức độ tiến hóa. 
Kết quả bước đầu so sánh genome giữa các loài sinh vật với nhau đã 
cho thấy có ba đặc điểm nổi bật: 1) các gen phân bố trong genome không 
theo qui luật, 2) kích thước của genome thay đổi không tỷ lệ thuận (tương 
quan) với tính phức tạp của loài, 3) số lượng nhiễm sắc thể cũng rất khác 
nhau ngay giữa những loài rất gần nhau. 
I. Thành phần và đặc điểm của genome 
Genome chứa mọi thông tin di truyền đặc trưng cho từng loài, thậm 
chí cho từng cá thể trong loài. Genome có thể bao gồm các phân tử DNA 
 Sinh học phân tử 28 
hoặc RNA. Đối với sinh vật bậc cao, kích thước genome thay đổi từ 109 bp 
(động vật có vú) đến 1011 bp (thực vật). Khác với tế bào tiền nhân 
(prokaryote), các gen trong genome của eukaryote thường tồn tại nhiều bản 
sao và thường bị gián đoạn bởi các đoạn mã mù không mang thông tin di 
truyền (các intron). Vì vậy, một trong những vấn đề đang được quan tâm là 
cần phải biết số lượng các gen khác nhau có mặt trong genome cũng như số 
lượng các gen hoạt động trong từng loại mô, từng giai đoạn phát triển và tỷ 
lệ các gen so với kích thước genome... 
1. Genome của cơ quan tử 
Hầu hết genome của cơ quan tử, nhưng không phải luôn luôn, có dạng 
phân tử DNA mạch vòng đơn của một chuỗi duy nhất. 
Genome của cơ quan tử mã hóa cho một số, không phải tất cả, các 
protein được tìm thấy trong cơ quan tử. Do có nhiều cơ quan tử trong một tế 
bào, cho nên có nhiều genome của cơ quan tử trên một tế bào. Mặc dù bản 
thân genome của cơ quan tử là duy nhất. Nhưng nó cấu tạo gồm một chuỗi 
lặp lại1 liên quan với mọi chuỗi không lặp lại2 của nhân. Về nguyên tắc, các 
gen cơ quan tử được phiên mã và dịch mã bởi các cơ quan tử. 
1.1. Genome của ty thể 
DNA ty thể (mitochondrial DNA-mtDNA) là một genome độc lập, 
thường là mạch vòng, được định vị trong ty thể. 
- DNA ty thể của tế bào động vật mã hóa đặc trưng cho 13 protein, 2 
rRNA và 22 tRNA. 
- DNA ty thể của nấm men S. cerevisiae dài hơn mtDNA của tế bào 
động vật năm lần do sự có mặt của các đoạn intron dài. 
Các genome ty thể có kích thước tổng số rất khác nhau, các tế bào 
động vật có kích thước genome nhỏ (khoảng 16,5 kb ở động vật có vú) 
(Hình 2.1). Có khoảng một vài trăm ty thể trên một tế bào. Mỗi ty thể có 
1
 DNA lặp lại mô tả các chuỗi hiện diện hơn một bản sao trong mỗi genome. 
2
 DNA không lặp lại chứa các chuỗi duy nhất: chỉ có một bản sao trong genome 
đơn bội. 
 Sinh học phân tử 29 
nhiều bản sao DNA. Số lượng tổng số của DNA ty thể so với DNA nhân là 
rất nhỏ (<1%). 
Trong nấm men S. cerevisiae, genome ty thể có kích thước khá lớn 
(khoảng 80 kb) và khác nhau tùy thuộc vào từng chủng. Có khoảng 22 ty thể 
trên một tế bào, tương ứng khoảng 4 genome trên một cơ quan tử. Ở những 
tế bào sinh trưởng, tỷ lệ mtDNA có thể cao hơn (khoảng 18%). 
Kích thước của genome ty thể ở các loài thực vật là rất khác nhau, tối 
thiểu khoảng 100 kb. Kích thước lớn của genome đã gây khó khăn cho việc 
phân lập nguyên vẹn DNA, nhưng bản đồ cắt hạn chế (restriction map) 
trong một vài loài thực vật đã cho thấy genome ty thể thường là một chuỗi 
đơn, được cấu tạo như một mạch vòng. Trong mạch vòng này có những 
chuỗi tương đồng ngắn và sự tái tổ hợp giữa chúng đã sinh ra các phân tử 
tiểu genome (subgenome) mạch vòng nhỏ hơn, cùng tồn tại với genome 
“chủ” (master genome) hoàn chỉnh, đã giải thích cho sự phức tạp của các 
DNA ty thể ở thực vật. 
Hình 2.1. DNA ty thể của người. Bao gồm 22 gen tRNA, 2 gen rRNA, và 13 
vùng mã hóa protein. 
D-loop 
16,6 kb 
16S rRNA 
12S rRNA ND6 
ND4L 
ND1 
ND2 
CO1 CO2 
ATPase 8 
ATPase 6 
CO3 
ND3 
ND4 
ND5 
Cyt b 
Các gen tRNA 
Các vùng mã hóa 
Hướng của gen, 5’ đến 3’ 
CO: cytochrome oxidase 
ND: NADH dehydrogenase 
 Sinh học phân tử 30 
Bảng 2.1 tóm tắt sự phân công của các gen trong một số genome ty 
thể. Tổng số gen mã hóa protein là khá ít, và không tương quan với kích 
thước của genome. Ty thể động vật có vú sử dụng các genome 16 kb của 
chúng để mã hóa cho 13 protein, trong khi đó ty thể nấm men S. cerevisiae 
dùng các genome từ 60-80 kb mã hóa cho khoảng 8 protein. Thực vật với 
genome ty thể lớn hơn nhiều mã hóa cho nhiều protein hơn. Các intron được 
tìm thấy trong hầu hết các genome của ty thể, nhưng lại không có trong các 
genome rất nhỏ của động vật có vú. 
Hai rRNA chính luôn được mã hóa bởi genome ty thể. Số lượng các 
tRNA được mã hóa bởi genome ty thể dao động từ không cho đến đầy đủ 
(25-26 trong ty thể). Nhiều protein ribosome được mã hóa trong genome ty 
thể của thực vật và sinh vật nguyên sinh, nhưng chỉ có một ít hoặc không có 
trong genome của nấm và động vật. 
Bảng 2.1. Các genome ty thể có các gen mã hóa cho các protein, rRNA và 
tRNA 
Ty thể mã hóa cho các RNA và protein 
Loài Kích thước 
(kb) 
Các gen mã 
hóa protein 
Các gen mã 
hóa RNA 
Nấm 19-100 8-14 10-28 
Sinh vật nguyên sinh 6-100 3-62 2-29 
Thực vật 186-366 27-34 21-30 
Động vật 16-17 13 4-24 
1.2. Genome của lạp thể 
DNA lạp thể (chloroplast DNA-ctDNA) cũng là một DNA genome 
độc lập, thường là mạch vòng, được tìm thấy trong lạp thể của thực vật. 
- Genome của lạp thể rất khác nhau về kích thước, nhưng đủ lớn để 
mã hóa cho khoảng 50-100 protein cũng như rRNA và tRNA. 
 Sinh học phân tử 31 
- DNA lạp thể dài từ 120-190 kb. Các genome của lạp thể đã được 
phân tích trình tự cho thấy có khoảng 87-183 gen. Bảng 2.2 mô tả các chức 
năng được mã hóa bởi genome lạp thể ở cây trồng. 
Bảng 2.2. Genome của lạp thể ở các cây trồng mã hóa cho 4 rRNA, 30 tRNA 
và khoảng 60 protein 
Các lạp thể có hơn 100 gen 
Các gen 
- Mã hóa RNA 
16S rRNA 
23S rRNA 
4,5S rRNA 
5S rRNA 
tRNA 
- Biểu hiện gen 
Các r-protein 
RNA polymerase 
Khác 
- Các chức năng của lạp thể 
Rubisco và thylakoids 
NADH dehydrogenase 
Nói chung, các đặc điểm của genome lạp thể tương tự ở ty thể, ngoại 
trừ lạp thể mang nhiều gen hơn. Genome lạp thể mã hóa cho tất cả các loại 
rRNA và tRNA cần thiết trong tổng hợp protein, và cho khoảng 50 protein, 
bao gồm cả RNA polymerase và các protein ribosome. 
Các intron trong lạp thể được chia thành hai nhóm: 1) những intron ở 
trên các gen tRNA thường (mặc dù không chắc chắn) được định vị trong 
vòng anticodon, giống như các intron được tìm thấy trong các gen tRNA 
 Sinh học phân tử 32 
của nhân nấm men S. cerevisiae; 2) những intron trong các gen mã hóa 
protein tương tự với các intron của các gen ty thể. 
Vai trò của lạp thể là thực hiện quá trình quang hợp. Do đó, nhiều gen 
của nó mã hóa cho các protein của các phức hợp định vị trong các màng 
thylakoid. Một vài phức hợp protein của lạp thể giống các phức hợp protein 
của ty thể: có một số tiểu đơn vị được mã hóa bởi genome của cơ quan tử và 
một số khác được mã hóa bởi genome của nhân. Nhưng các phức hợp còn 
lại được mã hóa hoàn toàn bởi genome lạp thể. 
2. Động học của phản ứng lai DNA 
Bản chất chung của eukaryotic genome được phản ánh qua động học 
của sự tái liên kết các DNA (DNA reassociation kinetics) bị biến tính. Sự tái 
liên kết giữa các chuỗi DNA bổ sung xảy ra nhờ bắt cặp base, ngược lại với 
quá trình biến tính (denaturation) mà nhờ đó chúng được tách rời (Hình 2.2) 
để thực hiện sự tái bản hoặc phiên mã. Động học của phản ứng tái liên kết 
phản ánh sự khác nhau của các chuỗi hiện diện, vì thế phản ứng này có thể 
được dùng để định lượng các gen và các sản phẩm RNA của chúng. 
Hình 2.2. DNA có thể biến tính và hồi tính 
Biến tính 
DNA sợi đôi 
DNA sợi đơn 
Hồi tính 
DNA được hồi tính 
 Sinh học phân tử 33 
Bảng 2.3 mô tả phản ứng tái liên kết. Sự hồi tính của DNA 
(renaturation) phụ thuộc vào sự va chạm ngẫu nhiên của các chuỗi bổ sung. 
Phản ứng của các DNA riêng biệt có thể được mô tả bằng các điều kiện cần 
thiết cho sự hoàn thành một nửa (half-completion). Đây là tích số của 
C0 t1/2 và được gọi là C0t1/2. Giá trị này tỷ lệ nghịch với hằng số tốc độ. Do 
C0t1/2 là tích số của nồng độ và thời gian yêu cầu cho một nửa đường, nên 
một giá trị C0t1/2 lớn hơn dẫn đến một phản ứng chậm hơn. 
Bảng 2.3. Một phản ứng tái liên kết của DNA được mô tả bởi C0t1/2 
Phản ứng lai phụ thuộc vào C0t 
Tốc độ phản ứng 
Phản ứng theo phương trình bậc hai 
2kC
dt
dC
C là nồng độ của DNA sợi đơn ở thời điểm t. 
K là hằng số tốc độ tái liên kết. 
Tiến độ phản ứng 
Lấy tích phân phương trình tốc độ giữa các giới hạn: nồng độ 
ban đầu của DNA = C0 ở thời điểm t = 0; nồng độ duy trì sợi 
đơn = C sau thời gian t 
tC.1
1
C
C
00 k
Thông số tới hạn là C0t1/2 
Khi phản ứng hoàn thành một nửa ở thời điểm t = ½ 
1/200 tC.1
1
2
1
C
C
k
Vì thế C0t1/2 =
k
1
tC 1/20 
 Sinh học phân tử 34 
Sự hồi tính của DNA thường có dạng đường cong C0t, đường cong 
biểu diễn đồ thị phân số của DNA được tái liên kết (1-C/C0) theo log của 
C0t. Hình 2.3 trình bày đường cong C0t của một số genome đơn giản. Các 
đường cong có dạng tương tự nhau, nhưng giá trị C0t1/2 của mỗi đường là 
khác nhau. 
Các genome trong hình 2.3 đại diện cho các nguồn DNA khác nhau 
(PolyU:PolyA, thực khuẩn thể MS2, thực khuẩn thể T4 và vi khuẩn E. coli). 
C0t1/2 liên quan trực tiếp với lượng DNA trong genome. Điều này phản ánh 
tình trạng khi genome trở nên phức tạp hơn, thì sẽ có thêm một số bản sao 
của một vài chuỗi đặc biệt trong một lượng DNA có trước. Ví dụ: nếu C0 
của DNA là 12 pg, thì nó sẽ chứa khoảng 3.000 bản sao của mỗi trình tự 
trong genome vi khuẩn. 
Hình 2.3. C0t1/2 phụ thuộc vào độ phức tạp của genome. PolyU:PolyA, thực 
khuẩn thể MS2, thực khuẩn thể T4 và vi khuẩn E. coli. 
3. Kích thước của genome 
Không phải tất cả các đoạn DNA trong genome đều tương ứng với các 
gen (mã hóa cho protein hoặc một sản phẩm cần thiết cho hoạt động sống 
của tế bào). Từ những năm 1970, bằng các thí nghiệm gây bão hòa đột biến 
người ta đã có thể xác định được số gen nằm trên một đoạn nhiễm sắc thể. 
Ngày nay, nhờ các kỹ thuật phân tích DNA và RNA hiện đại (Southern blot, 
Northern blot, microarray...) các nhà khoa học có thể xác định số gen hoạt 
 Sinh học phân tử 35 
động trong một tế bào. Ví dụ: ở tế bào nấm men S. cerevisiae (sinh vật 
eukaryote bậc thấp) có khoảng 4.000 gen hoạt động, còn tế bào động vật có 
vú khoảng 10.000-15.000 gen. Như vậy, nếu độ dài trung bình của một gen 
khoảng 10 kb thì tổng số chiều dài các gen hoạt động trong một tế bào cũng 
chỉ chiếm 1-2% genome. Hay nói cách khác, chỉ một phần rất nhỏ genome 
mang thông tin di truyền cần thiết cho hoạt động sống của tế bào. Vậy phần 
genome còn lại có vai trò gì, và tính phức tạp của loài có liên quan gì với 
kích thước genome hay không? 
Để làm sáng tỏ vấn đề trên, chúng ta cần xem xét kích thước genome 
của một số loài gần nhau trong bậc thang tiến hóa (có độ phức tạp loài 
tương tự nhau) cũng như genome của những loài xa nhau (có tính phức tạp 
khác nhau). Chẳng hạn: 
- Genome của người có kích thước khoảng 3,3 109 bp, trong khi đó 
genome của những loài lưỡng cư dài khoảng 3,1 109 bp hoặc thực vật có 
thể lên đến 1011 bp. Như vậy, có phải là các loài lưỡng cư có tính phức tạp 
tương tự cơ thể chúng ta? 
- Hay là ngay trong cùng một loại, chúng ta cũng nhận thấy có sự mâu 
thuẫn về kích thước genome? Ví dụ: ruồi nhà (Musca domestica) có genome 
khoảng 8,6 108 bp, lớn gấp sáu lần kích thước genome của ruồi giấm 
khoảng 1,4 108bp. Ngoài ra, trong các loài lưỡng cư kích thước genome của 
chúng cũng thay đổi khá lớn từ 109-1011 bp. Vì sao ngay trong cùng một loại 
mà kích thước genome lại biến thiên nhiều như vậy, có phải ruồi nhà có cấu 
tạo phức tạp hơn nhiều so với ruồi giấm? 
Từ những dữ liệu trên, chúng ta có thể nhận định rằng tính phức tạp 
của loài không liên quan đến kích thước của genome. Tuy nhiên, vai trò  ... njugation) giữa hai tế bào do cảm ứng sản phẩm gen virB mà thành. Khi 
T-DNA đã được chuyển giao vào tế bào thực vật, chúng nhanh chóng hợp 
nhất vào genome tế bào thực vật được ổn định và di truyền như các gen bình 
thường khác. 
 Sinh học phân tử 49 
V. Sắp xếp và khuếch đại các gen trong genome 
1. Sắp xếp lại các gen 
Nói chung, genome có cấu trúc và tổ chức bền vững. DNA của 
genome thường không bị biến đổi bởi sự phát triển vô tính, nhưng thỉnh 
thoảng các trình tự của chúng cũng có thể bị chuyển chỗ trong gen, bị cải 
biến, khuếch đại hoặc thậm chí biến mất, như là một trường hợp tự nhiên. 
Trao đổi chéo trong phân bào giảm nhiễm là một trong những nguyên 
nhân gây ra biến đổi của genome. Tuy nhiên, điều này xảy ra chủ yếu trong 
tế bào sinh dục mà không có trong các tế bào soma. Việc sắp xếp lại 
genome sẽ dẫn đến những thay đổi sau: 
- Tạo ra các gen mới cần thiết cho sự biểu hiện trong các trường hợp 
đặc biệt. 
- Sự tái sắp xếp có thể đáp ứng cho việc mở hoặc đóng gen. Đây cũng 
chính là cơ chế của sự điều hòa biểu hiện gen. 
Một ví dụ điển hình là hiện tượng sắp xếp lại các gen trong genome 
của nấm men S. cerevisiae và của ký sinh trùng Trypanosome châu Phi khi 
gây chứng ngủ li bì ở vật chủ. 
1.1. Chuyển đổi dạng giao phối của nấm men 
Nấm men có thể tồn tại ở cả hai dạng đơn bội hoặc lưỡng bội. Các 
dạng lưỡng bội là dị hợp tử ở trường hợp locus kiểu giao phối, và các tế bào 
đơn bội có thể hoặc là MATa hoặc MATα. Việc chuyển đổi trạng thái được 
thông qua giao phối, kết hợp các bào tử đơn bội thành lưỡng bội và qua việc 
tái tạo giao tử mới. Tuy nhiên, giao phối chỉ xảy ra giữa hai loại tế bào đơn 
bội a và α. Các tế bào đơn bội cùng loại không thể kết hợp với nhau tạo 
thành tế bào lưỡng bội. 
MAT (mating type locus) là vị trí hoạt động hay cassette hoạt động: 
một vùng đặc biệt của nhiễm sắc thể số 3 chứa các gen qui định dạng giao 
phối (a và α). Các gen này còn tồn tại ở hai vị trí khác trong genome. Tuy 
nhiên, ở đó chúng đều bị bất hoạt. Hai vị trí này được gọi là hai vị trí tĩnh 
(hay cassette tĩnh HML và HMR). Mỗi vị trí tĩnh chỉ mang các gen qui định 
cho một dạng giao phối. Khi các gen được sao chép từ một vị trí tĩnh vào vị 
trí hoạt động thì mRNA mới được tổng hợp từ các gen đó. Như vậy, quá 
 Sinh học phân tử 50 
trình sao chép quyết định dạng giao phối của nấm. Bản gốc luôn được bảo 
tồn ở vị trí tĩnh và bản thứ hai xuất hiện ở vị trí hoạt động. 
Nếu vị trí tĩnh có mang đột biến thì chúng sẽ được sao chép vào vị trí 
hoạt động. Tuy nhiên, nếu xảy ra đột biến ở cassette MAT thì tính trạng mới 
xuất hiện không bền. Một khi dạng giao phối chuyển đổi thì các gen cũ ở vị 
trí MAT bị thay thế bởi bản sao của vị trí tĩnh khác. Lúc đó, đột biến bị loại 
đi và tính trạng mới sẽ biến mất. 
So sánh giữa các dạng cùng sợi nấm (homothallic) và khác sợi nấm 
(heterothallic) người ta nhận thấy dạng heterothallic có gen HO hoạt động 
và có thể chuyển đổi tự động giữa các kiểu giao phối, và vì thế một bào tử 
đơn có thể làm tăng quần thể tự phối, trong khi dạng homothallic không có 
gen HO và duy trì cùng một kiểu giao phối trong suốt chu trình sinh trưởng 
đơn bội. 
Phân tích di truyền cho thấy các gen sau đây cần cho việc chuyển đổi 
kiểu giao phối: 
- MAT 
- HO, mã hóa cho enzyme endonuclease 
- HML (cho MATa chuyển thành MAT ) 
- HMRa (cho MAT chuyển thành MATa) 
Trình tự các nucleotide ở vị trí tĩnh và vị trí hoạt động chỉ khác nhau 
một đoạn ngắn ký hiệu là Ya và Yα (Hình 2.8). Enzyme HO-endonuclease 
nhận biết vị trí đặc hiệu tại ranh giới phân cách giữa Z và Y và của cassette 
hoạt động MAT và cắt cả hai sợi DNA tại đó. Điều đặc biệt là enzyme này 
không cắt DNA khi chúng hiện diện ở cassette tĩnh. 
Sau khi đoạn Y của vùng MAT bị phân hủy hết, đoạn Y của một trong 
hai cassette tĩnh được dùng làm khuôn mẫu để sao chép vào vị trí bị phân 
hủy (Hình 2.8). Nếu đột biến xuất hiện ở vùng MAT (đoạn Y), tính trạng 
mới chỉ biểu hiện tạm thời. Một khi dạng giao phối chuyển đổi, các gen bình 
thường được sao chép vào vùng MAT và đột biến bị loại đi. 
1.2. Chuyển đổi gen ở Trypanosome 
Trypanosome có khả năng lẩn tránh được hệ thống miễn dịch của vật 
chủ thường bằng cách thay đổi kháng nguyên bề mặt (surface antigen) của 
chúng. Mỗi loại kháng nguyên được tổng hợp nhờ hoạt động của một gen 
 Sinh học phân tử 51 
tương ứng tại vị trí hoạt động. Gen này có thể bị thay thế bởi một gen mã 
hóa cho loại kháng nguyên khác nằm ở một vị trí tĩnh nào đó trong genome. 
Mỗi vị trí tĩnh chứa một gen ở trạng thái không hoạt động. Gen này chỉ 
được mở khi chuyển đến vị trí hoạt động. Trong genome của Trypanosome, 
có rất nhiều vị trí tĩnh nhưng chỉ có một vị trí hoạt động. 
Hình 2.8. Quá trình chuyển đổi dạng giao phối từ a sang α nhờ trao đổi gen 
giữa vùng MATa và HMLα trên nhiễm sắc thể số 3 
Bình thường, Trypanosome sẽ trải qua một số lần biến đổi hình thái 
khi được truyền từ ruồi châu Phi sang vật chủ. Bề mặt của tế bào 
Trypanosome được bao bọc một lớp đơn gồm 5×106 phân tử của một loại 
glycoprotein (VSG-variable surface glycoprotein). Đây chính là kháng 
nguyên bề mặt của Trypanosome khi chúng xâm nhập vào vật chủ. Điều 
đáng chú ý là chúng có khả năng thay đổi kháng nguyên bề mặt, do đó tránh 
được phản ứng miễn dịch của tế bào vật chủ. Quá trình thay thế kháng 
nguyên bề mặt phụ thuộc vào sự chuyển đổi các gen mã hóa cho chúng xảy 
 W X Y Z HML 
MATa 
Ya Cắt HO 
Xâm lấn sợi 
Kéo dài đầu 3’ 
Chuyển trạng thái 
Y HML 
Y MAT 
 Sinh học phân tử 52 
ra ở một vị trí đặc biệt trong genome (vị trí hoạt động). Chuyển đổi gen mã 
hóa kháng nguyên bề mặt nhằm mục đích hoạt hóa gen mã hóa kháng 
nguyên bề mặt mới thay thế cho kháng nguyên tồn tại trước đó. Khi một gen 
đang hoạt động bị thay thế bởi một gen khác sẽ tương ứng với việc xuất 
hiện kháng nguyên mới và loại bỏ kháng nguyên cũ. 
- Cấu trúc của một VSG ở Trypanosome 
Cấu trúc chung của một VSG được mô tả trên hình 2.9 và 2.10. Một 
VSG vừa được tổng hợp dài khoảng 500 amino acid gồm tín hiệu N-
terminus, tiếp theo là đoạn peptide quyết định tính kháng nguyên; đoạn 
peptide bảo thủ giữa các VSG và đuôi kỵ nước. Phân tử này được tổng hợp 
dưới dạng protein tiền thân (pre-protein). Do đó, chúng phải trải qua biến 
đổi ở hai đầu NH2 và COOH để trở thành dạng protein hoàn chỉnh (mature 
form). Dạng này được đính vào màng tế bào ở đầu COOH. 
Một loại Trypanosome có thể tạo ra ít nhất khoảng 100 VSG từ khi 
nhiễm cho đến khi gây chết vật chủ. Số gen mã hóa cho VSG có thể nhiều 
hơn 1.000 gen, tất cả các gen này đều nằm trong genome. Tuy nhiên, tại một 
thời điểm bất kỳ chỉ có một gen hoạt động tổng hợp nên một loại VSG. Do 
đó, sự thay đổi kháng nguyên tương ứng với sự thay đổi hoạt động của gen. 
Khi một gen mới được mở, gen hoạt động trước nó phải bị ức chế hoàn 
toàn. Lúc đó, một kháng nguyên mới sẽ thay thế kháng nguyên tồn tại trước 
nó. 
Hình 2.9 cho thấy chuỗi polypeptide chứa khoảng 500 amino acid. N-
terminus chứa một peptide tín hiệu cho sự vận chuyển qua ER (lưới nội sinh 
chất, endoplasmic reticulum) và tới màng plasma, được tách ra khỏi protein 
hoàn chỉnh. Vùng biến thiên là khác nhau ở mỗi VSG, điều đó cho thấy các 
VSG có ít hoặc không có tính đồng nhất. Hướng tới phần C-terminus, chuỗi 
polypeptide được bảo toàn tốt hơn và phần này được gọi là vùng tương 
đồng. Đuôi kỵ nước chứa một tín hiệu nhận biết để gắn với mỏ neo 
glycolipid (glycolipid anchor) (Hình 2.10). Khi mỏ neo được gắn thì 20 
amino acid cuối cùng sẽ được tách ra. 
Glycoprotein biến đổi bề mặt (VSG) được gắn với màng thông qua 
một mỏ neo glycolipid chứa ethanolamine, một cấu trúc glycan mang một 
số gốc mannose (mannose moiety), một glucosamine và một 
phosphoinositol liên kết với 1,2-dimyristoyglycerol có gai trong màng 
plasma. Gốc glycolipid là yếu tố quyết định phản ứng lai (cross-reacting) 
 Sinh học phân tử 53 
(CRD) được nhận biết bằng các kháng thể phản ứng với tất cả dạng biến đổi 
của VSG, nhưng chỉ khi VSG được phóng thích khỏi màng. Màng liên kết 
với VSG không được nhận biết bởi các kháng thể anti-CRD. Sự phóng thích 
VSG được xúc tác bởi hoạt tính của trypanosome-specific phospholipase C 
được giả định là hiện diện ở mặt bên trong (inner face) của màng plasma. 
Người ta không biết rằng enzyme có thể cắt liên kết phosphoester trên mặt 
khác của màng như thế nào. 
Hình 2.9. Sơ đồ minh họa chuỗi protein của một VSG đặc trưng 
Hình 2.10. Cấu trúc của mỏ neo glycolipid của VSG 
- Hoạt động của gen VSG 
Gen mã hóa cho một VSG được gọi là bản gen gốc (basic copy gene). 
Các gen này được phân thành hai nhóm tùy thuộc vào vị trí của chúng trên 
nhiễm sắc thể. 
Vùng biến thiên Vùng tương đồng 
20 360 100 20 
Đuôi kỵ nước 
C-terminus 
Peptide tín hiệu 
N-terminus 
H2N COOH 
Protein 
C-terminal 
amino acid 
Ethanolamine 
Glycan Glucosamine 
Inositol 
Phospholipase C 
Màng 1,2-Dimyristoylglycerol 
 Sinh học phân tử 54 
+ Các gen nằm ở telomere (khoảng 5-15 kb)>200 gen. 
+ Các gen nằm cách telomere hơn 50 kb. 
Tương tự như ở nấm men, các gen mã hóa cho VSG nằm rải rác trong 
genome và ở trạng thái không hoạt động. Một gen bất kỳ được hoạt hóa chỉ 
khi nó được sao chép vào vị trí hoạt động (expression site) trong khi nguyên 
bản của nó vẫn được bảo tồn ở vị trí tĩnh. Bản sao của bản gen gốc vào vị trí 
hoạt động được gọi là ELC (bản sao hoạt động-expression linked copy). Vị 
trí hoạt động nằm ở gần telomere. Như vậy, việc chọn một bản gen gốc để 
sao chép tạo bản sao hoạt động sẽ phụ thuộc vào vị trí của bản gen gốc ở 
telomere hoặc nằm phía trong telomere. Có hai giả thiết để một gen trở nên 
hoạt hóa như sau: 
- Vị trí hoạt động không thay đổi mà chỉ có các ELC thay thế cho 
nhau. Bản sao của một bản gen gốc sẽ thay thế cho bản sao của một gen 
khác ở tại vị trí đó, điều này xảy ra tương tự như các gen ở cassette tĩnh 
được sao chép vào cassette hoạt động trong trường hợp với nấm men. 
- Vị trí hoạt động thay đổi, khi cần tổng hợp một VSG mới, gen ở vị trí 
hoạt động cũ bị ngừng và gen ở một vị trí khác (gần telomere) được khởi động. 
Một số phân tử mRNA tương ứng với các VSG khác nhau được phân 
lập và được xác định trình tự nucleotide (thông qua cDNA). Điều ngạc 
nhiên là phần oligonucleotide ở đầu 3’ của mọi gen VSG đều khác với phần 
3’ của các mRNA được phiên mã từ các gen đó. Mặt khác, các gen này 
không có phần 5’ giống như các mRNA. Như vậy, các mRNA không được 
tổng hợp hoàn toàn trên khuôn mẫu các gen này. Phần 3’ của các mRNA 
tương ứng với phần 3’ của vị trí hoạt động ELC, trong khi phần 5’ (gồm 35 
nucleotides) được tổng hợp từ những đoạn DNA khác và được gắn vào 
mRNA (hiện tượng trans-splicing). 
 2. Khuếch đại các gen 
Số lượng bản sao của một số gen cũng có thể được tăng lên tạm thời 
trong quá trình phát triển các tế bào soma. Việc tăng số lượng của một gen 
đặc biệt nào đó phụ thuộc vào từng điều kiện cụ thể của tế bào và xảy ra 
không phổ biến. Các bản sao có thể nằm tập trung thành một nhóm gồm bản 
sao này nối tiếp bản sao khác hoặc có thể tồn tại như những đoạn DNA có 
khả năng tái bản độc lập. Chẳng hạn: 
 Sinh học phân tử 55 
- Sự nhân bản của gen mã hóa cho rRNA ở trứng ếch. Trứng ếch có 
đường kính khoảng 2-3 mm, dự trữ rất nhiều rRNA. Chúng được phiên mã 
từ rất nhiều gen rDNA. Các gen này được nhân lên (khoảng 2.000 lần) theo 
cơ chế “vòng tròn quay” (xem chương 4) trong quá trình phát triển và tồn tại 
dưới dạng các vòng tròn khép kín. 
- Khi nuôi cấy các tế bào động vật có vú trong môi trường đặc biệt, 
DNA tại một số vị trí trong genome được nhân lên. Ví dụ: nuôi cấy các tế 
bào ung thư trong môi trường chứa độc tố methotrexate. Chất này ức chế 
hoạt tính của enzyme dihydrofolate reductase (DHFR) giữ vai trò trong tổng 
hợp các nucleotide của DNA. Các tế bào ung thư nuôi cấy trong môi trường 
có chất độc này phát triển thành các quần lạc tế bào kháng lại độc tố. Khi 
nồng độ chất độc tăng dần, nồng độ DHFR cũng tăng theo, có thể đạt tới 
1.000 lần lớn hơn mức bình thường. Nồng độ enzyme tăng do số lượng các 
gen mã hóa cho chúng tăng. Cơ chế chính xác của hiện tượng này chưa rõ 
ràng, nhưng có thể xảy ra theo hai cách: 
- Trao đổi chéo không cân bằng giữa hai nhiễm sắc tử (chromatid) của 
nhiễm sắc thể dẫn đến một số tế bào không có gen dhfr và một số khác có 
hai bản sao của gen này. Trong môi trường có độc tố, trao đổi chéo không 
cân bằng được lặp đi lặp lại và các tế bào chứa nhiều gen dhfr vẫn phát triển 
tốt trong môi trường này. 
- Các đoạn DNA (100-1.000 kb) chứa 2-4 gen dhfr (~31 kb/gen) được 
sao chép từ nhiễm sắc thể bình thường tạo ra các nhiễm sắc thể rất nhỏ, 
không có tâm động. Các nhiễm sắc thể nhỏ này ghép vào các nhiễm sắc thể 
bình thường khác. Quá trình này lặp đi lặp lại và qua một số lần phân bào 
nguyên nhiễm, tế bào nào mang số lượng lớn các gen dhfr càng có điều kiện 
phát triển thuận lợi trong môi trường có chứa độc tố. 
3. Biến nạp gen 
Một phương thức tăng khả năng di truyền là ứng dụng các tương tác 
vật chủ cộng sinh-ký sinh, trong đó DNA lạ được chuyển vào tế bào vật chủ 
từ một vi khuẩn. Cơ chế này tương tự với sự tiếp hợp của vi khuẩn. Sự biểu 
hiện của DNA vi khuẩn trong vật chủ mới của nó sẽ làm thay đổi kiểu hình 
 Sinh học phân tử 56 
của tế bào. Ví dụ điển hình là vi khuẩn A. tumefaciens cảm ứng tạo khối u ở 
tế bào thực vật bị chúng xâm nhiễm. 
Khi DNA lạ được đưa vào tế bào eukaryote, nó có thể tồn tại ngoài 
nhiễm sắc thể hoặc được hợp nhất trong genome. Nếu xảy ra theo trường 
hợp thứ hai, genome sẽ mang những đột biến di truyền và nhiều khi DNA lạ 
vẫn tiếp tục hoạt động làm xuất hiện các tính trạng mới. Việc đưa các gen lạ 
vào tế bào soma hoặc tế bào sinh dục mà vẫn duy trì hoạt động của những 
gen đó được gọi là chuyển nhiễm (transfection). Cá thể biểu hiện tính trạng 
mới nhờ hoạt động của gen lạ đưa vào tế bào sinh dục được gọi là cá thể 
chuyển gen. Quá trình này có thể làm thay đổi sự ổn định của genome. 
DNA sau khi được tiêm vào trong các tế bào trứng động vật có thể được hợp 
nhất trong genome và truyền cho thế hệ sau như một thành phần di truyền 
bình thường. Khả năng đưa một gen chức năng đặc trưng có thể trở thành 
một kỹ thuật y học sử dụng cho việc chữa bệnh di truyền. 
Tài liệu tham khảo/đọc thêm 
1. Võ Thị Thương Lan. 2002. Sinh học phân tử. NXB Đại học Quốc gia Hà 
Nội, Hà Nội. 
2. Alberts B, Bray D, Lewis J, Raff M, Roberts K and Watson JD. 2002. 
Molecular Biology of the Cell. 3
rd
 ed. Garland Publishing, Inc. New York, USA. 
3. Cantor CR and Smith CL. 1999. Genomics. John Wiley & Sons, Inc. 
New York, USA. 
4. Dale JW and Von Schanzt M. 2002. From Gene to Genome. John Wiley 
& Sons, Ltd. West Sussex, UK. 
5. Lewin B. 2000. Gene VII. Oxford University Press, Oxford, UK. 
6. Lodish H, Berk A, Matsudaira P, Kaiser CA, Krieger M, Scott MP, 
Zipursky SL and Darnell J. 2004. Molecular Cell Biology. 5
th
 ed. WH Freeman 
and Company, New York, USA. 
7. Watson JD, Baker TA, Bell SP, Gann A, Levine M and Loscik R. 
2004. Molecular Biology of the Gene. The Benjamin Cummings/Cold Spring 
Habor Laboratory Press, San Francisco, CA, USA. 
8. Weaver RF. 2003. Molecular Biology. 2
nd
 ed. McGraw-Hill Company 
Inc. New York, USA. 

File đính kèm:

  • pdfgiao_trinh_sinh_hoc_phan_tu_chuong_2_cau_truc_genome.pdf