Giáo trình Sinh học phân tử - Chương 3: Cấu trúc và chức năng của gen

 Các enzyme mất hoạt tính do đột biến

Nhiều nghiên cứu cho thấy, việc mất hoạt tính enzyme nhiều khi

không phải do vắng mặt của enzyme, mà chỉ do các biến đổi trên phân tử

(modification). Có trường hợp đột biến dẫn đến những thay đổi tinh vi,

enzyme vẫn có hoạt tính nhưng sẽ biểu hiện khác nếu thay đổi điều kiện.

Chẳng hạn:

Ở nấm mốc Neurospora crassa, enzyme tyrosinase do gen T xác định,

xúc tác cho phản ứng chuyển hóa tyrosine thành dihydroxyphenylalanine.

Alelle T+ của dòng hoang dại sản xuất tyrosinase có hoạt tính ở nhiệt độ

bình thường và cả ở 60oC. Một đột biến TS sản xuất tyrosine có hoạt tính ở

nhiệt độ bình thường, nhưng lại mất hoạt tính ở 60oC.

Như vậy, trong đa số trường hợp, đột biến của một gen không làm

biến mất enzyme mà chỉ biến đổi cấu trúc dẫn đến thay đổi hoạt tính. Các

đột biến của cùng một gen có thể gây ra những biến đổi khác nhau trên

enzyme. Các hiện tượng đó chứng tỏ rằng cấu trúc của enzyme chịu sự kiểm

soát trực tiếp của gen.

pdf 19 trang kimcuc 3860
Bạn đang xem tài liệu "Giáo trình Sinh học phân tử - Chương 3: Cấu trúc và chức năng của gen", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Giáo trình Sinh học phân tử - Chương 3: Cấu trúc và chức năng của gen

Giáo trình Sinh học phân tử - Chương 3: Cấu trúc và chức năng của gen
Sinh học phân tử 57 
Chương 3 
Cấu trúc và chức năng của gen 
I. Định nghĩa gen 
Chúng ta có thể điểm qua những mốc chính trong lịch sử nghiên cứu 
về gen như sau: 
Mendel (1865) là người đầu tiên đưa ra khái niệm nhân tố di truyền. 
Johansen (1909) đã đề xuất thuật ngữ gen (từ genos, nghĩa là sản sinh, 
nguồn gốc) để chỉ nhân tố di truyền xác định một tính trạng nào đó. Sau đó, 
Morgan trong những năm 1920 đã cụ thể hóa khái niệm về gen, khẳng định 
nó nằm trên nhiễm sắc thể và chiếm một locus nhất định, gen là đơn vị chức 
năng xác định một tính trạng. 
Vào những năm 1940, Beadle và Tatum đã chứng minh gen kiểm tra 
các phản ứng hóa sinh và nêu giả thuyết một gen-một enzyme. Tuy nhiên, 
trường hợp hemoglobin là một protein nhưng lại gồm hai chuỗi polypeptide 
do hai gen xác định, do đó giả thuyết trên buộc phải điều chỉnh lại là một 
gen-một polypeptide. 
Vào những năm 1950, DNA (deoxyribonucleic acid) được chứng 
minh là vật chất di truyền. Mô hình cấu trúc DNA của Watson và Crick 
được đưa ra và lý thuyết trung tâm (central dogma) ra đời. Gen được xem 
là một đoạn DNA trên nhiễm sắc thể mã hóa cho một polypeptide hay RNA. 
Cuối những năm 1970, việc phát hiện ra gen gián đoạn ở sinh vật 
eukaryote cho thấy có những đoạn DNA không mã hóa cho các amino acid 
trên phân tử protein. Vì thế, khái niệm về gen lại được chỉnh lý một lần nữa: 
Gen là một đoạn DNA đảm bảo cho việc tạo ra một polypeptide, nó bao 
gồm cả phần phía trước là vùng 5’ không dịch mã (5’ untranslation) hay còn 
gọi là vùng ngược hướng (upstream) và phía sau là vùng 3’ không dịch mã 
(3’ untranslation) hay còn gọi là vùng cùng hướng (downstream) của vùng 
mã hóa cho protein, và bao gồm cả những đoạn không mã hóa (intron) xen 
giữa các đoạn mã hóa (exon). 
Hiện nay, có thể định nghĩa gen một cách tổng quát như sau: Gen là 
đơn vị chức năng cơ sở của bộ máy di truyền chiếm một locus nhất định trên 
Sinh học phân tử 58 
nhiễm sắc thể và xác định một tính trạng nhất định. Các gen là những đoạn 
vật chất di truyền mã hóa cho những sản phẩm riêng lẻ như các mRNA 
được sử dụng trực tiếp cho tổng hợp các enzyme, các protein cấu trúc hay 
các chuỗi polypeptide để gắn lại tạo ra protein có hoạt tính sinh học. Ngoài 
ra, gen còn mã hóa cho các tRNA, rRNA và snRNA... 
Bảng 3.1. Tóm tắt lịch sử nghiên cứu về di truyền học 
 Mốc 
thời gian 
Năm Các sự kiện chính 
1850 1865 Gen là các nhân tố hạt 
1871 Khám phá ra nucleic acid 
1900 1903 Nhiễm sắc thể là các đơn vị di truyền 
1910 Gen nằm trên nhiễm sắc thể 
1913 Nhiễm sắc thể là các dãy sắp xếp mạch thẳng của gen 
1927 Đột biến là những thay đổi vật lý của gen 
1931 Sự tái tổ hợp xuất hiện bởi hiện tượng vắt chéo 
1944 DNA là vật liệu di truyền 
1945 Gen mã hóa cho protein 
1950 1951 Trình tự protein đầu tiên 
1953 DNA có dạng xoắn kép 
1958 DNA tái bản theo phương thức bán bảo thủ 
1961 Mã di truyền là bộ ba 
1977 Các gen của sinh vật eukaryote bị gián đoạn 
1977 DNA có thể được phân tích trình tự 
1995 Genome của vi khuẩn được phân tích trình tự 
2000 2001 Genome người được phân tích trình tự 
Sinh học phân tử 59 
II. Lý thuyết trung tâm 
1. Sự xác định di truyền cấu trúc bậc một của protein 
Cấu trúc không gian của chuỗi polypeptide được xác định bởi trình tự 
sắp xếp của các amino acid tức cấu trúc bậc một. Như vậy, mặc dù có nhiều 
mức độ cấu trúc không gian khác nhau, nhưng cấu trúc bậc một tức trình tự 
sắp xếp các amino acid chi phối toàn bộ các mức độ cấu trúc khác. Việc xác 
định di truyền phân tử protein ở trạng thái tự nhiên có đầy đủ hoạt tính sinh 
học chỉ quy tụ lại chủ yếu ở xác định cấu trúc bậc một là đủ. 
2. Các enzyme mất hoạt tính do đột biến 
Nhiều nghiên cứu cho thấy, việc mất hoạt tính enzyme nhiều khi 
không phải do vắng mặt của enzyme, mà chỉ do các biến đổi trên phân tử 
(modification). Có trường hợp đột biến dẫn đến những thay đổi tinh vi, 
enzyme vẫn có hoạt tính nhưng sẽ biểu hiện khác nếu thay đổi điều kiện. 
Chẳng hạn: 
Ở nấm mốc Neurospora crassa, enzyme tyrosinase do gen T xác định, 
xúc tác cho phản ứng chuyển hóa tyrosine thành dihydroxyphenylalanine. 
Alelle T
+
 của dòng hoang dại sản xuất tyrosinase có hoạt tính ở nhiệt độ 
bình thường và cả ở 60oC. Một đột biến TS sản xuất tyrosine có hoạt tính ở 
nhiệt độ bình thường, nhưng lại mất hoạt tính ở 60oC. 
Như vậy, trong đa số trường hợp, đột biến của một gen không làm 
biến mất enzyme mà chỉ biến đổi cấu trúc dẫn đến thay đổi hoạt tính. Các 
đột biến của cùng một gen có thể gây ra những biến đổi khác nhau trên 
enzyme. Các hiện tượng đó chứng tỏ rằng cấu trúc của enzyme chịu sự kiểm 
soát trực tiếp của gen. 
3. Bản chất các biến đổi di truyền của protein 
Bản chất đó chính là quan hệ một gen-một polypeptide. 
Như đã nêu trên, người ta khám phá ở người có những gen tạo ra 
hemoglobin (Hb) khi biến dị sẽ tạo ra những hemoglobin bất thường do sai 
hỏng ở các chuỗi polypeptide α hoặc β (Bảng 3.2 và 3.3) và gây ra các bệnh 
di truyền. 
Sinh học phân tử 60 
Bảng 3.2. Các loại hemoglobin ở chuỗi polypeptide α 
Thứ tự amino acid 1 2 16 57 58 68 116 141 
Tên amino acid Val Leu Lys Glu His Asp Glu Arg 
Loại hemoglobin Hb I Asp 
Hb Nocfolk Asp 
Hb M Boston Tyr 
Hb B Philadelphia Lys 
Hb O Indonesia Lys 
Ở trường hợp này, thứ tự các amino acid có thể bị sai lệch. Từ những 
dữ liệu trên ta thấy các dạng đột biến tạo một Hb bất thường đó là thay một 
amino acid này bằng một amino acid khác. 
Bảng 3.3. Các loại hemoglobin ở chuỗi polypeptide β 
Thứ tự amino acid 1 2 3 6 26 67 121 146 
Tên amino acid Val His Leu Glu Glu Val Glu His 
Loại hemoglobin Hb S Val 
 Hb C Lys 
 Hb E Lys 
Hb M Minvauki Glu 
Hb O Ả Rập Lys 
Qua hai chuỗi polypeptide α và β chúng ta thấy có một số dạng 
hemoglobin bất thường ở người. Trên mỗi chuỗi, chỉ trình bày những amino 
acid đã bị thay đổi ở dạng đột biến. Số thứ tự chỉ vị trí của amino acid trong 
chuỗi polypeptide. Mỗi hemoglobin bất thường có thể được đặt cho một chữ 
cùng tên (nếu có) của địa phương được tìm thấy. 
Sinh học phân tử 61 
Đột biến được biểu hiện bởi sự thay thế vị trí của một amino acid này 
bằng một amino acid khác. 
4. Sự tương quan đồng tuyến tính gen-polypeptide 
4.1. Đột biến tryptophan synthetase-sự đồng tuyến tính giữa gen và chuỗi 
polypeptide 
Nghiên cứu trên enzyme tryptophan synthetase xúc tác cho phản ứng 
tổng hợp tryptophan của E. coli người ta nhận thấy có nhiều đột biến xảy ra 
trên cùng một gen mã hóa cho tryptophan synthetase. 
Thực hiện tái tổ hợp trong gen (nguyên tắc là gen ở các vị trí càng xa 
nhau trên nhiễm sắc thể càng dễ tái tổ hợp), người ta đã nhận được các dạng 
biến dị có tính chất khác nhau, và tính được khoảng cách tương đối giữa 
những điểm khác nhau của đột biến đã được xác định. Vị trí biến dị trên thể 
nhiễm sắc tương ứng với vị trí của amino acid trên chuỗi polypeptide. Như 
vậy, có thể cho rằng có sự đồng tuyến tính giữa gen và chuỗi polypeptide 
(Hình 3.1). 
Hình 3.1. Tương quan đồng tuyến tính giữa gen và enzyme tryptophan 
synthetase của E. coli thông qua các vị trí đột biến và các gốc amino acid bị 
thay đổi 
Nhiều dạng đột biến của tryptophan synthethase đã được tạo ra. Bằng 
cơ chế tái tổ hợp, những khoảng cách tương đối giữa những điểm khác nhau 
 STOP Leu Val Gln Met Cys Arg Ile Arg Glu Val Cys Asp Leu STOP 
 Lys Phe Glu Tyr Leu Thr Gly Gly Gly Ser Gln 
 1 15 22 49 175 177 183 211 213 234 235 243 268 
Các vị trí của đột 
biến trên DNA 
Các gốc amino acid 
bị thay đổi 
+H3N COO
- 
Sinh học phân tử 62 
của đột biến đã được xác định. Sản phẩm protein của mỗi dạng đột biến đã 
được phân tích, và những thay đổi các amino acid khác cũng được xác định. 
Người ta đã tìm thấy mối tương quan hoàn toàn giữa những khoảng cách 
của các đột biến được tìm thấy trên gen với khoảng cách của amino acid bị 
thay đổi trong phân tử protein. 
4.2. Đột biến 
4.2.1. Khái niệm 
Một gen (DNA) có 4 loại base và một phân tử protein có 20 loại 
amino acid
1
, nhưng giữa chúng có mối tương quan như thế nào. Đầu tiên, 
người ta cho rằng một base qui định một amino acid, nhưng những tính toán 
cho thấy không hợp lý. Vì chỉ có 4 base trong DNA và 20 amino acid trong 
protein, cho nên mỗi codon phải chứa ít nhất 3 base. Hai base cũng không 
thể làm thành một codon bởi vì chỉ có 42 = 16 cặp hợp lý của 4 base. Nhưng 
3 base thì có thể bởi vì sẽ có 43 = 64 bộ ba hợp lý. Vì số lượng bộ ba hợp lý 
lớn hơn 20, cho nên sẽ có trường hợp một vài codon chỉ định cùng một 
amino acid. Ví dụ: UCU, UCC, UCA, UCG, AGU và AGC đều cùng mã 
hóa cho serine. 
Từ đó, người ta đưa ra khái niệm mã di truyền (tín hiệu di truyền). Mã 
di truyền cho phép đọc thứ tự trên DNA để biết thứ tự trên chuỗi 
polypeptide. Mã di truyền không mơ hồ, có nghĩa với một trình tự chẳng 
hạn ATA ta biết nó ghi mã cho một amino acid gì, và cũng thấy rằng có 
nhiều mã di truyền xác định cho một amino acid (Bảng 3.4). 
4.2.2. Đột biến điểm 
Là đột biến chỉ tác động một vị trí, nói rõ hơn đó là một base. Khi thay 
đổi một base trên DNA sẽ tạo ra sự thay đổi một amino acid (Hình 3.2). 
1
 Hai mươi amino acid được tìm thấy trong các phân tử protein là: Alanine (Ala), 
Arginine (Arg), Asparagine (Asn), Aspartic acid (Asp), Cysteine (Cys), Glutamic 
acid (Glu), Glutamine (Gln), Glycine (Gly), Histidine (His), Isoleucine (Ile), 
Leucine (Leu), Lysine (Lys), Methionine (Met), Phenylalanine (Phe), Proline (Pro), 
Serine (Ser), Threonine (Thr), Tryptophan (Trp), Tyrosine (Tyr) và Valine (Val). 
Sinh học phân tử 63 
Đột biến dĩ nhiên xảy ra trên DNA và được sao lại trên mRNA trong 
phiên mã, rồi trên protein trong dịch mã. 
Bảng 3.4. Mã di truyền chung 
Vị trí 
thứ nhất 
Vị trí thứ hai Vị trí 
thứ ba 
U C A G 
U Phe (F) Ser (S) Tyr (Y) Cys (C) U 
U Phe (F) Ser (S) Tyr (Y) Cys (C) C 
U Leu (L) Ser (S) STOP STOP A 
U Leu (L) Ser (S) STOP Trp (W) G 
C Leu (L) Pro (P) His (H) Arg (R) U 
C Leu (L) Pro (P) His (H) Arg (R) C 
C Leu (L) Pro (P) Gln (Q) Arg (R) A 
C Leu (L) Pro (P) Gln (Q) Arg (R) G 
A Ile (I) Thr (T) Asn (N) Ser (S) U 
A Ile (I) Thr (T) Asn (N) Ser (S) C 
A Ile (I) Thr (T) Lys (K) Arg (R) A 
A Met (M) Thr (T) Lys (K) Arg (R) G 
G Val (V) Ala (A) Asp (D) Gly (G) U 
G Val (V) Ala (A) Asp (D) Gly (G) C 
G Val (V) Ala (A) Glu (E) Gly (G) A 
G Val (V) Ala (A) Glu (E) Gly (G) G 
Chú thích 
Những đơn vị mã (codon) được đọc theo chiều 5’ 3’. 
STOP: codon kết thúc (còn gọi là vô nghĩa). 
Sinh học phân tử 64 
Đột biến điểm có các dạng sau: 
- Đột biến sai nghĩa. Thay đổi một amino acid trong protein, có thể 
dẫn đến một trong ba kết quả sau: 
+ Không hậu quả nào cả, vì amino acid không nằm trong vị trí hoạt 
động hoặc không có vai trò trong cấu trúc enzyme. 
+ Có biến đổi nhẹ ở chuỗi polypeptide sẽ tạo ra tính mẫn cảm yếu với 
nhiệt, làm giảm sự ổn định chuỗi polypeptide. 
+ Mất hẳn hoạt tính enzyme nếu đúng ngay vị trí hoạt động của 
enzyme đó. 
- Đột biến vô nghĩa. Thay đổi một base. Nếu đó là một codon vô 
nghĩa sẽ làm ngừng kéo dài (tổng hợp) chuỗi polypeptide ở vị trí amino acid 
này. Tức là nếu codon này nằm ở đầu sẽ không có chuỗi polypeptide hoạt 
động. 
- Đột biến acridine hoặc đột biến dịch khung. Đột biến này do chất 
acridine màu da cam tạo ra (hoặc còn gọi là đột biến dịch khung, frameshift, 
do thêm vào hoặc bớt đi một base) (Hình 3.2 E và D). Như vậy, một đột 
biến trên khung đọc khi thêm vào (C) hoặc mất đi (A) thường sẽ dẫn đến 
xuất hiện một codon stop làm ngừng chuỗi polypeptide và enzyme sẽ không 
có hoạt tính. 
4.2.3. Đột biến kìm hãm 
Đến nay, người ta nhận thấy mọi sai lệch trong việc tổng hợp protein 
nếu có đều xảy ra từ DNA, còn quá trình diễn ra từ RNA đến polypeptide 
luôn luôn đúng. Nghiên cứu một vài kiểu protein đột biến ta thấy: 
- Đột biến sai nghĩa. Làm xuất hiện một bất thường trong trình tự 
amino acid. Kết quả protein mất hoạt tính. Hoạt tính này có thể được phục 
hồi, hoặc do một đột biến ngược để cho lại protein cấu trúc ban đầu. 
- Đột biến vô nghĩa. Làm mất đi một phần chuỗi polypeptide, phần 
còn lại không có hoạt tính, và hoạt tính này có thể có lại được nhờ đột biến 
trong một codon đã bị đột biến. 
Thông thường, những gen kìm hãm đột biến vô nghĩa không nằm ở 
gần vị trí của đột biến ấy. Đó là những gen làm biến đổi hệ thống dịch mã 
khi tổng hợp protein. 
Sinh học phân tử 65 
A AUG ACU CGG AAG UCA CUA ACG AUU AGG CUU UAC ... 
 Met Thr Arg Lys Ser Leu Thr Ileu Arg Leu Tyr ... 
B AUG ACU AGG AAG UCA CUA ACG AUU AGG CUU UAC ... 
 Met Thr Pro Lys Ser Leu Thr Ileu Arg Leu Tyr ... 
C AUG ACU CGG AAG UGA CUA ACG AUU AGG CUU UAC ... 
 Met Thr Arg Lys Kết thúc 
D AUG ACU CGG ACA GUG ACU AAC GAU UAG GCU UUA ... 
 Met Thr Arg Thr Val Thr Asp Asp Kết thúc 
E AUG ACU CGG AGU GAC UAA CGA UUA GGC UUU AC ... 
 Met Thr Arg Ser His Kết thúc 
Hình 3.2. Các dạng đột biến điểm 
A: trình tự các codon và các amino acid tương ứng ở dạng tự nhiên. 
B: thay đổi một base (C thành A) làm thay đổi một amino acid (Arg thành 
Pro) gây nên đột biến sai nghĩa. 
C: thay đổi một base (C thành G) sinh ra một codon vô nghĩa (UGA). 
D: thêm một base (C) gây nên đột biến acridine hoặc đột biến dịch khung, có 
sự dời khung đọc. 
E: mất một base (A), gây nên đột biến acridine, chấm dứt đọc. 
5. Lý thuyết trung tâm của sinh học phân tử 
Tổng hợp protein trong tế bào có các đặc điểm sau: 
- Các phân tử thông tin như nucleic acid và protein được tổng hợp 
theo khuôn. Tổng hợp theo khuôn vừa chính xác vừa ít tốn enzyme. Tuy 
Sinh học phân tử 66 
nhiên, căn cứ vào hàng loạt tính chất hóa học các protein không thể làm 
khuôn mẫu cho sự tổng hợp của chính chúng. Vì vậy, khuôn mẫu để tổng 
hợp nên protein không phải là protein. 
- Sinh tổng hợp protein tách rời về không gian với chỗ chứa DNA. 
Nhiều nghiên cứu cho thấy tổng hợp protein có thể xảy ra khi không có mặt 
DNA. Sự kiện này thể hiện rõ ràng nhất ở những tế bào eukaryote. Trong 
những tế bào này, hầu như toàn bộ DNA tập trung ở nhiễm sắc thể trong 
nhân, còn tổng hợp protein chủ yếu diễn ra ở tế bào chất. Tảo xanh đơn bào 
Acetabularia khi bị cắt mất phần chứa nhân vẫn tổng hợp được protein và 
sống vài tháng nhưng mất khả năng sinh sản. Rõ ràng, nơi chứa DNA mang 
thông tin di truyền và chỗ sinh tổng hợp protein tách rời nhau về không 
gian. 
- DNA không phải là khuôn mẫu trực tiếp để tổng hợp protein, do đó 
phải có chất trung gian chuyển thông tin từ DNA ra tế bào chất và làm 
khuôn để tổng hợp protein. Chất đó phải có cả trong nhân và tế bào chất với 
số lượng phụ thuộc vào mức độ tổng hợp protein. 
- Chất trung gian đó được xem chính là RNA nhờ các đặc điểm sau: 
+ RNA được tổng hợp ngay ở trong nhân có chứa DNA, sau đó nó đi 
vào tế bào chất cho tổng hợp protein. 
+ Những tế bào giàu RNA tổng hợp protein nhiều hơn. 
+ Về phương diện hóa học RNA gần giống DNA: chuỗi polyribo-
nucleotide thẳng cũng chứa 4 loại ribonucleotide A, G, C và uracil (U). Nó 
có thể nhận được thông tin từ DNA qua bắt cặp bổ sung. 
Nói chung, trong tế bào không thể tìm thấy chất nào khác ngoài RNA 
có thể đóng vai trò trung gian cho tổng hợp protein. Mối quan hệ này chính 
là thông tin di truyền đi từ DNA qua RNA rồi đến protein và được biểu diễn 
ở hình 3.3. Mối quan hệ này còn được gọi là lý thuyết trung tâ ... ờ enzyme reverse transcriptase. Đến nay, việc 
sao chép (tổng hợp) RNA trên khuôn mẫu RNA cũng đã được chứng minh ở 
nhiều loại virus. Ngoài ra, thông tin từ protein cũng có thể được truyền sang 
protein (prion của bệnh bò điên). Riêng dòng thông tin từ protein ngược về 
mRNA/DNA thì chưa được tìm thấy (Hình 3.4). 
Sinh học phân tử 67 
Hình 3.3. Lý thuyết trung tâm của Crick 
Hình 3.4. Những bổ sung mới vào lý thuyết trung tâm của Crick 
6. DNA và mã di truyền 
Chúng ta đã biết có sự liên quan đồng tuyến tính giữa DNA và phân tử 
protein, từ đó dễ dàng dự đoán rằng trình tự đặc hiệu của các amino acid 
trên phân tử protein sẽ được mã hóa bằng nhóm các nucleotide trên phân tử 
DNA. Có tất cả 4 loại base, nếu các base có nhóm đôi tức 2 nucleotide mã 
hóa cho một loại amino acid thì tất cả chỉ có 16 tổ hợp, không đủ cho 20 
loại amino acid. Như vậy, đơn vị mã hóa (codon) phải gồm 3 nucleotide 
(xem phần 4.2). 
Vấn đề tiếp theo là xác định chính xác các codon nào mã hóa cho từng 
amino acid. Nirenberg và Matthaei đã sử dụng enzyme để tổng hợp nhân tạo 
RNA. Khi dùng chỉ một loại nucleotide là U sẽ nhận được RNA là poly(U), 
nếu chỉ dùng A sẽ nhận được poly(A). 
Năm 1961, Nirenberg và Matthaei đã dùng poly(U) thay cho khuôn 
mẫu mRNA để tổng hợp protein trong hệ thống vô bào (có amino acid, 
enzyme tổng hợp protein, nhưng không có DNA...), sản phẩm thu được là 
chuỗi polypeptide polyphenylalanine chỉ chứa một loại amino acid là 
phenylalanine. Điều đó chứng tỏ codon UUU mã hóa cho phenylalanine. 
Đây là codon đầu tiên được xác định. Sau đó, họ cũng chứng minh được 
rằng AAA mã hóa cho lysine, GGG cho glycine và CCC cho proline. 
mRNA Protein 
 Phiên mã Dịch mã 
DNA 
Sao chép 
Phiên mã ngược ? 
(virus) (prion) 
mRNA Protein 
 Phiên mã Dịch mã 
DNA 
Sao chép 
Sinh học phân tử 68 
Năm 1964, Khorana tìm ra phương pháp tổng hợp mRNA nhân tạo 
với trình tự lặp lại (như AAG AAG AAG...) và nhờ nó giải quyết xong các 
vấn đề còn chưa rõ ràng. 
Bảng mã di truyền (Bảng 3.4) cho thấy trong 64 codon, có 3 codon 
UAA, UAG, UGA không mã hóa cho amino acid được gọi là vô nghĩa (non-
sense), đồng thời là codon kết thúc (termination) tức dấu chấm câu, chấm 
dứt chuỗi polypeptide. 
Mã di truyền có tính suy biến (degeneration) tức một amino acid có 
nhiều codon mã hóa, chỉ trừ methionine và tryptophane chỉ có một codon 
(tương ứng là ATG và TGG). Các codon đồng nghĩa tức mã hóa cho cùng 
một amino acid thường có hai base đầu tiên giống nhau, nhưng khác nhau ở 
cái thứ ba. Ví dụ: CCU, CCC, CCA và CCG tất cả đều mã hóa cho proline. 
Trên thực tế, U và C luôn luôn tương đương nhau ở vị trí thứ ba, còn A và G 
tương đương nhau trong 14 trên 16 trường hợp. 
Trừ một số ngoại lệ, mã di truyền có tính phổ biến (universal) tức toàn 
bộ thế giới sinh vật có chung bộ mã di truyền. 
III. Cấu trúc và chức năng của gen 
Khi nghiên cứu các quy luật di truyền Mendel và học thuyết di truyền 
nhiễm sắc thể, gen được quan niệm như một điểm trên nhiễm sắc thể, vừa là 
đơn vị chức năng xác định một tính trạng, vừa là đơn vị đột biến, vừa là đơn 
vị tái tổ hợp. Cùng với sự phát triển của di truyền học, khái niệm về gen 
được cụ thể hóa thêm, cấu trúc và chức năng của gen được hiểu chi tiết hơn. 
1. Cấu trúc gen 
Một gen thường được xem gồm có hai phần, phần mang mã di truyền 
được phiên mã sang phân tử mRNA và phần DNA làm nhiệm vụ điều khiển 
hoạt động của gen (Hình 3.5). Cả hai phần đều có cấu trúc cơ bản khá giống 
nhau ở mọi sinh vật prokaryote và eukaryote. Tuy nhiên, gen eukaryote còn 
có cấu trúc đặc thù liên quan đến các cơ chế kiểm soát khác nhau đối với 
hoạt động của gen. 
Cấu trúc một gen điển hình nói chung đều có promoter, vị trí để RNA 
polymerase hoạt động khởi đầu phiên mã. Đôi khi nằm rất xa gen, có thể 
thấy các enhancer (vùng tăng cường) hoặc silencer (vùng ức chế) có vai trò 
Sinh học phân tử 69 
liên quan đến quá trình phiên mã. Độ dài của một gen thay đổi tùy theo số 
lượng và độ dài của các intron chứa trong nó. 
Hình 3.5. Cấu trúc chung của một gen 
Vùng DNA mang mã di truyền sẽ được phiên mã sang phân tử 
mRNA. Quá trình này thực hiện theo chiều 5’ 3’ trên sợi mRNA đang 
được tổng hợp. Không phải mọi phiên mã di truyền trên phân tử mRNA đều 
được dịch mã sang phân tử protein. Hai đầu 5’ và 3’ của phân tử mRNA 
gồm một số nucleotide không được dịch mã mà lại liên quan đến tính bền 
vững của phân tử mRNA hoặc tham gia kiểm soát quá trình dịch mã. Hai 
đoạn này gọi là vùng không dịch mã 5’ và 3’ (untranslated region). Vùng 
không dịch mã 5’ nằm trước điểm khởi đầu dịch mã (3 nucleotide AUG mã 
hóa cho methionine đầu tiên của chuỗi polypeptide) và vùng không dịch mã 
3’ nằm sau điểm kết thúc dịch mã (stop codon có thể là UAA, UGA và 
UAG). Do tế bào prokaryote không có cấu trúc nhân nên quá trình phiên mã 
(tổng hợp mRNA) và dịch mã (tổng hợp protein) xảy ra đồng thời. Còn 
phân tử mRNA của eukaryote được phiên mã trong nhân, sau đó phải cắt bỏ 
intron và gắn các exon lại, chịu biến đổi tại các đầu 5’ và 3’ trước khi vận 
chuyển ra ngoài tế bào chất để dùng làm khuôn mẫu tổng hợp protein. 
Hoạt động của một gen được đánh giá thông qua quá trình phiên mã 
(tổng hợp mRNA) và quá trình dịch mã (tổng hợp protein). Hoạt động này 
được kiểm soát rất chặt chẽ bằng các cơ chế khác nhau ở mọi giai đoạn, như 
bắt đầu và kết thúc phiên mã, quá trình biến đổi mRNA, quyết định tính bền 
vững và kiểm tra lại thông tin di truyền trên các phân tử này... Do cấu trúc 
Vùng 5’ 
ngược hướng 
Đơn vị phiên mã 
Vùng 3’ 
cùng hướng 
 Vùng promoter Các exon 
 Chuỗi 5’ Các intron Chuỗi 3’ 
 không mã hóa không mã hóa 
 Các enhancer Hộp CCAAT Hộp TATA Các enhancer 
Sinh học phân tử 70 
sắp xếp các gen prokaryote khác với gen eukaryote nên sự phối hợp giữa 
các cơ chế điều khiển mang tính chất riêng biệt cho từng loại genome. 
Các gen prokaryote thường sắp xếp nằm gần nhau và chịu sự điều 
khiển chung của một promoter, tức là chúng được phiên mã sang cùng một 
phân tử mRNA. Cấu trúc này được gọi là operon. Như vậy, một operon gồm 
hai hay nhiều gen nằm cạnh nhau trên một nhiễm sắc thể. Thông thường, đó 
là các gen cùng tham gia vào một con đường chuyển hóa, ví dụ như các gen 
mã hóa cho các enzyme cần thiết cho quá trình chuyển hóa glucose. 
Do có chung promoter điều khiển cho mọi gen nằm trong một operon 
cho nên chỉ có một loại phân tử mRNA được tổng hợp từ một operon (mang 
thông tin di truyền của tất cả các gen nằm trong đó). Nói cách khác, quá 
trình phiên mã của các gen trong một operon xảy ra đồng thời và phân tử 
mRNA đặc trưng cho operon được gọi là mRNA-polycistron. 
Tuy nhiên, điều cần ghi nhớ là quá trình dịch mã trên các phân tử 
mRNA-polycistron xảy ra hoàn toàn độc lập với nhau. Mỗi đoạn tương ứng 
với một gen trên phân tử này đều có vị trí bám của ribosome, có mã bắt đầu 
và kết thúc tổng hợp chuỗi polypeptide riêng biệt. Do đó, tốc độ tổng hợp 
các protein trên các phân tử mRNA-polycistron hoàn toàn khác nhau (Hình 
3.6). 
Hình 3.6. Cấu trúc operon trong genome vi khuẩn. Một operon là một đơn vị 
phiên mã đơn bao gồm một chuỗi các gen cấu trúc (structural genes), một promoter 
và một operator. 
2. Sự phân chia nhỏ của gen 
Khái niệm locus được đưa ra để chỉ vị trí của gen trên nhiễm sắc thể, 
là vị trí của tất cả các allele của dãy đa allele. Bản thân hiện tượng đa allele 
 Gen a Gen b Gen c 
 Operon 
Gen cấu trúc 
Operator 
Promoter 
Sinh học phân tử 71 
cho thấy gen có cấu tạo phức tạp, sự biến đổi của gen có thể dẫn đến nhiều 
trạng thái allele khác nhau. 
2.1. Hiện tượng allele giả 
Theo quan niệm cổ điển gen là đơn vị tái tổ hợp. Nếu cá thể mang hai 
allele lặn a1/a2 của một dãy đa allele sẽ tạo thành hai loại giao tử là a1 và a2, 
lai phân tích với bố mẹ đồng hợp tử lặn sẽ chỉ cho kiểu hình đột biến a1 và 
a2 mà không có dạng tái tổ hợp hoang dại. Ví dụ: 
Bố mẹ a1/a2 × a1/a1 
Giao tử a1 và a2 a1 
Các con lai a1/a1 và a2/a1 - cả hai đều là kiểu hình đột biến 
Tuy nhiên, nhiều thí nghiệm cho thấy nếu tăng số cá thể thí nghiệm 
lên 10.000 hoặc 100.000, thì có thể phát hiện có dạng kiểu hình hoang dại 
do tái tổ hợp. 
Ví dụ: Trường hợp locus mắt quả trám ở ruồi giấm, có 18 allele. Khi 
tăng số cá thể nghiên cứu lên nhiều lần, người ta phát hiện các allele xếp 
thành 3 nhóm A, B và C. Các allele của cùng một nhóm, khi lai lẫn nhau, 
không cho kiểu hình tái tổ hợp hoang dại mắt bình thường, mà chỉ có kiểu 
hình mắt quả trám. Nhưng lai allele của nhóm này với allele của nhóm khác 
sẽ có xuất hiện kiểu hình hoang dại do tái tổ hợp. Hiện tượng này được gọi 
là allele giả. 
Hiện tượng allele giả cho thấy gen phân chia nhỏ về mặt tái tổ hợp, có 
thể xảy ra tái tổ hợp giữa các phần trong gen. Lúc đầu, hiện tượng allele giả 
được coi là trường hợp ngoại lệ, nhưng khi tăng số cá thể nghiên cứu lên 
nhiều lần thì rõ ràng đó là hiện tượng phổ biến. Nó được tìm thấy ở nhiều 
đối tượng khác nhau như nấm men S. cerevisiae, ngô, bồ câu, chuột, 
bacteriophage... 
2.2. Locus rII của bacteriophage T4 
Nghiên cứu chi tiết về các đột biến rII của bacteriophage T4 đã làm 
sáng tỏ hơn về cấu trúc gen. Bacteriophage T4 ở dạng hoang dại r
+
 có khả 
năng xâm nhiễm đồng thời hai chủng E. coli B và K, trong khi các đột biến 
rII chỉ xâm nhiễm chủng B mà không xâm nhiễm chủng K (Hình 3.7). 
Sinh học phân tử 72 
 Chủng vi khuẩn E. coli 
B K 
Dạng hoang dại 
Vết tan (plaque) nhỏ 
Vết tan nhỏ 
Đột biến rII 
Vết tan lớn 
Không có vết tan 
Hình 3.7. Kiểu hình của các đột biến rII của phage T4 
Benzer (1955) đã thu được vài nghìn đột biến rII có nguồn gốc độc lập 
với nhau. Ông cho lai các đột biến này với nhau và căn cứ vào sự xuất hiện 
các dạng tái tổ hợp hoang dại r+ mà lập bản đồ các điểm đột biến (mutation 
sites). 
Trước thí nghiệm của ông, rII được coi là một locus. Tuy nhiên, thí 
nghiệm của ông đã cho thấy các đột biến xếp thành hai nhóm rIIA và rIIB. 
Lai các đột biến rIIA × rIIB sẽ có r+, nhưng lai rIIA × rIIA và rIIB × rIIB 
thì kiểu hình đột biến là r. 
Cho đến nay, chúng ta định nghĩa một gen là nhờ dựa trên kiểu hình 
đột biến và vị trí trên bản đồ của nó. Bacteriophage là một mô hình di truyền 
đơn giản (genome của E. coli dài khoảng 4.600.000 bp, trong khi 
bacteriophage T4 là 165.000 bp và bacteriophage λ khoảng 46.500 bp), 
chúng có thể sinh sản một số lượng lớn rất nhanh (1010 hoặc hơn thế) và dễ 
dàng phân tích. Các thí nghiệm thực hiện với đột biến rII của T4 được thiết 
lập dựa trên cơ sở sau: 
- Các gen có một phạm vi và ranh giới hạn chế. 
- Các gen có thể chia được, có thể có sự tái tổ hợp giữa hai allele trong 
một gen đơn. 
- Hoạt động của gen có thể được phân tích bởi sự phân tích bổ sung. 
Sinh học phân tử 73 
Kết quả thí nghiệm cho thấy, gen có thể phân chia nhỏ về mặt đột 
biến. Các đoạn rIIA và rIIB được gọi là cistron, đơn vị chức năng nhỏ nhất 
đảm bảo khả năng xâm nhiễm chủng K. Thuật ngữ cistron thực chất là gen, 
ngày nay nó chỉ có tính chất lịch sử, ít được sử dụng. Theo quan niệm hiện 
nay, rIIA và rIIB là hai locus. Hai khái niệm mới được đưa ra là muton-đơn 
vị đột biến và recon-đơn vị tái tổ hợp. 
Benzer đã tìm thấy 2.000 điểm đột biến trên đoạn gen được nghiên 
cứu, chúng phân bố không đều nhau, có những điểm tập trung nhiều đột 
biến hơn. Chiều dài gen khoảng 900 nucleotide. Đơn vị đột biến muton ở 
đây tương ứng với 900/2.000. Số đột biến ghi nhận có thể thấp hơn so với 
thực tế nên muton có thể tương ứng với một cặp nucleotide. Giống như vậy 
recon có thể tương ứng với một cặp nucleotide. 
Tóm lại, gen là đơn vị chức năng, có thể chia nhỏ bởi các đơn vị đột 
biến tái tổ hợp. 
3. Thử nghiệm chức năng allele 
Muốn nghiên cứu cấu trúc bên trong một gen, phải tìm hiểu nhiều 
allele của gen đó. Nhiều đột biến có kiểu hình giống nhau nhưng không 
allele với nhau. Thử nghiệm chức năng allele được sử dụng để xác định xem 
hai đột biến có allele với nhau không. Đây chính là thử nghiệm mà Benzer 
dùng để lập bản đồ locus rII. 
Thử nghiệm này còn được gọi là thử nghiệm bổ sung (complementary 
test) vì nó cho biết sai hỏng chức năng ở hai đột biến có bổ sung tức bù trừ 
cho nhau được không. 
Phương pháp thử này cũng được gọi là thử nghiệm đều-lệch (cis-trans 
test). Sở dĩ như vậy là vì phép thử nghiệm này so sánh hiệu quả kiểu hình 
của các gen đột biến ở hai vị trí khác nhau trên nhiễm sắc thể tương đồng. Ở 
vị trí lệch (trans) các đột biến nằm trên hai nhiễm sắc thể, còn ở vị trí đều 
(cis) các đột biến nằm trên cùng một nhiễm sắc thể. Trường hợp sai hỏng ở 
hai gen khác nhau nên có thể bổ sung được, còn trường hợp sai hỏng ở cùng 
một gen không bù đắp được sẽ dẫn đến kiểu hình đột biến. 
Sinh học phân tử 74 
Hình 3.8. Thử nghiệm chức năng allele. I: có kiểu hình đột biến do sai hỏng cùng 
một gen nên không bù đắp được. II: có kiểu hình hoang dại do sai hỏng khác gen 
nên bù trừ được cho nhau. 
4. Gen là đơn vị chức năng nhỏ nhất 
Thử nghiệm chức năng allele có thể được thực hiện dễ dàng trên các 
đối tượng vi sinh vật với các đột biến hóa sinh, thường là các đột biến 
khuyết dưỡng (auxotroph mutant: mất khả năng tổng hợp một chất nào đó). 
Ví dụ: Ở nấm mốc Neurospora crassa có nhiều đột biến mất khả năng tổng 
hợp adenine (Ade-). Các đột biến này dễ phát hiện vì có khuẩn lạc màu đỏ. 
Có hai dạng đột biến Adex và Adey, nếu dị hợp tử Adex/Adey có kiểu hình đột 
biến tức là cho khuẩn lạc màu đỏ, thì Adex và Adey là hai allele của một gen. 
Thử nghiệm chức năng allele cho thấy các đột biến Ade ở N. crassa tạo 
thành 9 nhóm. Điều đó chứng tỏ có 9 gen tổng hợp adenine ở loài nấm này: 
ade1, ade2, ade3... trong đó ade3 có hai locus nằm kề sát nhau là ade3A và 
ade3B (Hình 3.9). 
Qua nghiên cứu các gen sản xuất adenine người ta nhận thấy quá trình 
tổng hợp adenine có liên quan đến 9 nhóm đột biến của gen này hoặc gen 
kia, và đều cùng có một kết quả là mất khả năng tổng hợp adenine. Như vậy, 
khái niệm gen không chỉ kiểm tra di truyền cả chu trình tổng hợp adenine, 
mà gen là đơn vị chức năng nhỏ nhất, kiểm tra một giai đoạn cơ bản nào đó 
I: Hai đột biến 
trên một cistron 
II: Hai đột biến 
trên hai cistron 
 cis trans 
 a1 a2 + a1 + + 
 + + + + a2 + 
 Gen A Gen B Gen A Gen B 
1 2 
4 3 
 a1 + b a1 + + 
 + + + + + b 
 Gen A Gen B Gen A Gen B 
Sinh học phân tử 75 
của chu trình. Nếu biến đổi di truyền làm sai hỏng chức năng đó sẽ dẫn đến 
xuất hiện đột biến mất khả năng tổng hợp adenine. 
Hình 3.9. Vị trí các gen ade trên các nhiễm sắc thể của nấm mốc Neurospora 
crassa 
Tài liệu tham khảo/đọc thêm 
1. Hồ Huỳnh Thùy Dương. 1998. Sinh học phân tử. NXB Giáo dục, Hà 
Nội. 
2. Phạm Thành Hổ. 2003. Di truyền học. NXB Giáo dục, Hà Nội. 
3. Alberts B, Bray D, Lewis J, Raff M, Roberts K and Watson JD. 2002. 
Molecular Biology of the Cell. 3
rd
 ed. Garland Publishing, Inc. New York, USA. 
4. Lewin B. 2000. Gene VII. Oxford University Press, Oxford, UK. 
5. Pierce BA. 2003. Genetics: A Conceptual Approach. W.H. Freeman & 
Co. New York, USA. 
6. Watson JD, Hopkins NH, Roberts JW and Weiner AM. 2004. 
Molecular Biology of the Gene. The Benjamin/Cummings Publishing Company, 
Inc. California, USA. 
ade5 
ade4 ade2 
ade6 
ade7 
ade8 ade1 
ade3 
A B 
I 
III 
IV 
V 
VI 

File đính kèm:

  • pdfgiao_trinh_sinh_hoc_phan_tu_chuong_3_cau_truc_va_chuc_nang_c.pdf