87
3.2.2. Kod genetyczny
Informacja genetyczna dotyczy budowy białek – kolejności
amino-
kwasów w łańcuchach białkowych.
Istnieje 20 aminokwasów kodowanych przez DNA. W białkach
syntetyzowanych w komórkach jest ich więcej, ponieważ ulegają one
modyfikacjom potranslacyjnym, polegającym m.in. na dodawaniu grup
funkcyjnych (metylowych, acetylowych, hydroksylowych, fosforylowych
itd.), cząsteczek węglowodanów, lipidów, zmianie struktury chemicznej,
wytwarzaniu mostków dwusiarczkowych, usuwaniu fragmentów łańcucha
polipeptydowego itp. Część z tych modyfikacji
prowadzi do powstania
nowych aminokwasów, które nie mają swojego opisu w kodzie gene-
tycznym. Jednak 20 z nich musi być w nim bezpośrednio zapisanych.
DNA, jak opisano wcześniej, jest polimerem czterech rodzajów
nukleotydów, zawierających zasady azotowe: adeninę, tyminę, cytozynę
i guaninę. Zatem informacja w takiej cząsteczce musi być zapisana za
pomocą czterech „znaków”; rzeczywiście dla wygody traktuje się te
nukleotydy (czy zasady azotowe)
jak litery, zapisując je odpowiednio
jako A, T, C, G.
Skoro dysponujemy czterema różnymi literami, żeby zapisać 20
aminokwasów konieczne są „słowa” trzyliterowe (
kodony).
Taki kod umożliwia zapisanie 4
3
=
64 wartości. Jest to zbyt wiele (więc
kod genetyczny jest nadmiarowy), ale kod z dwóch liter byłby zbyt krótki
(4
2
=
16), ponadto nadmiarowe kombinacje również mają zastosowanie.
Należy pamiętać, że w czasie syntezy białek
informacja zawarta
w DNA zostaje przepisana na mRNA, a dopiero na matrycy mRNA
syntetyzowane są cząsteczki białka. Zatem, zgodnie z zasadą komplemen-
tarności, np. nukleotydy CCA na DNA odpowiadają kodonowi GGU na
mRNA (koduje on glicynę). Glicynę kodują również trójki: GGC, GGA
oraz GGG. W ten sposób wykorzystywane są dodatkowe kombinacje
możliwych kodonów: kilka może kodować jeden aminokwas (kod
genetyczny jest zdegenerowany). Na uwagę zasługuje fakt, że dwie
pierwsze litery są takie same, różnica dotyczy tylko trzeciej litery kodonu.
Dzięki temu, jeśli zdarzy się mutacja polegająca na zastąpieniu
nukleotydu innym – nie będzie to miało żadnego negatywnego skutku
i tak do łańcucha peptydowego dołączona zostanie glicyna. Tak więc
dzięki zdegenerowaniu kodu genetycznego
jest on bardziej odporny na
niektóre mutacje.
Kolejne kodony wyznaczają kolejne aminokwasy; zapis jest ciągły, nie
zachodzi na siebie. Na przykład, na matrycy mRNA o sekwencji
88
nukleotydów:
A U G C G U C C C A U C U A C U A C U G A
powstanie
peptyd o sekwencji aminokwasów:
metionina-arginina-prolina-izoleucyna-tyrozyna-tyrozyna.
Kodon AUG opisuje metioninę. Jednocześnie jest to kodon wyzna-
czający początek translacji: kompleks transkrypcyjny przesuwa się
wzdłuż mRNA do natrafienia na pierwszą sekwencję
AUG i od tego
miejsca zaczyna syntezę białka. Zatem każde nowo syntetyzowane białko
zaczyna się od metioniny (która często jest później usuwana).
Jednocześnie kodon AUG ustawia tzw.
ramkę odczytu. Oznacza to, że
począwszy od sekwencji AUG kolejne trójki zasad traktowane są jako
kolejne kodony określające kolejne aminokwasy.
Kodony UAA, UAG, UGA są tzw. kodonami nonsensownymi, nie
kodującymi żadnego aminokwasu. Oznaczają one zakończenie
w tym
miejscu syntezy polipeptydu (dlatego w podanej powyżej jako przykład
sekwencji nukleotydów na końcu, po dwóch kodonach UAC (tyrozyna)
znalazł się, dla porządku, kodon UGA). Kodony te oznaczają jedno-
cześnie koniec
genu, czyli odcinka kwasu nukleinowego kodującego
sekwencję aminokwasów jednego polipeptydu.
Kodony opisujące poszczególne aminokwasy oraz sekwencje START
(=
Met) i STOP przedstawione są w tablicy 1.
Tab. 1. Znaczenie poszczególnych kodonów na mRNA
Pozycja druga
U
C
A
G
Pozycj
a p
ier
w
sz
a
(5’
)
U
Phe
Phe
Leu
Leu
UUU
UUC
UUA
UUG
Ser
Ser
Ser
Ser
UCU
UCC
UCA
UCG
Tyr
Tyr
Dostları ilə paylaş: