Den mest nøyaktige definisjonen av konseptet med en genetisk kode. Universell genetisk kode

Den genetiske koden er en spesiell kryptering av arvelig informasjon ved hjelp av molekyler. Basert på dette styrer gener på en passende måte syntesen av proteiner og enzymer i kroppen, og bestemmer dermed stoffskiftet. På sin side bestemmes strukturen til individuelle proteiner og deres funksjoner av plasseringen og sammensetningen av aminosyrer - de strukturelle enhetene til proteinmolekylet.

I midten av forrige århundre ble det identifisert gener som er separate seksjoner (forkortet DNA). Nukleotidenhetene danner en karakteristisk dobbeltstreng, satt sammen i form av en spiral.

Forskere har funnet en sammenheng mellom gener og den kjemiske strukturen til individuelle proteiner, hvor essensen er at den strukturelle rekkefølgen av aminosyrer i proteinmolekyler tilsvarer rekkefølgen av nukleotider i et gen. Etter å ha etablert denne forbindelsen bestemte forskerne seg for å dechiffrere den genetiske koden, dvs. å etablere samsvarslovene mellom strukturelle rekkefølger av nukleotider i DNA og aminosyrer i proteiner.

Det er bare fire typer nukleotider:

1) A-adenyl;

2) G-guanyl;

3) T - tymidyl;

4) C-cytidyl.

Sammensetningen av proteiner inkluderer tjue typer grunnleggende aminosyrer. Det oppsto vanskeligheter med å dechiffrere den genetiske koden, siden det er mye mindre nukleotider enn aminosyrer. Når man løste dette problemet, ble det foreslått at aminosyrer kodes av forskjellige kombinasjoner av tre nukleotider (det såkalte kodonet eller tripletten).

I tillegg var det nødvendig å forklare nøyaktig hvordan trillingene er lokalisert langs genet. Slik oppsto tre hovedgrupper av teorier:

1) trillingene følger hverandre kontinuerlig, dvs. danne en solid kode;

2) trillingene er arrangert med vekslende "meningsløse" seksjoner, d.v.s. såkalte "kommaer" og "avsnitt" er dannet i koden;

3) trillingene kan overlappe, dvs. slutten av den første trillingen kan danne begynnelsen på den neste.

For tiden brukes hovedsakelig teorien om kodekontinuitet.

Genetisk kode og dens egenskaper

1) Koden er triplett – den består av vilkårlige kombinasjoner av tre nukleotider som danner kodoner.

2) Den genetiske koden er overflødig - dens trillinger. En aminosyre kan kodes av flere kodoner, siden det ifølge matematiske beregninger er tre ganger flere kodoner enn aminosyrer. Noen kodoner utfører spesifikke termineringsfunksjoner: noen kan være "stoppsignaler" som programmerer slutten av produksjonen av en aminosyrekjede, mens andre kan indikere initiering av kodelesing.

3) Den genetiske koden er entydig – kun én aminosyre kan tilsvare hvert av kodonene.

4) Den genetiske koden er kollineær, dvs. nukleotidsekvensen og aminosyresekvensen samsvarer tett med hverandre.

5) Koden skrives ned kontinuerlig og kompakt, det er ingen "meningsløse" nukleotider i den. Den begynner med en viss triplett, som erstattes av den neste uten avbrudd, og slutter med et termineringskodon.

6) Den genetiske koden er universell - genene til enhver organisme koder for informasjon om proteiner på nøyaktig samme måte. Det avhenger ikke av kompleksitetsnivået til organiseringen av organismen eller dens systemiske posisjon.

Moderne vitenskap antyder at den genetiske koden oppstår direkte fra fødselen av en ny organisme fra beinstoff. Tilfeldige endringer og evolusjonære prosesser muliggjør alle varianter av koden, dvs. aminosyrer kan omorganiseres i hvilken som helst sekvens. Hvorfor overlevde denne typen kode i løpet av evolusjonen, hvorfor er koden universell og har en lignende struktur? Jo mer vitenskapen lærer om fenomenet den genetiske koden, jo flere nye mysterier oppstår.

Genetiske funksjoner til DNA er at det gir lagring, overføring og implementering av arvelig informasjon, som er informasjon om den primære strukturen til proteiner (dvs. deres aminosyresammensetning). Forholdet mellom DNA og proteinsyntese ble forutsagt av biokjemikerne J. Beadl og E. Tatum tilbake i 1944 da de studerte mekanismen for mutasjoner i muggsoppen Neurospora. Informasjon skrives i form av en spesifikk sekvens av nitrogenholdige baser i et DNA-molekyl ved hjelp av en genetisk kode. Å dechiffrere den genetiske koden regnes som en av de store oppdagelsene i naturvitenskapen i det tjuende århundre. og likestilles i betydning med oppdagelsen av kjerneenergi i fysikk. Suksess på dette området er assosiert med navnet til den amerikanske forskeren M. Nirenberg, i hvis laboratorium det første kodonet, YYY, ble dechiffrert. Imidlertid tok hele prosessen med dekoding mer enn 10 år, mange kjente forskere fra forskjellige land deltok i den, og ikke bare biologer, men også fysikere, matematikere og kybernetikk. Et avgjørende bidrag til utviklingen av en mekanisme for registrering av genetisk informasjon ble gitt av G. Gamow, som var den første som antydet at et kodon består av tre nukleotider. Ved felles innsats fra forskere ble en fullstendig karakterisering av den genetiske koden gitt.

Bokstavene i den indre sirkelen er basene i 1. posisjon i kodonet, bokstavene i den andre sirkelen er
basene i 2. posisjon og bokstavene utenfor den andre sirkelen er basene i 3. posisjon.
Den siste sirkelen inneholder forkortede aminosyrenavn. NP - ikke-polar,
P - polare aminosyrerester.

Hovedegenskapene til den genetiske koden er: trippelhet, degenerasjon og ikke-overlapping... Triplett betyr at en sekvens på tre baser bestemmer inkluderingen av en spesifikk aminosyre i et proteinmolekyl (for eksempel AUG - metionin). Degenerasjonen av koden ligger i det faktum at den samme aminosyren kan kodes av to eller flere kodoner. Ikke-overlappende betyr at den samme basen ikke kan inkluderes i to tilstøtende kodoner.

Fant ut at koden er universell, dvs. prinsippet om å registrere genetisk informasjon er det samme for alle organismer.

Trillinger som koder for samme aminosyre kalles synonyme kodoner. De har vanligvis de samme basene i 1. og 2. posisjon og skiller seg bare i tredje base. For eksempel er inkluderingen av aminosyren alanin i et proteinmolekyl kodet av synonymkodoner i RNA-molekylet - GCA, GCC, GCG, GCY. Den genetiske koden inneholder tre ikke-kodende trillinger (nonsens-kodoner - UAG, UGA, UAA), som spiller rollen som stoppsignaler i prosessen med informasjonslesing.

Det ble funnet at universaliteten til den genetiske koden ikke er absolutt. Mens man opprettholder kodingsprinsippet som er felles for alle organismer og funksjonene til koden, observeres i en rekke tilfeller en endring i den semantiske belastningen til individuelle kodeord. Dette fenomenet ble kalt tvetydigheten til den genetiske koden, og selve koden ble navngitt kvasi-universell.

Les også andre artikler emne 6 "Molekylær basis for arvelighet":

Gå videre til å lese andre emner i boken "Genetikk og seleksjon. Teori. Oppgaver. Svar".

Genetisk kode- et system for registrering av genetisk informasjon i DNA (RNA) i form av en spesifikk sekvens av nukleotider En spesifikk sekvens av nukleotider i DNA og RNA tilsvarer en spesifikk sekvens av aminosyrer i polypeptidkjedene til proteiner. Det er vanlig å skrive koden med store bokstaver i det russiske eller latinske alfabetet. Hvert nukleotid er betegnet med en bokstav som navnet på den nitrogenholdige basen som er inkludert i molekylet begynner: A (A) - adenin, G (G) - guanin, C (C) - cytosin, T (T) - tymin; i RNA i stedet for thiminauracil - U (U). Sekvensen av nukleotider bestemmer sekvensen for inkorporering av AA i det syntetiserte proteinet.

Egenskaper til den genetiske koden:

1. Triplett- den signifikante enheten i koden er en kombinasjon av tre nukleotider (triplett eller kodon).
2. Kontinuitet- det er ingen skilletegn mellom trillinger, det vil si at informasjon leses kontinuerlig.
3. Ikke-overlapping- samme nukleotid kan ikke inkluderes samtidig i to eller flere tripletter (det er ikke observert for noen overlappende gener av virus, mitokondrier og bakterier, som koder for flere proteiner som leses med et rammeskift).
4. Entydighet(spesifisitet) - et visst kodon tilsvarer bare én aminosyre (UGA-kodonet i Euplotescrassus koder imidlertid for to aminosyrer - cystein og selenocystein)
5. Degenerasjon(redundans) - flere kodoner kan tilsvare samme aminosyre.
6. Allsidighet- den genetiske koden fungerer på samme måte i organismer med forskjellige kompleksitetsnivåer - fra virus til mennesker (genteknologiske metoder er basert på dette; det er en rekke unntak vist i tabellen i avsnittet "Variasjoner av standard genetisk kode " nedenfor).

Biosynteseforhold

For proteinbiosyntese kreves den genetiske informasjonen til DNA-molekylet; informasjons-RNA - bæreren av denne informasjonen fra kjernen til syntesestedet; ribosomer - organeller der selve proteinsyntesen finner sted; et sett med aminosyrer i cytoplasmaet; transportere RNA-er som koder for aminosyrer og overføre dem til syntesestedet på ribosomer; ATP er et stoff som gir energi til prosessen med koding og biosyntese.

Stadier

Transkripsjon- prosessen med biosyntese av alle typer RNA på DNA-matrisen, som finner sted i kjernen.

En viss del av DNA-molekylet blir despiralisert, hydrogenbindingene mellom de to kjedene blir ødelagt ved påvirkning av enzymer. På en DNA-streng, som på en mal, syntetiseres en RNA-kopi fra nukleotider på grunnlag av komplementærprinsippet. Avhengig av DNA-seksjonen syntetiseres ribosomale, transport-, informasjons-RNA-er på denne måten.

Etter syntesen av mRNA, forlater det kjernen og sendes inn i cytoplasmaet til stedet for proteinsyntese på ribosomene.


Kringkaste- prosessen med syntese av polypeptidkjeder, utført på ribosomer, der mRNA er et mellomledd i overføringen av informasjon om proteinets primære struktur.

Proteinbiosyntese består av en rekke reaksjoner.

1. Aktivering og koding av aminosyrer. tRNA ser ut som et kløverblad, i den sentrale sløyfen er det et triplettantikodon som tilsvarer koden til en viss aminosyre og kodonet på mRNA. Hver aminosyre kombineres med det tilsvarende tRNA gjennom energien til ATP. Det dannes et tRNA-aminosyrekompleks som går inn i ribosomer.

2. Dannelse av mRNA-ribosomkomplekset. mRNA i cytoplasmaet er koblet av ribosomer på den granulære EPS.

3. Montering av polypeptidkjeden. tRNA med aminosyrer, i henhold til prinsippet om komplementaritet av antikodonet med et kodon, kombineres med mRNA og gå inn i ribosomet. I peptidsenteret av ribosomet dannes det en peptidbinding mellom de to aminosyrene, og det frigjorte tRNA forlater ribosomet. I dette tilfellet flytter mRNA hver gang en triplett, introduserer en ny tRNA - aminosyre og tar ut det frigjorte tRNA fra ribosomet. Hele prosessen drives av ATP-energi. Ett mRNA kan kombineres med flere ribosomer, og danne et polysom, hvor mange molekyler av ett protein syntetiseres samtidig. Syntesen avsluttes når meningsløse kodoner (stoppkoder) starter på mRNA. Ribosomer separeres fra mRNA, og polypeptidkjeder fjernes fra dem. Siden hele synteseprosessen foregår på det granulære endoplasmatiske retikulum, går de dannede polypeptidkjedene inn i EPS-tubuli, hvor de får den endelige strukturen og blir til proteinmolekyler.

Alle syntesereaksjoner katalyseres av spesielle enzymer med energiforbruk ATP. Syntesehastigheten er svært høy og avhenger av lengden på polypeptidet. For eksempel, i ribosomet til E. coli, syntetiseres et protein på 300 aminosyrer på omtrent 15-20 sekunder.

GENETISK KODE, et system for registrering av arvelig informasjon i form av en sekvens av baser av nukleotider i DNA-molekyler (i noen virus - RNA), som bestemmer den primære strukturen (plassering av aminosyrerester) i proteinmolekyler (polypeptider). Problemet med den genetiske koden ble formulert etter å ha bevist den genetiske rollen til DNA (amerikanske mikrobiologer O. Avery, K. McLeod, M. McCarthy, 1944) og dekoding av strukturen (J. Watson, F. Crick, 1953), etter å ha etablert at gener bestemmer strukturen og funksjonen til enzymer (prinsippet om "ett gen - ett enzym" av J. Beadle og E. Tatem, 1941) og at det er en avhengighet av den romlige strukturen og aktiviteten til et protein av dets primærstruktur (F. Senger, 1955). Spørsmålet om hvordan kombinasjoner av 4 baser av nukleinsyrer bestemmer vekslingen av 20 vanlige aminosyrerester i polypeptider ble først stilt av G. Gamow i 1954.

På grunnlag av et eksperiment der interaksjonen mellom innsettinger og slettinger av et par nukleotider ble undersøkt, i et av genene til bakteriofagen T4, bestemte F. Crick og andre forskere i 1961 de generelle egenskapene til den genetiske koden: trippelhet dvs. hver aminosyrerest i polypeptidkjeden tilsvarer et sett med tre baser (triplett eller kodon) i DNAet til et gen; lesing av kodoner i et gen går fra et fast punkt, i én retning og "uten komma", det vil si at kodonene ikke er atskilt med noen tegn fra hverandre; degenerasjon, eller redundans - den samme aminosyreresten kan kodes av flere kodoner (synonyme kodoner). Forfatterne antok at kodonene ikke overlapper hverandre (hver base tilhører bare ett kodon). Den direkte studien av kodingsevnen til tripletter ble fortsatt ved å bruke et cellefritt proteinsyntesesystem under kontroll av syntetisk messenger RNA (mRNA). I 1965 ble den genetiske koden fullstendig dechiffrert i verkene til S. Ochoa, M. Nirenberg og H. G. Korana. Å avsløre hemmelighetene til den genetiske koden var en av biologiens enestående prestasjoner på 1900-tallet.

Implementeringen av den genetiske koden i cellen skjer i løpet av to matriseprosesser - transkripsjon og translasjon. Mediatoren mellom genet og proteinet er mRNA, som dannes under transkripsjon på en av DNA-trådene. I dette tilfellet blir DNA-basesekvensen, som bærer informasjon om proteinets primære struktur, "omskrevet" i form av en mRNA-basesekvens. Deretter, under translasjon på ribosomer, blir mRNA-nukleotidsekvensen lest av transport-RNA (tRNA). Sistnevnte har en akseptorende, som en aminosyrerest er festet til, og en adapterende, eller antikodon-triplett, som gjenkjenner det tilsvarende mRNA-kodonet. Interaksjonen mellom kodon og antikodon skjer på grunnlag av komplementær baseparing: Adenin (A) - Uracil (U), Guanin (G) - Cytosin (C); sekvensen til mRNA-baser omdannes til aminosyresekvensen til det syntetiserte proteinet. Ulike organismer bruker forskjellige synonymkodoner med forskjellige frekvenser for samme aminosyre. Lesingen av mRNA som koder for polypeptidkjeden begynner (initieres) fra AUG-kodonet som tilsvarer aminosyren metionin. Mindre vanlig, hos prokaryoter, er initieringskodonene GUG (valin), UUG (leucin), AUU (isoleucin), i eukaryoter - UUG (leucin), AUA (isoleucin), ACG (treonin), CUG (leucin). Dette setter den såkalte rammen, eller fasen, for lesing under translasjon, det vil si at hele nukleotidsekvensen til mRNA leses triplett for triplett av tRNA inntil noen av de tre terminatorkodonene, ofte kalt stoppkodoner, påtreffes på mRNA: UAA, UAG, UGA (tabell). Lesingen av disse trillingene fører til fullføringen av syntesen av polypeptidkjeden.

AUG-kodoner og stoppkodoner er henholdsvis lokalisert ved begynnelsen og slutten av mRNA-regionene som koder for polypeptider.

Den genetiske koden er kvasi-universell. Dette betyr at det er små variasjoner i betydningen av enkelte kodoner i ulike objekter, og dette gjelder først og fremst terminatorkodoner, som kan være meningsfulle; for eksempel, i mitokondriene til noen eukaryoter og i mykoplasmer, koder UGA for tryptofan. I tillegg, i noen mRNA-er av bakterier og eukaryoter, koder UGA for en uvanlig aminosyre, selenocystein og UAG i en av arkeene, pyrrolysin.

Det er et synspunkt der den genetiske koden oppsto ved en tilfeldighet (hypotesen om "frossen tilfelle"). Det er mer sannsynlig at han har utviklet seg. Denne antagelsen støttes av eksistensen av en enklere og, tilsynelatende, eldre versjon av koden, som leses i mitokondrier i henhold til "to av tre"-regelen, når en aminosyre kun bestemmes av to av tre baser i en trilling.

Litt .: Crick F. N. og. O. Generell karakter av den genetiske koden for proteiner // Natur. 1961. Vol. 192; Den genetiske koden. N.Y. 1966; Ichas M. Biologisk kode. M., 1971; Inge-Vechtomov S.G. Hvordan den genetiske koden leses: regler og unntak // Modern Natural Science. M., 2000. T. 8; Ratner V.A. Genetisk kode som et system // Soros pedagogisk tidsskrift. 2000. T. 6. Nr. 3.

S. G. Inge-Vechtomov.

GENETISK KODE(Gresk, genetikos som refererer til opprinnelse; syn.: kode, biologisk kode, aminosyrekode, proteinkode, nukleinsyrekode) - et system for registrering av arvelig informasjon i nukleinsyremolekyler til dyr, planter, bakterier og virus ved å veksle mellom sekvensen av nukleotider.

Genetisk informasjon (Fig.) Fra celle til celle, fra generasjon til generasjon, med unntak av RNA-holdige virus, overføres ved duplisering av DNA-molekyler (se Replikasjon). Den arvelige informasjonen til DNA i prosessen med celleliv realiseres gjennom 3 typer RNA: informasjons (mRNA eller mRNA), ribosomalt (rRNA) og transport (tRNA), som syntetiseres på DNA som på en mal ved hjelp av RNA-polymerasen enzym. I dette tilfellet bestemmer sekvensen av nukleotider i et DNA-molekyl unikt sekvensen av nukleotider i alle tre typer RNA (se transkripsjon). Informasjonen til genet (se) som koder for et proteinmolekyl bæres bare av mRNA. Sluttproduktet av realiseringen av arvelig informasjon er syntesen av proteinmolekyler, hvis spesifisitet bestemmes av sekvensen til deres aminosyrer (se. Oversettelse).

Siden DNA eller RNA inneholder kun 4 forskjellige nitrogenholdige baser [i DNA - adenin (A), tymin (T), guanin (G), cytosin (C); i RNA - adenin (A), uracil (Y), cytosin (C), guanin (G)], hvis sekvens bestemmer sekvensen av 20 aminosyrer i proteinet, oppstår problemet med G. til, dvs. , problemet med å oversette 4-bokstaven i alfabetets nukleinsyre til-t i et 20-bokstavs alfabet av polypeptider.

For første gang ble ideen om en matrisesyntese av proteinmolekyler med en korrekt prediksjon av egenskapene til en hypotetisk matrise formulert av N.K. ... I 1948 viste E. Chargaff at i alle DNA-molekyler er det en kvantitativ likhet av de tilsvarende nukleotidene (A-T, G-C). I 1953 kom F. Crick, J. Watson og Wilkins (M. HF Wilkins), på bakgrunn av denne regelen og dataene for røntgenstrukturanalyse (se), til den konklusjon at DNA-molekyler er en dobbel helix bestående av to polynukleotider tråder forbundet med hydrogenbindinger. Dessuten kan bare T være i den andre kjeden mot A, og bare C mot G. Denne komplementariteten fører til at nukleotidsekvensen til en kjede unikt bestemmer sekvensen til den andre. Den andre viktige konklusjonen som følger fra denne modellen er at DNA-molekylet er i stand til selvreproduksjon.

I 1954 formulerte G. Gamow problemet med G. til i sin moderne form. I 1957 uttrykte F. Crick Adapter Hypothesis, og antydet at aminosyrer interagerer med nukleinsyren ikke direkte, men gjennom mellomledd (nå kjent som tRNA). I årene som fulgte ble alle de grunnleggende koblingene til den generelle ordningen for overføring av genetisk informasjon, først hypotetisk, eksperimentelt bekreftet. I 1957 ble mRNA oppdaget [A. S. Spirin, A.N. Belozersky et al.; Folkin og Astrakhan (E. Volkin, L. Astrachan)] og tRNA [Hoagland (MV Hoagland)]; i 1960 ble DNA syntetisert utenfor cellen ved å bruke eksisterende DNA-makromolekyler som en matrise (A. Kornberg) og DNA-avhengig RNA-syntese ble oppdaget [Weiss (S.B. Weiss) et al.]. I 1961 ble et cellefritt system opprettet, i et kutt, i nærvær av naturlig RNA eller syntetiske polyribonukleotider, syntesen av proteinlignende stoffer ble utført [M. J. H. Matthaei]. Problemet med erkjennelse av G. til Bestod i å studere de generelle egenskapene til koden og faktisk dekode den, det vil si å finne ut hvilke kombinasjoner av nukleotider (kodoner) som koder for visse aminosyrer.

De generelle egenskapene til koden ble belyst uavhengig av dens dekoding og hovedsakelig før den ved å analysere de molekylære lovene for dannelsen av mutasjoner (F. Crick et al., 1961; N.V. Luchnik, 1963). De koker ned til følgende:

1. Koden er universell, det vil si at den er identisk, i det minste i hovedsak, for alle levende vesener.

2. Koden er triplett, dvs. hver aminosyre er kodet av en triplett av nukleotider.

3. Koden er ikke-overlappende, det vil si at et gitt nukleotid ikke kan inkluderes i mer enn ett kodon.

4. Koden er degenerert, dvs. én aminosyre kan kodes av flere tripletter.

5. Informasjon om proteinets primære struktur leses fra mRNA sekvensielt, med utgangspunkt i et fast punkt.

6. De fleste mulige trillingene har en "betydning", det vil si at de koder for aminosyrer.

7. Av de tre "bokstavene" i kodonet er det bare to (obligate) som har en dominerende betydning, mens den tredje (valgfritt) har mye mindre informasjon.

Direkte dekoding av koden vil bestå i å sammenligne sekvensen av nukleotider i det strukturelle genet (eller mRNA syntetisert på det) med sekvensen av aminosyrer i det tilsvarende proteinet. Imidlertid er denne veien fortsatt teknisk umulig. To andre måter ble brukt: proteinsyntese i et cellefritt system ved bruk av kunstige polyribonukleotider med kjent sammensetning som en matrise og analyse av molekylære mønstre for mutasjonsdannelse (se). Den første brakte positive resultater tidligere og spilte historisk en viktig rolle i å tyde G. til.

I 1961 brukte M. Nirenberg og Mattei en homopolymer - syntetisk polyuridyl til - det (dvs. kunstig RNA-sammensetning UUUU ...) som en matrise og oppnådde polyfenylalanin. Av dette fulgte det at fenylalanin-kodonet består av flere Y, dvs. i tilfelle av en triplettkode, er det dechiffrert som UUU. Senere, sammen med homopolymerer, ble polyribonukleotider bestående av forskjellige nukleotider brukt. I dette tilfellet var bare sammensetningen av polymerene kjent, arrangementet av nukleotider i dem var statistisk, derfor var analysen av resultatene statistisk og ga indirekte konklusjoner. Ganske raskt klarte vi å finne minst én triplett for alle 20 aminosyrene. Det viste seg at tilstedeværelsen av organiske løsemidler, endringer i pH eller temperatur, noen kationer og spesielt antibiotika gjør koden tvetydig: de samme kodonene begynner å stimulere inkluderingen av andre aminosyrer, i noen tilfeller begynte ett kodon å kode for opptil fire forskjellige aminosyrer. Streptomycin påvirket lesingen av informasjon både i cellefrie systemer og in vivo, og var kun effektiv på streptomycin-mottakelige bakteriestammer. I streptomycinavhengige stammer "korrigerte" den avlesningen fra kodoner som har endret seg som følge av mutasjon. Lignende resultater ga grunn til å tvile på riktigheten av å dechiffrere G. til Ved å bruke et cellefritt system; bekreftelse var nødvendig, først og fremst ved in vivo-data.

De grunnleggende dataene om G. til In vivo ble oppnådd ved å analysere aminosyresammensetningen til proteiner i organismer behandlet med mutagener (se) med en kjent virkningsmekanisme, for eksempel nitrogenholdige kanter i DNA-molekylet forårsaker erstatning av C med U og A med D. Nyttig informasjon er også gitt ved analyse av mutasjoner forårsaket av uspesifikke mutagener, sammenligning av forskjeller i primærstrukturen til beslektede proteiner i forskjellige arter, korrelasjonen mellom sammensetningen av DNA og proteiner, etc. .

G. sin dekoding til. På grunnlag av data in vivo og in vitro ga samme resultater. Senere ble det utviklet tre andre metoder for å dekode koden i cellefrie systemer: binding av aminoacyl-tRNA (dvs. tRNA med en festet aktivert aminosyre) med trinukleotider av kjent sammensetning (M. Nirenberg et al., 1965), binding av aminoacyl-tRNA med polynukleotider som starter med en viss triplett (Mattei et al., 1966), og bruk av polymerer som mRNA, der ikke bare sammensetningen, men også nukleotidrekkefølgen er kjent (X. Korana et al. , 1965). Alle tre metodene utfyller hverandre, og resultatene er i samsvar med dataene som er oppnådd i eksperimenter in vivo.

På 70-tallet. Det 20. århundre fremgangsmåter for spesielt pålitelig verifisering av resultatene av dekoding av G. Det er kjent at mutasjoner som oppstår under påvirkning av proflavin består i tap eller innsetting av individuelle nukleotider, noe som fører til et skifte i leserammen. I T4-fagen ble en rekke mutasjoner forårsaket av proflavin, hvor sammensetningen av lysozym endret seg. Denne sammensetningen ble analysert og sammenlignet med de kodonene som burde vært oppnådd med et skifte i leserammen. Det viste seg å være en komplett match. I tillegg gjorde denne metoden det mulig å fastslå nøyaktig hvilke tripletter av den degenererte koden som koder for hver av aminosyrene. I 1970 klarte JM Adams med kolleger å delvis dechiffrere G. til. Ved en direkte metode: i R17-fagen ble sekvensen av baser i et fragment på 57 nukleotider i lengde bestemt og sammenlignet med aminosyresekvensen til proteinet til skallet sitt. Resultatene stemte helt overens med de som ble oppnådd ved mindre direkte metoder. Dermed er koden dekryptert fullstendig og korrekt.

Dekrypteringsresultatene er oppsummert i tabellen. Den inneholder sammensetningen av kodoner og RNA. Sammensetningen av tRNA-antikodoner er komplementær til mRNA-kodonene, dvs. i stedet for Y inneholder de A, i stedet for A - Y, i stedet for C - G og i stedet for G - C, og tilsvarer kodonene til det strukturelle genet (at DNA streng som informasjonen leses fra) med den eneste forskjellen at uracil tar tymins plass. Av de 64 trillingene som kan dannes ved å kombinere 4 nukleotider, har 61 "mening", det vil si at de koder for aminosyrer, og 3 er "nonsens" (meningsløst). Det er et ganske klart forhold mellom sammensetningen av trillinger og deres betydning, som ble oppdaget selv under analysen av kodens generelle egenskaper. I noen tilfeller er tripletter som koder for en bestemt aminosyre (f.eks. prolin, alanin) karakterisert ved at de to første (obligate) nukleotidene er like, og den tredje (valgfritt) kan være hvilken som helst. I andre tilfeller (når de koder, for eksempel asparagin, glutamin), har to like trillinger samme betydning, der de to første nukleotidene faller sammen, og enhver purin eller hvilken som helst pyrimidin er i stedet for den tredje.

Nonsens-kodoner, hvorav 2 har spesielle navn som tilsvarer betegnelsen på fagmutanter (UAA-oker, UAG-rav, UGA-opal), selv om de ikke koder for noen aminosyrer, men er av stor betydning for lesing av informasjon, koding av slutten av polypeptidkjeden ...

Informasjon leses i retning fra 5 1 -> 3 1 - til slutten av nukleotidkjeden (se. Deoksyribonukleinsyrer). I dette tilfellet fortsetter proteinsyntesen fra en aminosyre med en fri aminogruppe til en aminosyre med en fri karboksylgruppe. Begynnelsen av syntesen er kodet av triplettene AUG og GUG, som i dette tilfellet inkluderer et spesifikt startaminoacyl-tRNA, nemlig N-formylmetionyl-tRNA. De samme trillingene, når de er lokalisert i kjeden, koder for henholdsvis metionin og valin. Tvetydigheten fjernes ved at lesningens begynnelse innledes med tull. Det er bevis på at grensen mellom regionene til mRNA som koder for forskjellige proteiner består av mer enn to tripletter og at den sekundære strukturen til RNA endres på disse stedene; denne saken er under etterforskning. Hvis et nonsens-kodon oppstår i et strukturelt gen, bygges det tilsvarende proteinet bare opp til plasseringen av dette kodonet.

Oppdagelsen og dekodingen av den genetiske koden - en enestående prestasjon av molekylærbiologi - påvirket all biologi, vitenskaper, i en rekke tilfeller, og la grunnlaget for utviklingen av spesielle store seksjoner (se. Molekylær genetikk). Effekten av å åpne G. til. Og relatert forskning sammenlignes med effekten som Darwins teori hadde på biol, vitenskap.

Universaliteten til G. til er et direkte bevis på universaliteten til de grunnleggende molekylære mekanismene i livet i alle representanter for den organiske verden. I mellomtiden er store forskjeller i funksjonene til det genetiske apparatet og dets struktur under overgangen fra prokaryoter til eukaryoter og fra encellede til flercellede organismer sannsynligvis assosiert med molekylære forskjeller, hvor studiet er en av fremtidens oppgaver. Siden G.s forskning kun er et spørsmål om de siste årene, er betydningen av resultatene oppnådd for praktisk medisin kun av indirekte karakter, som foreløpig lar forstå sykdommers natur, virkningsmekanismen til patogener. og medisinske stoffer. Imidlertid indikerer oppdagelsen av slike fenomener som transformasjon (se), transduksjon (se), undertrykkelse (se), den grunnleggende muligheten for å korrigere patologisk endret arvelig informasjon eller dens korreksjon - den såkalte. genteknologi (se).

Bord. GENETISK KODE

Første nukleotidkodon

Andre nukleotidkodon

For det tredje, nukleotidkodon

Fenylalanin

J Tull

Tryptofan

Histidin

Glutaminsyre

Isoleucin

Asparaginsk

Metionin

Asparagin

Glutamin

* Koder enden av kjeden.

** Koder også begynnelsen av kjeden.

Bibliografi: Ichas M. Biologisk kode, overs. fra English, M., 1971; Archer N.B. Biofysikk av cytogenetiske lesjoner og den genetiske koden, L., 1968; Molekylær genetikk, trans. fra engelsk, red. A. N. Belozersky, del 1, M., 1964; Nukleinsyrer, trans. fra engelsk, red. A.N. Belozersky, M., 1965; Watson JD Molekylær biologi av genet, trans. fra engelsk., M., 1967; Fysiologisk genetikk, red. M. E. Lobasheva S. G., Inge-Vechtomo-va, L., 1976, bibliogr.; Desoxyribonuc-leins & ure, Schlttssel des Lebens, hrsg. v & E. Geissler, B., 1972; Den genetiske koden, Gold Spr. Harb. Symp. kvant. Biol., V. 31, 1966; W o e s e C. R. Den genetiske koden, N. Y. a. o., 1967.