Edellisessä artikkelissani esittelin DNA:n, nukleotidien ja niiden järjestelyn perusteet. Saatat ihmetellä, miten voimme tunnistaa DNA-molekyylin nukleotidien tarkan järjestyksen. Tässä kohtaa DNA:n sekvensointi astuu kuvaan.
Sekvensointi on toimenpide, jolla määritetään tietyn DNA-molekyylin nukleotidien tarkka järjestys. Sitä käytetään DNA-juosteen neljän emäksen adeniinin (A), guaniinin (G), sytosiinin (C) ja tymiinin (T) järjestyksen määrittämiseen.
DNA:n sekvensointia käytetään yksittäisten geenien, kokonaisten kromosomien tai koko organismin genomin järjestyksen määrittämiseen. DNA-sekvensoinnista on tullut myös tehokkain tapa sekvensoida RNA:ta tai proteiineja.
Britannialaisen biokemistin nimeltä Frederick Sanger tekemä työ loi pohjan valkuaisaineiden sekvensoinnille. Vuonna 1955 Sanger oli saanut valmiiksi kaikkien insuliinin aminohappojen sekvenssin. Hänen työnsä antoi todisteita siitä, että proteiinit koostuivat kemiallisista kokonaisuuksista, joilla oli tietty kuvio, eikä aineiden sekoituksesta.
Myöhemmin Frederick Sanger ja hänen kollegansa kehittivät vuonna 1977 menetelmän, jota kutsuttiin nimellä Sanger- sekvensointi (Sanger Sequencing) ja jossa DNA:ta pystyttiin sekvensoimaan luomalla siitä katkelmia. Se oli laajimmin käytetty sekvensointimenetelmä noin 40 vuoden ajan.
Koko genomin sekvensointi ja sekvenssien kokoaminen
DNA:n sekvensointireaktio tuottaa useita satoja emäksiä pitkän sekvenssin. Geenisekvenssit ovat tyypillisesti tuhansia emäksiä pitkiä. Suurin tunnettu geeni on Duchennen lihasdystrofiaan liittyvä geeni. Sen pituus on noin 2,4 miljoonaa emästä. Tutkijat käyttävät yhden kokonaisen geenin tutkimiseen yksinkertaista strategiaa, jota kutsutaan haulikkosekvensoinniksi. Pitkä DNA-sekvenssi kootaan sarjasta lyhyempiä päällekkäisiä sekvenssejä. Katsotaan, mitä haulikkosekvensointimenetelmässä tapahtuu.
Haulikkosekvensointi
Erikoiskoneiden, niin sanottujen sekvensointikoneiden, avulla poimitaan lyhyitä sattumanvaraisia DNA-sekvenssejä tietystä genomista, jota halutaan määrittää (kohdegenomi). Nykyisillä DNA-sekvensointitekniikoilla ei voida lukea yhtä kokonaista genomia kerralla. Siinä luetaan pieniä, 20-30000 emäksen pituisia pätkiä käytetystä tekniikasta riippuen. Näitä lyhyitä kappaleita kutsutaan lukemiksi. Erikoisohjelmia käytetään näiden lukujen kokoamiseen sen mukaan, miten ne ovat päällekkäisiä, jotta saadaan muodostettua jatkuvia ketjuja, joita kutsutaan contigeiksi. Nämä contigit voivat olla koko kohdegenomi itsessään tai osia genomista (kuten yllä olevassa kuvassa on esitetty).
Prosessi, jossa pidemmän DNA-sekvenssin fragmentteja kohdistetaan ja yhdistetään alkuperäisen sekvenssin rekonstruoimiseksi, tunnetaan nimellä sekvenssin assosiointi.
Koko genomin sekvenssin saamiseksi saatetaan joutua tuottamaan yhä useampia satunnaisia lukukappaleita, kunnes contigit täsmäävät kohdegenomiin.
Sekvenssin kokoamisongelma
Sekvenssin kokoamisongelma voidaan kuvata seuraavasti.
Antaen joukon sekvenssejä, etsi minimaalisen pituinen merkkijono, joka sisältää kaikki joukon jäsenet osajonoina.
Verpaine 102/50 – mitä se tarkoittaa?Verpaine 102/50 verenpainetaulukossaTarkistatko toisen arvon?Verpaine 102/50 verenpaineasteikollaMitä? sinun tulisi tietää verenpaineesta 102/50Verpaine 102/50 verenpainemittarissaViimeisimmät viestitTarkista…
Tämä artikkeli sisältää affiliate-linkkejä. Jos klikkaat linkkiä ja teet sitten ostoksen, saatamme saada pienen provision ilman kustannuksia sinulle. Vartioi linnunpönttösi…
Mitä on vähähiilihydraattinen Välimeren ruokavalio?Matalamman hiilihydraattipitoisuuden ja rasvapitoisuuden Välimeren ruokavalion edut.Miltä vähähiilihydraattinen Välimeren ruokavalio näyttää?Mitä vähennät tai jätät pois ollaksesi…