Egenskaber og anvendelser af enkeltmolekylær DNA-sekventering

Når man ser på egenskaberne ved enkeltmolekylære sekventeringsteknologier, er der oftest fokus på læselængde, fejlfrekvens og gennemløb (figur 3); Imidlertid er kravene til mængde og kvalitet af indgangsprøver, enkelhed og parallelisering af prøveforberedelse og dataanalyse også vigtige komponenter, der skal tages med i betragtning, når man overvejer, om en teknologi, enkeltmolekylær eller anden, er egnet til et givet problem. Tabel 1 viser nogle af de applikationer, der hyppigt anvendes med de nuværende sekventeringsteknologier, og den relative betydning af forskellige egenskaber ved de forskellige sekventeringsmetoder. Vigtige egenskaber ved enkeltmolekylteknologier, der vedrører disse forskellige anvendelser, diskuteres nedenfor.

Figur 3
Figur3

Egenskaberne ved enkeltmolekyl-sekventeringsteknologi. De nuværende læsetællinger og læselængder for enkeltmolekyl-sekventeringsteknologier er vist med prikkerne. Hver teknologi stræber efter forbedringer af deres nøgleegenskaber, og forskningen er rettet mod de retninger, der er vist med pilen.

Tabel 1 Hvilken sekventeringsteknologi skal man bruge og hvornår?a

Sekventering ved syntese

Det første kommercielt tilgængelige enkeltmolekyl-sekventeringssystem blev udviklet af vores kolleger hos Helicos BioSciences . I dette system hybridiseres individuelle molekyler til en flowcelleoverflade, der indeholder kovalent fastgjorte oligonukleotider. Fluorescensmærkede nukleotider og en DNA-polymerase tilsættes sekventielt, og inkorporeringsbegivenhederne detekteres ved hjælp af lasereksponering og optagelse med et CCD-kamera (Charge Coupled Device). Det fluorescerende “Virtual Terminator”-nukleotid forhindrer inkorporering af ethvert efterfølgende nukleotid, indtil nukleotidfarvestofdelen er spaltet . Billederne fra hver cyklus samles for at generere et samlet sæt sekvenslæsninger. Ved en standardkørsel udføres der 120 cyklusser med nukleotidtilsætning og detektion. Langt over en milliard molekyler kan følges samtidigt med denne metode. Da der er to 25-kanals flowceller i en standardkørsel, kan 50 forskellige prøver sekventeres samtidigt, og der er desuden mulighed for en betydelig større gennemstrømning af prøver ved hjælp af multiplexing. Prøvekravene er de enkleste af alle teknologier: det er nødvendigt med sub-nanogramm mængder, og DNA af meget dårlig kvalitet, herunder nedbrudt eller modificeret DNA, kan sekventeres . De gennemsnitlige læselængder er relativt korte (ca. 35 nt) med en fejlprocent for rå individuelle nukleotidfejl på ca. 3-5 %, der forekommer tilfældigt i hele sekvensen og overvejende i form af en “mørk base” eller sletningsfejl, som der tages højde for i tilpasningsalgoritmen . Denne fejlprocent er ikke et problem ved påvisning af polymorfismer, fordi der typisk anvendes 30× dækning for diploide genomer med andengenerationssystemer for at overvinde den ujævne dækning, der fremkaldes af amplifikation. Der er behov for overprøveudtagning for at overvinde den stokastiske karakter af heterozygote-detektion, idet 30 × dækning er tilrådeligt for at sikre, at næsten alle heterozygoter kaldes korrekt. Ved dette dækningsniveau genereres der nøjagtige konsensussekvenser uanset fejlprocenterne inden for dette område. Enkeltmolekylære systemer har en meget mere jævn dækning og kræver derfor ikke så stor dybde for fuldstændig påvisning af heterozygoter. Den jævne dækning i forhold til andengenerationssystemer blev vist med ChIP-eksperimenter, hvor sekvenslæsninger var relativt konstante med hensyn til GC-indholdet med enkeltmolekyl-sekventering, mens der blev observeret betydelige afvigelser ved både højt og lavt GC-indhold med amplifikationsbaseret sekventering og med helgenomsekventering af en menneskelig prøve .

Helicos Sequencer-systemet kan også sekventere RNA-molekyler direkte, hvorved man undgår de mange artefakter, der er forbundet med omvendt transkriptase, og giver en uovertruffen kvantitativ nøjagtighed ved målinger af RNA-ekspression . Det meget høje antal læsninger pr. prøve gør det muligt at foretage præcise ekspressionsmålinger med enten RNA eller cDNA , en funktion, der endnu ikke er mulig med andre enkeltmolekylære teknologier. Faktisk kan hele klasser af RNA-molekyler, som ikke kan visualiseres ved hjælp af andre teknologier, påvises ved hjælp af en enkeltmolekylær tilgang . Som med mange enkeltmolekylsystemer kan gentagne læsninger af det samme molekyle markant forbedre fejlprocenten og også gøre det muligt at påvise meget sjældne varianter i en blandet prøve. F.eks. vil en sjælden variant i en prøve, der indeholder en blanding af få tumorceller blandt mange normale celler, måske ikke kunne påvises med forstærket DNA. Ved gentagen sekventering af det samme molekyle kan fejlfrekvensen sættes så lavt, at mutationer i heterogene prøver, f.eks. tumorer, let kan påvises. På grund af det minimale behov for prøveforberedelse, muligheden for at anvende usædvanligt små startmængder og det høje antal læsninger er denne teknologi ideel til kvantitative anvendelser såsom ChIP, RNA-ekspression og variation i antallet af kopier og situationer, hvor prøvens mængde er begrænsende eller nedbrydelig . Standard, gensekventering af hele det menneskelige genom er let at udføre , men det er i øjeblikket billigere på andengenerationssystemer.

Pacific Biosciences har udviklet en anden sekventering-by-syntese-tilgang ved hjælp af fluorescensmærkede nukleotider. I dette system er DNA begrænset til et meget lille volumen i en nulmodusbølgeguide, og tilstedeværelsen af et fluorescerende mærket kognatnukleotid i nærheden af DNA-polymerasen måles. Bølgeguidens dimensioner er så små, at lyset kun kan trænge ind i området meget tæt på kanten, hvor den polymerase, der anvendes til sekventering, er spærret inde. Kun nukleotider i dette lille volumen i nærheden af polymerasen kan belyses og fluorescere med henblik på detektion. Fordi det nukleotid, der er ved at blive inkorporeret i den forlængede DNA-streng, tilbringer længere tid i nærheden af polymerasen, kan det i vid udstrækning skelnes fra de nukleotider, der ikke er genkendt. Alle fire potentielle nukleotider indgår i reaktionen og er hver især mærket med et fluorescerende farvestof af forskellig farve, således at de kan skelnes fra hinanden. Hvert nukleotid har en karakteristisk inkorporeringstid, som yderligere kan bidrage til at forbedre baseopkaldelserne. Der opnås sekvensaflæsninger på op til tusindvis af baser, som er længere end muligt med andengenerationssystemer, i realtid for hvert enkelt molekyle . Den nuværende gennemstrømning er dog mindre end 100 000 læsninger pr. kørsel, så det samlede sekvensudbytte er meget lavere end ved andengenerationssystemer og Helicos-systemet. Desuden er den rå fejlprocent, der i øjeblikket er 15-20 % , betydeligt højere end med nogen anden nuværende sekventeringsteknologi, hvilket skaber udfordringer i forbindelse med brugen af dataene til visse anvendelser, f.eks. variantdetektion.

Meget længere læsninger, kaldet “strobe-reads” , kan genereres ved at slukke for laseren i perioder under sekventeringen, hvilket forhindrer for tidlig afslutning forårsaget af laserinduceret fotoskade på polymerasen og nukleotiderne. Hvis lange læsninger ikke er nødvendige, kan den høje råfejlprocent overvindes ved at ligere et hårnålsoligonukleotid til hver ende af DNA’et, hvorved der skabes en cirkulær skabelon (kaldet SMRTbell for single molecule real time), og derefter sekventeres det samme molekyle gentagne gange . Denne procedure fungerer, når molekylerne er relativt korte, men den kan ikke anvendes med lange læsninger, så disse bevarer den høje råfejlprocent. Selv med en høj fejlprocent kan de meget lange læsninger anvendes produktivt til at sammenføje sekvenskontigs. En yderligere fordel ved dette system er muligheden for potentielt at påvise modificerede baser. Det er muligt at påvise 5-methylcytosin , selv om det endnu ikke er afklaret, hvilken rolle sekvenskonteksten og andre faktorer spiller for nøjagtigheden af sådanne tildelinger. I princippet burde direkte RNA-sekventering også være mulig med dette system, men dette er endnu ikke blevet rapporteret for naturlige RNA-molekyler, fordi nukleotider binder gentagne gange til den omvendte transkriptase før nukleotidindbygning, hvilket giver falske signaler med flere indsættelser, der forhindrer bestemmelse af en meningsfuld sekvens. Desuden vil det lave antal læsninger i dette system begrænse det til identifikation af almindelige mRNA-isoformer snarere end til kvantitativ ekspressionsprofilering eller fuldstændig transkriptomdækning, som begge kræver et meget højere antal læsninger end muligt i en overskuelig fremtid. Generelt set gør de lange læsninger og den korte ekspeditionstid dette system mest anvendeligt til at hjælpe med at samle genomer, vurdere analysen af strukturel variation, haplotypning, metagenomik og identifikation af splejsning af isoformer.

Life Technologies, en stor leverandør af både første og anden generations sekventeringssystemer, er ved at udvikle den fluorescensresonansenergioverførsel (FRET)-baserede enkeltmolekyl-sekventering-by-syntese-teknologi, der oprindeligt blev introduceret af Visigen . Der er gjort betydelige fremskridt, og den kommercielle lancering af “Starlight”-systemet forventes at finde sted i den nærmeste fremtid. Den nuværende teknologi består af en kvantepunkt-mærket polymerase, der syntetiserer DNA ved hjælp af fire særskilt mærkede nukleotider i et realtidssystem . Kvantepunkter, som er fluorescerende halvledende nanopartikler, har en fordel i forhold til fluorescerende farvestoffer, idet de er meget lysere og mindre modtagelige for blegning, selv om de også er meget større og mere modtagelige for blinkning. Genomprøven, der skal sekventeres, bindes til et oligonukleotid på overfladen med en defineret sekvens og læses derefter ved forlængelse af en primer, der er komplementær til overfladeoligonukleotidet. Når et fluorescerende mærket nukleotid binder sig til polymerasen, vekselvirker det med kvantepunktet, hvilket medfører en ændring i fluorescensen af både nukleotidet og kvantepunktet. Kvantepunktssignalet falder, mens et signal fra det farvestofmærkede fosfat på hvert nukleotid stiger ved en karakteristisk bølgelængde. Realtidssekvensen optages for hver forlængende primer. Fordi hver sekvens er bundet til overfladen, kan den genimprimeres og sekventeres igen for at opnå større nøjagtighed. Det er ikke klart, hvad sekvensspecifikationerne vil være, men ligheden med Pacific Biosciences-teknologien gør den til et sandsynligt referencepunkt. I så fald vil den have de samme styrker med hensyn til applikationer (genomsamling, strukturel variation, haplotyping, metagenomik), mens den potentielt vil blive udfordret med kvantitative applikationer, der kræver et højt antal læsninger (f.eks. ChIP eller RNA-ekspression).

Optisk sekventering og kortlægning

Der er andre teknologier, der gør det muligt at producere meget lange læsninger, men på bekostning af en betydeligt lavere gennemstrømning. Det er f.eks. muligt at klæbe meget lange DNA-molekyler, der kan være op til flere hundrede kilobaser lange, til overflader og afhøre dem for bestemte sekvenser ved at skære dem med forskellige restriktionsenzymer eller mærke dem efter behandling med sekvensspecifikke nikkende enzymer. Længden af de undersøgte molekyler er afhængig af evnen til at håndtere så langt DNA uden mekanisk klipning af det. Komplette restriktionsdigester, der gør det muligt at ordne sekvenskontigs, er blevet genereret for menneskelige og andre genomer fra samlinger af enkeltmolekyler, der spænder over hele genomer . Meget repetitive og duplikerede genomer, som f.eks. majs, er særligt vanskelige at samle med traditionel sekventering, men er blevet analyseret med succes med dette enkeltmolekylsystem . Restriktionsstederne giver sekvensmærker på DNA’et, og derfor kan lange gentagelsesregioner og andre indviklede strukturelle variationer tildeles på en entydig måde. Specialiserede anvendelser som f.eks. genom-dækkende methyleringskortlægning kan også foretages .

Sådan kan DNA-molekyler begrænses til nanorør og mærkes specifikt med henblik på visning . Enkeltmolekyler af RNA er blevet visualiseret ved hjælp af scanning tip Raman spektroskopi . I en alternativ metode, der også anvender adsorption af lange DNA-molekyler til en overflade, kunne guaniner skelnes fra alle andre baser, og den delvise sekvens kunne aflæses med et scanningelektronmikroskop . Mulighederne for at aflæse andre baser ved at indsætte tunge atomer som brom eller jod på bestemte nukleotider er blevet foreslået af ZS Genetics . Selv om den lave strenggennemstrømning og den ufuldstændige sekvensaflæsning i øjeblikket er begrænsende, er der potentiale for aflæsninger, der er hundredvis af kilobaser lange, hvilket igen primært er begrænset af evnen til at håndtere DNA’et uden at skære det. Andre teknologier, der anvender direkte læsning af strækket DNA, er blevet gennemgået andetsteds . Disse optiske sekventeringsteknologier giver et stærkt billede af genomets struktur, men de kan ikke give detaljerede sekvensdata eller adgang til mange andre sekventeringsapplikationer, der kræver høje antal læsninger, f.eks. målinger af genekspression.

Nanoporer

Alle de hidtil beskrevne sekventeringsteknikker kræver en eller anden form for mærkning på DNA’et eller nukleotid-substraterne for at detektere den enkelte base til sekventering. Nanoporemetoder kræver imidlertid generelt ikke en eksogen mærkning, men er i stedet afhængige af den elektroniske eller kemiske struktur af de forskellige nukleotider til at skelne mellem dem. Fordelene ved og mulighederne for at anvende nanoporer er blevet gennemgået . De nanoporer, der hidtil har været af størst interesse, omfatter de nanoporer, der er sammensat med faststofsystemer af materialer som f.eks. kulstofnanorør eller tynde film og det biologisk baserede α-hemolysin eller MspA . Disse bakterielle poreproteiner er blevet grundigt undersøgt og konstrueret med henblik på at optimere påvisningen af specifikke baser og translokationshastigheden af DNA gennem porerne. Selv om sekventering af naturligt DNA baseret på dets naturlige egenskaber ville eliminere mærkningstrinnet og potentielt muliggøre meget lange læsninger med minimal prøveforberedelse og dermed reducere omkostningerne, er forskellene mellem nukleotider meget beskedne, og deres påvisning forværres af vanskeligheder med at kontrollere DNA’ets hastighed og retningsbestemthed gennem nanoporen. Specifik detektion og ensrettet strømning er nødvendig for sekventering med høj nøjagtighed.

Der er blevet anvendt en række metoder til at bremse DNA’s hastighed gennem nanoporer, herunder vedhæftning af polystyrenperler , saltkoncentrationer , viskositet , magnetfelter og indførelse af regioner af dobbeltstrenget DNA på et enkeltstrenget mål . Ved de høje translokationshastigheder, der typisk findes (potentielt millioner af baser pr. sekund), kan det være en udfordring at detektere et signal i forhold til baggrundsstøjen fra hvert enkelt nukleotid, og dette er i nogle tilfælde blevet overvundet ved at læse grupper af nukleotider (f.eks. ved hjælp af hybridisering af kendte sekvenser, som NabSys er ved at udvikle) eller ved at kode den oprindelige sekvens på en mere kompleks måde ved at konvertere nukleotidsekvensen ved hjælp af en binær kode af molekylære beacons (som NobleGen er ved at udvikle). Det er blevet forbedret at opretholde en ensrettet strøm af DNA ved at koble en exonuklease til processen og læse de spaltede nukleotider (som udviklet af Oxford Nanopore ).

Og selv om nanopore-sekventeringsteknologier fortsat udvikler sig, er det ikke tilstrækkeligt blot at vise evnen til at sekventere DNA, hvilket nanoporer endnu ikke har demonstreret med naturligt DNA, ikke tilstrækkeligt. Der skal være en vej til lavere omkostninger, længere læsninger eller højere nøjagtighed i forhold til andre teknologier, som vil give nanoporerne en unik fordel i forhold til andre metoder. Selv om omkostningerne til reagenser kan reduceres betydeligt, er der stadig omkostninger til prøveforberedelse og informationsteknologi, og disse kan blive de dominerende omkostninger ved sekventering og vil variere afhængigt af den anvendte teknologi. De stadigt stigende hindringer, som den eksisterende teknologi skaber, vil ikke være lette at overvinde. Med de mange forskellige andengenerations- og enkeltmolekylteknologier, der allerede er markedsført, og andre i horisonten, vil der være behov for betydelige fremskridt på mange fronter for at gøre disse teknologier kommercielt levedygtige.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.