Az egymolekulás DNS-szekvenálás tulajdonságai és alkalmazásai

Az egymolekulás szekvenálási technológiák tulajdonságainak vizsgálatakor leggyakrabban a leolvasási hossz, a hibaarány és az átviteli sebesség kerül a középpontba (3. ábra); azonban a bemeneti minta mennyiségi és minőségi követelményei, a mintaelőkészítés egyszerűsége és párhuzamosíthatósága, valamint az adatelemzés is fontos összetevők, amelyeket szintén figyelembe kell venni, amikor mérlegeljük, hogy egy adott problémához megfelelő-e egymolekulás vagy más technológia. A jelenlegi szekvenálási technológiákkal gyakran végzett alkalmazások közül néhányat és a különböző szekvenálási módszerek különböző tulajdonságainak relatív fontosságát az 1. táblázat mutatja be. Az egymolekulás technológiák e különböző alkalmazásokhoz kapcsolódó fontos tulajdonságait az alábbiakban tárgyaljuk.

3. ábra
3. ábra

Az egymolekulás szekvenálási technológia tulajdonságai. Az egymolekulás szekvenálási technológiák aktuális olvasásszámát és olvasási hosszát a pontok mutatják. Mindegyik technológia törekszik a legfontosabb jellemzőik javítására, a kutatás a nyíllal jelzett irányokba irányul.

1. táblázat Melyik szekvenálási technológiát használjuk és mikor?a

Szintézis általi szekvenálás

Az első kereskedelmi forgalomban kapható egymolekulás szekvenáló rendszert a Helicos BioSciences munkatársai fejlesztették ki . Ebben a rendszerben az egyes molekulákat egy kovalensen rögzített oligonukleotidokat tartalmazó áramlási cella felületére hibridizálják. Fluoreszcensen jelölt nukleotidokat és DNS-polimerázt adunk hozzá egymás után, és a beépülési eseményeket lézeres gerjesztéssel és töltéscsatolt eszközzel (CCD-kamera) történő rögzítéssel detektáljuk. A fluoreszcens “virtuális terminátor” nukleotid megakadályozza bármely következő nukleotid beépülését, amíg a nukleotidfesték-rész le nem hasad. Az egyes ciklusokból származó képeket összerakjuk, hogy egy teljes szekvencia-olvasáskészletet hozzunk létre. Egy standard futtatás során 120 nukleotid hozzáadási és detektálási ciklust hajtunk végre. Ezzel a módszerrel jóval több mint egymilliárd molekula követhető egyidejűleg. Mivel egy standard futtatásban két 25 csatornás áramlási cella van, 50 különböző minta szekvenálható egyidejűleg, a minták multiplexálásával pedig jelentősen nagyobb áteresztőképesség érhető el. A mintaigény az összes technológia közül a legegyszerűbb: nanogramm alatti mennyiségekre van szükség, és nagyon rossz minőségű DNS, beleértve a lebomlott vagy módosított DNS-t is, szekvenálható. Az átlagos olvasási hossz viszonylag rövid (körülbelül 35 nt), a nyers egyedi nukleotid hibaarány jelenleg körülbelül 3-5%, amely véletlenszerűen fordul elő a szekvenciaolvasásokban és túlnyomórészt “sötét bázis” vagy deléciós hiba formájában, amelyet az illesztési algoritmus figyelembe vesz. Ez a hibaarány nem jelent problémát a polimorfizmusok kimutatásakor, mivel a második generációs rendszerekben a diploid genomok esetében általában 30×-os lefedettséget használnak, hogy az amplifikáció által okozott egyenlőtlen lefedettséget kiküszöböljék. A heterozigóta detektálás sztochasztikus jellegének leküzdéséhez túlmintavételezésre van szükség, és a 30×-os lefedettség ajánlott annak biztosítása érdekében, hogy szinte minden heterozigóta helyesen kerüljön megnevezésre. Ezen a lefedettségi szinten pontos konszenzus szekvenciák keletkeznek, függetlenül az ezen a tartományon belüli hibaaránytól. Az egymolekulás rendszerek sokkal egyenletesebb lefedettséggel rendelkeznek, és így nincs szükségük ekkora mélységre a heterozigóták teljes felismeréséhez. A második generációs rendszerekhez viszonyított egyenletes lefedettséget ChIP-kísérletekkel mutatták ki, amelyekben a szekvenciaolvasások az egymolekulás szekvenálással viszonylag állandóak voltak a GC-tartalom tekintetében, míg az amplifikáción alapuló szekvenálással és egy emberi minta teljes genom szekvenálásával mind magas, mind alacsony GC-tartalom esetén jelentős eltérések voltak megfigyelhetők .

A Helicos Sequencer rendszer közvetlenül is képes az RNS-molekulák szekvenálására, így elkerülhető a fordított transzkriptázzal kapcsolatos számos artefaktum, és páratlan mennyiségi pontosságot biztosít az RNS-expressziós mérésekhez . A mintánkénti nagyon magas olvasásszám lehetővé teszi a pontos expressziós mérések elvégzését akár RNS-sel, akár cDNS-sel , ami más egymolekulás technológiákkal még nem lehetséges. Valójában az RNS-molekulák egész osztályai, amelyek más technológiákkal nem mutathatók ki, kimutathatók az egymolekulás megközelítéssel . Mint sok egymolekulás rendszer esetében, ugyanazon molekula ismételt leolvasása jelentősen javíthatja a hibaarányt, és lehetővé teszi a nagyon ritka változatok kimutatását is egy kevert mintában. Például egy ritka variáns egy olyan mintában, amely kevés tumorsejtet tartalmaz sok normális sejt között, esetleg nem mutatható ki amplifikált DNS-sel. Ugyanazon molekula ismételt szekvenálásával a hibaarányt elég alacsonyra lehet szorítani ahhoz, hogy a heterogén mintákban, például a daganatokban előforduló mutációk könnyen kimutathatók legyenek. A minimális mintaelőkészítési igény, a kivételesen kis kiindulási mennyiségek felhasználásának lehetősége és a magas olvasási szám miatt ez a technológia ideális az olyan kvantitatív alkalmazásokhoz, mint a ChIP, az RNS-expresszió és a kópiaszám-változás, valamint olyan helyzetekben, ahol a minta mennyisége korlátozó vagy lebomló . A standard, teljes emberi genom resequencing könnyen megvalósítható , de ez jelenleg kevésbé költséges a második generációs rendszereken.

A Pacific Biosciences kifejlesztett egy másik szekvenálás-by-szintézis megközelítést, amely fluoreszcensen jelölt nukleotidokat használ. Ebben a rendszerben a DNS-t egy nagyon kis térfogatra korlátozzák egy null-módú hullámvezetőben, és a DNS-polimeráz közelében fluoreszcensen jelölt rokon nukleotid jelenlétét mérik. A hullámvezető méretei olyan kicsik, hogy a fény csak a széléhez nagyon közeli területen tud áthatolni, ahol a szekvenáláshoz használt polimeráz van korlátozva. Csak a polimerázhoz közeli kis térfogatban lévő nukleotidok világíthatók meg és fluoreszkálhatnak a detektáláshoz. Mivel a meghosszabbodó DNS-szálba beépülő nukleotid hosszabb időt tölt a polimeráz közelében, nagymértékben meg lehet különböztetni a nem felismerhető nukleotidoktól. A reakcióban mind a négy potenciális nukleotid szerepel, mindegyiket más színű fluoreszcens festékkel jelölve, hogy megkülönböztethetők legyenek egymástól. Minden nukleotidnak van egy jellegzetes beépülési ideje, ami tovább segítheti a báziskijelölés javítását. A második generációs rendszerekkel elérhetőnél hosszabb, akár több ezer bázisból álló szekvenciaolvasás valós időben történik minden egyes molekula esetében. A jelenlegi áteresztőképesség azonban kevesebb mint 100 000 leolvasás futásonként, így a teljes szekvencia-hozam sokkal alacsonyabb, mint a második generációs rendszerek és a Helicos rendszer esetében. Ezenkívül a nyers hibaarány, amely jelenleg 15-20% , jelentősen magasabb, mint bármely más jelenlegi szekvenálási technológia esetében, ami kihívást jelent az adatok felhasználása során egyes alkalmazásokban, például a variánsok kimutatásában.

A szekvenálás során a lézer bizonyos időre történő kikapcsolásával sokkal hosszabb, úgynevezett “stroboszkópos leolvasások” hozhatók létre, ami megakadályozza a polimeráz és a nukleotidok lézer által okozott fotokárosodása miatti idő előtti befejezést. Ha nincs szükség hosszú leolvasásokra, a magas nyers hibaarány leküzdhető egy hajtű oligonukleotidnak a DNS mindkét végére történő ligálásával, egy cirkuláris templát létrehozásával (az SMRTbell az egy molekula valós idejű szekvenálásához), majd ugyanazon molekula ismételt szekvenálásával. Ez az eljárás akkor működik, ha a molekulák viszonylag rövidek, de hosszú leolvasásoknál nem használható, így azoknál megmarad a magas nyers hibaarány. A nagyon hosszú leolvasások még magas hibaarány mellett is produktívan felhasználhatók a szekvencia-kontigok összekapcsolására. További előnye ennek a rendszernek, hogy potenciálisan képes a módosított bázisok kimutatására. Lehetséges az 5-metilcitozin kimutatása, bár a szekvencia-kontextus és más tényezők szerepe az ilyen hozzárendelések pontosságának befolyásolásában még tisztázásra vár. Elvileg a közvetlen RNS-szekvenálásnak is lehetségesnek kellene lennie ezzel a rendszerrel, de erről természetes RNS-molekulák esetében még nem számoltak be, mivel a nukleotidok a nukleotid beépülése előtt többször kötődnek a reverz transzkriptázhoz, így többszörös beillesztésekkel hamis jeleket adnak, amelyek megakadályozzák az értelmes szekvencia meghatározását. Ezenkívül e rendszer alacsony leolvasásszáma a gyakori mRNS-izoformák azonosítására korlátozódik, nem pedig a kvantitatív expressziós profilalkotásra vagy a teljes transzkriptom lefedettségre, mivel mindkettő sokkal nagyobb leolvasásszámot igényel, mint ami a belátható jövőben lehetséges. Általánosságban elmondható, hogy a hosszú leolvasások és a rövid átfutási idő miatt ez a rendszer leginkább a genomok összeállításának segítésére, a szerkezeti variáció elemzésének értékelésére, a haplotipizálásra, a metagenomikára és a splicing izoformák azonosítására alkalmas.

A Life Technologies, az első és a második generációs szekvenáló rendszerek egyik fő szállítója, a Visigen által eredetileg bevezetett FRET (fluoreszcencia rezonancia energia transzfer) alapú egymolekulás szekvenálás szintézis útján technológia fejlesztésével foglalkozik. Jelentős előrelépések történtek, és a közeljövőben várható a “Starlight” rendszer kereskedelmi forgalomba hozatala. A jelenlegi technológia egy kvantumpont-jelölt polimerázból áll, amely valós idejű rendszerben négy különbözőképpen jelölt nukleotiddal DNS-t szintetizál. A kvantumpontok, amelyek fluoreszkáló félvezető nanorészecskék, előnyük a fluoreszkáló festékekkel szemben, hogy sokkal fényesebbek és kevésbé hajlamosak a kifehéredésre, bár sokkal nagyobbak és hajlamosabbak a villogásra. A szekvenálandó genomi mintát egy meghatározott szekvenciájú, felülethez kötött oligonukleotidhoz ligálják, majd a felülethez komplementer primer hosszabbításával leolvassák. Amikor egy fluoreszcensen jelölt nukleotid kötődik a polimerázhoz, kölcsönhatásba lép a kvantumponttal, ami mind a nukleotid, mind a kvantumpont fluoreszcenciájában változást okoz. A kvantumpont jele csökken, míg az egyes nukleotidokon lévő festékkel jelölt foszfát jele egy jellegzetes hullámhosszon emelkedik. A valós idejű szekvencia minden egyes hosszabbító primer esetében rögzítésre kerül. Mivel minden egyes szekvencia a felülethez kötődik, a nagyobb pontosság érdekében újra megcímezhető és szekvenálható. Nem világos, hogy milyenek lesznek a szekvencia-specifikációk, de a Pacific Biosciences technológiájához való hasonlósága valószínűsíti, hogy ez lesz a referenciapont. Ha igen, akkor az alkalmazások tekintetében ugyanazokkal az erősségekkel rendelkezik majd (genom-összeállítás, szerkezeti variáció, haplotipizálás, metagenomika), míg a nagy olvasatszámot igénylő kvantitatív alkalmazások (például ChIP vagy RNS-expresszió) potenciálisan kihívást jelenthetnek számára.

Optikai szekvenálás és térképezés

Vannak más technológiák, amelyek lehetővé teszik a nagyon hosszú olvasatok előállítását, de a lényegesen alacsonyabb áteresztőképesség árán. Lehetőség van például nagyon hosszú, akár több száz kilobázis hosszúságú DNS-molekulák felületekre történő felragasztására, és azok meghatározott szekvenciákról történő lekérdezésére különböző restrikciós enzimekkel történő vágással vagy szekvenciaspecifikus nicking enzimekkel történő kezelés után történő jelöléssel. A vizsgált molekulák hossza attól függ, hogy az ilyen hosszú DNS-t mechanikai nyírás nélkül lehet-e kezelni. Az emberi és más genomok esetében egész genomokat átfogó, egyetlen molekula gyűjteményeiből komplett restrikciós emésztéseket hoztak létre, amelyek lehetővé teszik a szekvencia-kontigok rendezését. A nagymértékben ismétlődő és duplikált genomokat, mint például a kukorica, különösen nehéz hagyományos szekvenálással összerakni, de sikeresen elemezték ezzel az egymolekulás rendszerrel . A restrikciós helyek szekvenciajelzőket biztosítanak a DNS-en, és így a hosszú ismétlődő régiók és más bonyolult szerkezeti eltérések egyértelműen hozzárendelhetők. Speciális alkalmazások, például az egész genomra kiterjedő metiláció feltérképezése is elvégezhető .

Hasonlóképpen, a DNS molekulákat nanocsövekhez lehet korlátozni és specifikusan jelölni a megtekintéshez . Az RNS egyes molekuláit pásztázó csúcs Raman-spektroszkópiával tették láthatóvá . Egy alternatív módszerrel, amely szintén hosszú DNS-molekulák felületre történő adszorpcióját használja, a guaninokat meg lehetett különböztetni az összes többi bázistól, és a részleges szekvenciát pásztázó elektronmikroszkóppal le lehetett olvasni . A ZS Genetics javasolta más bázisok leolvasásának lehetőségét nehézatomok, például bróm vagy jód egyes nukleotidokra történő beillesztésével. Bár jelenleg az alacsony szálátviteli teljesítmény és a hiányos szekvenciaolvasás korlátozó tényező, lehetőség van több száz kilobázis hosszúságú olvasásra, amit elsősorban a DNS nyírás nélküli kezelésének képessége korlátoz. A kifeszített DNS közvetlen leolvasását alkalmazó egyéb technológiákat máshol már áttekintettük. Ezek az optikai szekvenálási technológiák erőteljes képet nyújtanak a genom szerkezetéről, de nem képesek részletes szekvenciaadatokat vagy hozzáférést biztosítani számos más, nagy olvasásszámot igénylő szekvenálási alkalmazáshoz, például génexpressziós mérésekhez.

Nanopórusok

Az eddig ismertetett szekvenálási technikák mindegyike valamilyen jelölést igényel a DNS-en vagy nukleotid szubsztrátumon az egyes bázisok szekvenáláshoz történő kimutatásához. A nanopórusos megközelítések azonban általában nem igényelnek exogén címkét, hanem a megkülönböztetéshez a különböző nukleotidok elektronikus vagy kémiai szerkezetére támaszkodnak. A nanopórusok használatának előnyeit és lehetséges eszközeit áttekintették. Az eddig legnagyobb érdeklődésre számot tartó nanopórusok közé tartoznak az olyan anyagokból, mint a szén nanocsövekből vagy vékony filmekből, valamint a biológiai alapú α-hemolysinből vagy MspA-ból felépített szilárdtest-rendszerekből összeállított nanopórusok . Ezeket a bakteriális pórusfehérjéket alaposan tanulmányozták és tervezték, hogy optimalizálják a specifikus bázisok kimutatását és a DNS póruson keresztüli transzlokációs sebességét. Bár a natív DNS természetes tulajdonságai alapján történő szekvenálás kiküszöbölné a jelölési lépést, és potenciálisan nagyon hosszú leolvasásokat tenne lehetővé minimális mintaelőkészítéssel, ezáltal csökkentve a költségeket, a nukleotidok közötti különbségek nagyon szerények, és kimutatásukat nehezítik a DNS nanopóruson való áthaladásának sebességének és irányítottságának szabályozásával kapcsolatos nehézségek. A nagy pontosságú szekvenáláshoz specifikus detektálásra és egyirányú áramlásra van szükség.

A DNS nanopórusokon való áthaladásának lassítására számos módszert alkalmaztak, többek között polisztirol gyöngyök rögzítését , sókoncentrációt , viszkozitást , mágneses tereket és kettős szálú DNS régiók bevezetését egy egyszálú célpontra. A tipikusan előforduló nagy transzlokációs sebességeknél (potenciálisan több millió bázis másodpercenként) az egyes nukleotidoktól származó háttérzaj fölötti jel detektálása kihívást jelenthet, és ezt egyes esetekben nukleotidcsoportok leolvasásával (például ismert szekvenciák hibridizációjával, ahogyan azt a NabSys fejleszti) vagy az eredeti szekvencia komplexebb kódolásával, a nukleotidszekvencia molekuláris jelzők bináris kódjával történő átalakításával (ahogyan azt a NobleGen fejleszti) sikerült megoldani. A DNS egyirányú áramlásának fenntartását egy exonukleáznak a folyamathoz való kapcsolásával és a hasított nukleotidok leolvasásával fokozták (ahogyan azt az Oxford Nanopore fejlesztette ki ).

Noha a nanopórus szekvenálási technológiák tovább fejlődnek, nem elegendő csupán a DNS szekvenálására való képesség bemutatása, amit a nanopórusok természetes DNS-sel még nem bizonyítottak. Meg kell találni az alacsonyabb költségekhez, a hosszabb leolvasásokhoz vagy a más technológiákhoz viszonyított nagyobb pontossághoz vezető utat, amely a nanopóráknak egyedi előnyt biztosít más módszerekhez képest. Még ha a reagensköltségek jelentősen csökkenthetők is, a mintaelőkészítés és az informatikai költségek továbbra is fennmaradnak, és ezek lehetnek a szekvenálás domináns költségei, amelyek az alkalmazott technológiától függően változnak. A meglévő technológia által támasztott, egyre növekvő akadályokat nem lesz könnyű leküzdeni. A második generációs és az egymolekulás technológiák már kereskedelmi forgalomban lévő és továbbiak a láthatáron, számos fronton jelentős előrelépésre lesz szükség ahhoz, hogy ezek a technológiák kereskedelmi szempontból életképessé váljanak.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.