Improved genome sequencing using an engineered transposase

Tn5 mutant library construction

Tn5 mutanten werden gegenereerd door willekeurige mutagenese met foutgevoelige PCR op het gehele wildtype Tn5 transposase (NCBI toetredingscode ‘3ECP_A’, Additional file 1). Site verzadiging werd uitgevoerd op de gemodelleerde DNA-bindingsplaats van het eiwit. De gemuteerde Tn5 fragmenten werden ingevoegd in een gewijzigde pET11a vector voor expressie in E. coli (Illumina Madison). De vector is kanamysine resistent voor plasmide stabiliteit en heeft een Strep Tag II-sumo fusie stroomafwaarts van de T7 promotor/lac operon op de N-terminus van Tn5 coderende regio om de zuivering te helpen. De driver mutaties geïdentificeerd door lineaire regressie werden gecombineerd door standaard site-directed mutagenese (Qiagen).

Mutant eiwit expressie en zuivering

Mutant bibliotheek werd uitgezet, werden enkele kolonies geselecteerd om 1 L Luria Broth (LB) media inoculeren met 50 ug / ml kan en werden toegestaan om te groeien tot OD600 = 0,5. Expressie van Tn5 mutant transposases werd vervolgens geïnduceerd door toevoeging van 100 μM isopropyl β-D-1-thiogalactopyranoside (IPTG) en voortgezette incubatie bij 18 ° C gedurende 19 uur.

Cellen werden geoogst door centrifugatie en geresuspendeerd in TNE1-buffer (100 mM Tris, pH 8,0, 1 M NaCl, 1 mM ethyleendiaminetetraazijnzuur (EDTA), 1 mM dithiothreitol (DTT)) met volledige proteaseremmersmix (Roche). Een glazen homogenisator werd gebruikt om de celpellet op te breken alvorens deze driemaal door een microfluïdisator te voeren voor lysis. Aan het lysaat werd natriumdeoxycholaat toegevoegd (0,1% definitief) en het mengsel werd bij kamertemperatuur onder roeren gedurende 15 min. geïncubeerd, gevolgd door 15 min. bij 4 °C. Onder roeren bij 4 °C werd 5% polyethyleenimine, pH 7,5 aan het mengsel toegevoegd (0,5% definitief) en nog eens 1 uur geroerd om nucleïnezuren neer te slaan, die werden verwijderd door centrifugeren (45.000 g gedurende 20 min bij 4 °C). Verzadigd ammoniumsulfaat werd toegevoegd aan het supernatant in een verhouding van 1:1 en het mengsel werd gedurende 1 uur bij 4 °C geroerd en vervolgens gecentrifugeerd (45.000 g gedurende 20 min bij 4 °C). De pellet met de Tn5-mutanteiwitten werd geresuspendeerd in 10 ml TNE1, gecentrifugeerd om deeltjes te verwijderen en het resulterende supernatant werd verder 5 × verdund met TNE1 en geladen op een StrepTrap High Performance (HP)-kolom (GE Healthcare) die met TNE1 was geëquilibreerd met behulp van een AKTA Pure (GE Healthcare).

Na het laden werd de StrepTrap HP-kolom gewassen met 10 kolomvolumes (CV) van 100 mM Tris, pH 8,0, 4 M NaCl, 1 mM EDTA, gevolgd door 10 CV 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA. Het eiwit werd vervolgens geëlueerd met een 10 CV gradiënt met 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotine (IBA-lifesciences). Fracties met pieken bij OD280 werden samengevoegd en overgebracht op een HiTrap Heparin HP-kolom die was geëquilibreerd met 100 mM Tris, pH 7,5, 100 mM NaCl, 0,2 mM EDTA (GE Healthcare). Na binding werd de kolom gewassen met 15 CV evenwichtsbuffer, gevolgd door een 20 CV zoutgradiënt (100 mM-1 M NaCl). Een enkele geëlueerde piek bij 0,5 M NaCl bleek bij natriumdodecylsulfaatpolyacrylamidegelelektroforese (SDS-PAGE) de Strep-Sumo-Tn5-mutanten bij 66 kDa te bevatten. De geëlueerde piek werd geconcentreerd in een Vivaspin 20 centrifugaalconcentrator met een MWCO van 10 kDa en vervolgens 1:1 verdund met 100% glycerol voor opslag bij -20 °C. Uit deze expressie en zuivering was de opbrengst van Tn5 mutant transposases ongeveer 5 mg per 1 L cultuur.

Transposome assemblage en normalisatie van de activiteit

De 19 bp Tn5 mozaïek einde (ME) transposon sequentie (die ook de 14 en 15 bp 5 ‘adaptor sequentie compatibel met Illumina gepaarde-end sequencing) werd geanneneed door het verwarmen van de enkelstrengs oligos bij 95 ° C gedurende 5 minuten dan het verminderen van de temperatuur 5 ° C om de 2 minuten tot 20 ° C. De geannealde ME’s werden gecombineerd met gezuiverde Tn5 transposases bij een 1,2:1 molaire verhouding (ME:transposase) en geïncubeerd bij 37 ° C gedurende 1 uur. De resulterende Transposome assemblage werd opgeslagen bij -20 ° C tot use.

Tagmentatie activiteit van elke mutant werd genormaliseerd met behulp van de standaard methode en reagentia die in de Nextera DNA-bibliotheek bereidingsmethode (Illumina). Kortom, 25 ng B. cereus genomisch DNA (gDNA) werd getagmenteerd door verschillende concentraties van mutanten of standaard Tn5 van Illumina Nextera kit als controle. De grootte van het resulterende gefragmenteerde DNA werd geanalyseerd op Agilent’s hooggevoelige DNA bioanalyzer chip. De concentraties van Tn5 mutanten werden vervolgens genormaliseerd om dezelfde DNA-fragment grootteverdeling waarbij het gebied onder de curve tussen 100 en 300 bp was 20-30%, 301-600 bp 30-40%, en 601-7000 bp 30-40%, terwijl het totale gebied onder de curve tussen 100 en 7000 bp was ≥90% (Additional file 2: Figuur S1) te bereiken.

DNA-bibliotheekbereiding, sequencing en data-analyse

5 pi van elke Tn5 mutant Transposome bij genormaliseerde concentratie werd gebruikt om sequencing bibliotheken te bereiden voor E. coli gDNA (gebalanceerd genoom), R. sphaeroides (GC-rijk genoom), en B. cereus genomisch DNA (AT-rijk genoom) met behulp van de standaard Nextera DNA-bibliotheek bereidingsmethode. De bibliotheken werden vervolgens gesequenced op MiSeq volgens het standaardprotocol van Illumina. Bias plots werd gegenereerd door het tellen van het aantal keren dat elke nucleotide werd waargenomen in elke cyclus voor alle leest en het rapporteren van het als een percentage. Bias plot toont een algemene tagmentation bias van een transposase. Merk op dat de bias op elke positie onafhankelijk kan zijn van andere posities. Dekking plots tonen het percentage van basen waargenomen op verschillende sequencing diepte. Ze werden gegenereerd met behulp van samtools ‘mpileup optie (http://www.htslib.org/). Genormaliseerde GC curven en AT / GC dropouts werden gegenereerd met behulp van Picard Tools (http://broadinstitute.github.io/picard/).

Lineaire regressie

Lineaire regressie modellen werden gebruikt om het gewicht van elke individuele mutatie in de insertie bias schatten. Elk lineair regressiemodel werd toegepast op de inhoud van de dominante nucleotide op een basispositie in de leest, wat resulteerde in een model per basispositie. E. coli sequencing resultaten werden gebruikt voor het passen van de modellen. Daarom werden de volgende nucleotiden gebruikt als de dominante nucleotide tussen de basisposities 1 en 15: GTTTA***CTGTGCG. Aangezien Tn5 fungeert als een homodimer, zijn dominante nucleotiden op de posities 6 tot en met 9 altijd complementaire basen aan die op de posities 1 tot en met 4. Daarom hebben we modellen voor de basen 6, 7 en 8 genegeerd, maar basenpositie 9 behouden. Hoewel positie 9 het gedrag van positie 1 repliceert als gevolg van symmetrie, wordt positie 1 beïnvloed door sequencing artefacten, dus gebruiken we positie 9 om de kenmerken van positie 1 beter vast te leggen.

Tienvoudige kruisvalidatie werd gebruikt voor training en gewichten werden gemiddeld door de 10 kruistrainingen. Input matrix voor de voorspellende variabelen bestond uit rijen voor elke mutant en kolommen voor alle waargenomen mutaties. Mutaties die altijd samen voorkwamen veroorzaakten singulariteit in de matrix. Daarom werden alle kolommen die met die mutaties samenhingen, op één na, weggelaten. De kleinste kwadratenmethode werd gebruikt om de gewichtsvectoren op te lossen.

Voor elke positie werden de mutaties met een significant positief of negatief gewicht gekozen. Nieuwe mutant bibliotheek werd gecreëerd door het combineren van mutaties van verschillende posities. Mutaties worden dus gegroepeerd op basis van gelijkaardig effect. Groepen kunnen gemeenschappelijke mutaties hebben die op meerdere posities tegelijk effect hebben.

Tn5/DNA binding stability assay

Standaard Tn5 bleek na tagmentatie aan zijn doel-DNA gebonden te blijven (ongepubliceerde resultaten). Daarom zal het vullen van het DNA met tags door een polymerase en verdere amplificatie van het DNA door PCR worden verhinderd door sterische hinder. Tn5 dissocieert echter van het gemerkte DNA bij verhoogde temperatuur, waardoor verdere opvulling van spleten en PCR van het DNA door een polymerase mogelijk wordt. De temperatuur die nodig is om een PCR reactie van een polymerase mogelijk te maken kan dus gebruikt worden om de Tn5/DNA bindingsstabiliteit van verschillende Tn5 mutanten te vergelijken. Hoe hoger de vereiste temperatuur, hoe stabieler het complex.

De mutant Tn5-059 of standaard Tn5 werd gebruikt om tagment B. cereus gDNA in 1 mL reactie door het volgen van de standaard Nextera protocol, behalve de TD buffer werd vervangen door 20 mM Tris Acetaat pH 7,5, 5 mM magnesiumacetaat. TD buffer bevat magnesium, dus dit mag niet leiden tot een extra gecombineerd effect met de mutaties aan de insertie bias veranderen. Aliquots van 25 pi reactie werden gedoseerd in een PCR plaat in drievoud en werden geïncubeerd bij 55 ° C gedurende 5 min, gevolgd door centrifugatie (1000 g gedurende 5 min bij 4 ° C).

Voor de tweede stap met PCR, een PCR mix werd bereid door het combineren van 200 pi PPC (PCR Primer cocktail), 200 pi i501, 200 pi i507, en 400 pi NPM (reagentia die in de standaard Nextera DNA-bibliotheek voorbereiding kit). 25 pi van deze mix werd vervolgens toegevoegd aan elk van de 25 pi tagmentatie reactie aliquot op de PCR-plaat, gemengd door pipet en terug naar de thermocycler. De temperatuur gradiënt tussen 72 ° C en 95 ° C werd gegenereerd over de 12 kolommen van de plaat en gehouden gedurende 1 min, de plaat werd vervolgens geïncubeerd bij 72 ° C gedurende 5 min, gevolgd door 98 ° C gedurende 30 s. Na deze gap fill-denaturatie stap, 5 cycli van PCR gespecificeerd in de Nextera DNA-bibliotheek bereidingsmethode werd uitgevoerd. De plaat werd vervolgens gecentrifugeerd bij 1000 g gedurende 5 min bij 4 °C. Elke tagmentatie-PCR geamplificeerde reactie werd vervolgens gezuiverd met behulp van een Zymo Clean and Concentrator 96 wells plaat en geëlueerd met 25 μL 10 mM Tris, pH 8,0. Een drievoud van negatieve controle monster werd bereid volgens de standaard tagmentatie protocol inclusief Zymo reiniging Tn5 transpoase te verwijderen, maar zonder de PCR stap. Een triplo van de positieve controle werd bereid volgens het standaard tagmentatieprotocol inclusief Zymo-reiniging om Tn5-transposase te verwijderen en de PCR-stap om gemerkt DNA te amplificeren. Alle gezuiverde DNA-producten werden vervolgens verdund 1:10 in 10 mM Tris, pH 8,0 en gekwantificeerd met Picogreen en een lambda DNA standard.

De resultaten toonden aan dat standaard Tn5 releases van de getagmenteerde DNA en maakt het dus mogelijk latere gap fill en PCR-reacties bij 74,2 ° C, terwijl Tn5-059 doet dit bij 76,6 ° C (Additional file 3: figuur S2). De hogere temperatuur die nodig is voor Tn5-059 wees op een stabieler DNA-bindend complex.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.