Förbättrad genomsekvensering med hjälp av ett konstruerat transposas

Tn5-mutantbibliotekskonstruktion

Tn5-mutanter genererades genom slumpmässig mutagenes med hjälp av felkänslig PCR på hela Tn5-transposaset av vildtyp (NCBI accessionskod ”3ECP_A”, Additional file 1). Platsmättnad utfördes på proteinets modellerade DNA-bindningsplats. De mutageniserade Tn5-fragmenten infogades i en modifierad pET11a-vektor för uttryck i E. coli (Illumina Madison). Vektorn är kanamysinresistent för plasmidstabilitet och har en Strep Tag II-sumofusion nedströms från T7-promotorn/lac-operonet vid N-terminus av Tn5-kodningsregionen för att underlätta rening. De drivande mutationer som identifierades genom linjär regression kombinerades genom standard site-directed mutagenesis (Qiagen).

Mutantproteinuttryck och rening

Mutantbiblioteket utplantades, enstaka kolonier valdes ut för att inokulera 1 L Luria Broth (LB)-media med 50 μg/mL kan och fick växa till OD600 = 0,5. Uttryck av Tn5-muterade transposaser inducerades sedan genom tillsats av 100 μM isopropyl β-D-1-thiogalaktopyranosid (IPTG) och fortsatt inkubation vid 18 °C i 19 timmar.

Cellerna skördades genom centrifugering och resuspenderades i TNE1-buffert (100 mM Tris, pH 8,0, 1 M NaCl, 1 mM Etylendiamintetraättiksyra (EDTA), 1 mM Dithiothreitol (DTT)) som innehöll en komplett proteasinhibitormix (Roche). En homogenisator av glas användes för att bryta upp cellpelletsen innan den passerade genom en mikrofluidizer tre gånger för lysis. Natriumdeoxycholat tillsattes till lysatet (0,1 % slutlig) och blandningen inkuberades vid rumstemperatur under omrörning i 15 minuter följt av 15 minuter vid 4 °C. Under omrörning vid 4 °C tillsattes 5 % polyetylenimin, pH 7,5, till blandningen (0,5 % slutlig) och rördes ytterligare i 1 timme för att fälla ut nukleinsyror som avlägsnades genom centrifugering (45 000 g i 20 minuter vid 4 °C). Mättat ammoniumsulfat tillsattes till supernatanten i förhållandet 1:1 och blandningen rördes vid 4 °C i 1 timme och centrifugerades sedan (45 000 g i 20 minuter vid 4 °C). Pelleten som innehöll Tn5-mutantproteinerna resuspenderades i 10 ml TNE1, centrifugerades för att avlägsna partiklar och den resulterande supernatanten späddes ytterligare 5 gånger med TNE1 och laddades på en StrepTrap High Performance (HP)-kolonn (GE Healthcare) som ekvilibrerades med TNE1 med hjälp av en AKTA Pure (GE Healthcare).

Efter laddning tvättades StrepTrap HP-kolonnen med 10 kolonnvolymer (CV) 100 mM Tris, pH 8,0, 4 M NaCl, 1 mM EDTA följt av 10 CV 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA. Proteinet eluerades sedan med en 10 CV gradient med 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotin (IBA-lifesciences). Fraktioner som innehöll toppar vid OD280 sammanfördes och applicerades på en HiTrap Heparin HP-kolonn som jämnades ut med 100 mM Tris, pH 7,5, 100 mM NaCl, 0,2 mM EDTA (GE Healthcare). Efter bindningen tvättades kolonnen med 15 CV ekvilibreringsbuffert följt av en 20 CV saltgradient (100 mM-1 M NaCl). En enda eluerad topp vid 0,5 M NaCl visade sig genom natriumdodecylsulfatpolyakrylamidgelelektrofores (SDS-PAGE) innehålla Strep-Sumo-Tn5-mutanterna vid 66 kDa. Den eluerade toppen koncentrerades i en Vivaspin 20 centrifugalkoncentrator med en MWCO på 10 kDa och späddes sedan 1:1 med 100 % glycerol för lagring vid -20 °C. Från detta uttryck och denna rening var utbytet av Tn5-muterade transposaser ungefär 5 mg per 1 L kultur.

Transposomassammansättning och aktivitetsnormalisering

Tn5-transposonsekvensen med mosaikändan (ME) på 19 bp (som också innehåller 14 och 15 bp 5′-adaptorsekvensen som är kompatibel med Illumina-sekvensering med parvis ändad sekvens) annealiserades genom att värma upp de enkelsträngade oligonerna vid 95 °C i 5 minuter och sedan sänka temperaturen med 5 °C varannan minut ned till 20 °C. De annealerade ME:s kombinerades med renade Tn5-transposaser i ett molförhållande på 1,2:1 (ME:transposas) och inkuberades vid 37 °C i 1 timme. Den resulterande transposomföreningen förvarades vid -20 °C tills den används.

Tagmenteringsaktiviteten för varje mutant normaliserades med hjälp av den standardmetod och de reagenser som anges i Nextera DNA-biblioteksberedningsmetoden (Illumina). Kort sagt, 25 ng B. cereus genomiskt DNA (gDNA) taggades med olika koncentrationer av mutanter eller standard Tn5 från Illumina Nextera-kit som kontroll. Storleken på det fragmenterade DNA som blev resultatet analyserades på Agilents högkänsliga DNA-bioanalysatorchip. Koncentrationerna av Tn5-mutanter normaliserades sedan för att uppnå samma DNA-fragmentstorleksfördelning där arean under kurvan mellan 100 och 300 bp var 20-30 %, 301-600 bp 30-40 % och 601-7000 bp 30-40 %, medan den totala arean under kurvan mellan 100 och 7000 bp var ≥90 % (Additional file 2: Figur S1).

DNA-biblioteksberedning, sekvensering och dataanalys

5 μL av varje Tn5-muterad transposom vid normaliserad koncentration användes för att bereda sekvenseringsbibliotek för E. coli gDNA (balanserat genom), R. sphaeroides (GC-rikt genom) och B. cereus genomiskt DNA (AT-rikt genom) med hjälp av standardmetoden för beredning av DNA-bibliotek från Nextera. Biblioteken sekvenserades sedan på MiSeq enligt Illuminas standardprotokoll. Bias plots genererades genom att räkna antalet gånger varje nukleotid observerades i varje cykel för alla läsningar och rapportera det i procent. Bias plot visar en övergripande bias för taggning av ett transposas. Observera att bias vid varje position kan vara oberoende av andra positioner. Täckningsdiagram visar den procentuella andelen observerade baser vid olika sekvenseringsdjup. De genererades med hjälp av samtools mpileup-alternativ (http://www.htslib.org/). Normaliserade GC-kurvor och AT/GC-utfall genererades med hjälp av Picard Tools (http://broadinstitute.github.io/picard/).

Linjär regression

Linjära regressionsmodeller användes för att uppskatta vikten av varje enskild mutation i insättningsbiaset. Varje linjär regressionsmodell tillämpades på innehållet av den dominerande nukleoiden vid en basposition i läsningarna, vilket resulterade i en modell per basposition. E. coli-sekvenseringsresultat användes för att anpassa modellerna. Därför användes följande nukleotider som dominerande nukleotid mellan baspositionerna 1 och 15: GTTTA***CTGTGCG. Eftersom Tn5 fungerar som en homodimer är de dominerande nukleotider som observeras i positionerna 6-9 alltid komplementbaser till dem i positionerna 1-4. Därför ignorerade vi modeller för baserna 6, 7 och 8 men behöll basposition 9. Även om position 9 replikerar beteendet hos position 1 på grund av symmetri, påverkas position 1 av sekvenseringsartefakter, så vi använder position 9 för att bättre fånga egenskaperna hos position 1.

Tenfaldig korsvalidering användes för träningen och vikterna medelvärdesberäknades genom de 10 korsträningarna. Inmatningsmatrisen för prediktorvariablerna bestod av rader för varje mutant och kolumner för alla observerade mutationer. Mutationer som alltid förekom tillsammans orsakade singularitet i matrisen. Därför uteslöts alla utom en av de kolumner som var förknippade med dessa mutationer. Minsta kvadratmetoden användes för att lösa viktvektorerna.

För varje position valdes de mutationer ut som hade betydande positiva eller negativa vikter. Ett nytt mutantbibliotek skapades genom att kombinera mutationer från olika positioner. Därför grupperas mutationerna utifrån liknande effekt. Grupper kan ha gemensamma mutationer som har effekt på flera positioner samtidigt.

Tn5/DNA-bindningsstabilitetsanalys

Standard-Tn5 visade sig förbli bunden till sitt mål-DNA efter märkning (opublicerade resultat). Sterisk hindring förhindrar därför att det märkta DNA:t fylls med ett polymeras och att DNA:t amplifieras ytterligare genom PCR. Tn5 dissocieras dock från det märkta DNA:t vid förhöjd temperatur, vilket gör det möjligt att fylla igen luckor och PCR av DNA:t med hjälp av ett polymeras. Den temperatur som krävs för att möjliggöra PCR-reaktion av ett polymeras kan således användas för att jämföra Tn5/DNA-bindningsstabiliteten hos olika Tn5-mutanter. Ju högre temperatur som krävs, desto stabilare komplex.

Mutanten Tn5-059 eller standard-Tn5 användes för att tagga B. cereus gDNA i 1 mL reaktion genom att följa standardprotokollet för Nextera, förutom att TD-bufferten ersattes med 20 mM Trisacetat pH 7,5, 5 mM magnesiumacetat. TD-bufferten innehåller magnesium, så detta bör inte skapa en extra kombinerad effekt med mutationerna för att ändra insättningsbias. Alikvots av 25 μL reaktion dispenserades till en PCR-platta i tre exemplar och inkuberades vid 55 °C i 5 minuter följt av centrifugering (1000 g i 5 minuter vid 4 °C).

För det andra steget som innehåller PCR framställdes en PCR-blandning genom att kombinera 200 μL PPC (PCR-primercocktail), 200 μL i501, 200 μL i507 och 400 μL NPM (reagenser som ingår i standardpaketet för framställning av DNA-bibliotek från Nextera). 25 μL av denna blandning tillsattes sedan till var och en av 25 μL alikvot av tagmenteringsreaktionen på PCR-plattan, blandades med pipett och återfördes till termocyklern. Temperaturgradienten mellan 72 °C och 95 °C genererades över plattans 12 kolumner och hölls i 1 min. Plattan inkuberades sedan vid 72 °C i 5 min följt av 98 °C i 30 s. Efter detta steg för fyllning av luckor och denaturering utfördes 5 PCR-cykler som specificeras i Nextera DNA-biblioteksberedningsmetoden. Plattan centrifugerades sedan vid 1000 g i 5 minuter vid 4 °C. Varje taggning-PCR-reaktion renades sedan med hjälp av en Zymo Clean and Concentrator 96-brunnsplatta och eluerades med 25 μL 10 mM Tris, pH 8,0. Ett negativt kontrollprov i tre exemplar framställdes enligt standardprotokollet för taggning, inklusive Zymo-rengöring för att avlägsna Tn5-transpoas, men utan PCR-steget. En tredubbel uppsättning positiv kontrollprover framställdes enligt standardprotokollet för märkning, inklusive Zymo-rengöring för att avlägsna Tn5-transposas och PCR-steget för att amplifiera märkt DNA. Alla renade DNA-produkter späddes sedan 1:10 i 10 mM Tris, pH 8,0 och kvantifierades med hjälp av Picogreen och en lambda-DNA-standard.

Resultaten visade att standard-Tn5 frigör sig från det taggade DNA:t och därmed möjliggör efterföljande gap fill- och PCR-reaktioner vid 74,2 °C, medan Tn5-059 gör det vid 76,6 °C (Additional file 3: Figur S2). Den högre temperatur som krävs för Tn5-059 tyder på ett stabilare DNA-bindningskomplex.

Lämna ett svar

Din e-postadress kommer inte publiceras.