Tn5 mutantbibliotekskonstruktion
Tn5-mutanter blev genereret ved tilfældig mutagenese ved hjælp af fejlbehæftet PCR på hele den vilde type Tn5-transposase (NCBI accessionskode ‘3ECP_A’, Additional file 1). Stedmætning blev udført på det modellerede DNA-bindingssted for proteinet. De mutageniserede Tn5-fragmenter blev indsat i en modificeret pET11a-vektor med henblik på ekspression i E. coli (Illumina Madison). Vektoren er kanamysinresistent af hensyn til plasmidstabiliteten og har en Strep Tag II-sumofusion nedstrøms for T7-promotoren/lac-operonet ved N-terminus af Tn5-kodningsområdet for at lette rensningen. De drivermutationer, der blev identificeret ved lineær regression, blev kombineret ved standard site-directed mutagenese (Qiagen).
Mutantproteinekspression og oprensning
Mutantbiblioteket blev udplottet, enkeltkolonier blev udvalgt til inokulering af 1 L L Luria Broth (LB) medier med 50 μg/mL kan og fik lov til at vokse til OD600 = 0,5. Ekspression af Tn5-mutanttransposaser blev derefter induceret ved tilsætning af 100 μM Isopropyl β-D-1-thiogalactopyranosid (IPTG) og fortsat inkubation ved 18 °C i 19 timer.
Cellerne blev høstet ved centrifugering og resuspenderet i TNE1-buffer (100 mM Tris, pH 8,0, 1 M NaCl, 1 mM Ethylenediaminetetraeddikesyre (EDTA), 1 mM Dithiothreitol (DTT)) indeholdende komplet proteaseinhibitorblanding (Roche). Der blev anvendt en glashomogenisator til at opløse cellepelleten, inden den blev passeret gennem en mikrofluidizer tre gange med henblik på lysis. Natriumdeoxycholat blev tilsat lysatet (0,1 % endelig), og blandingen blev inkuberet ved stuetemperatur under omrøring i 15 min. efterfulgt af 15 min. ved 4 °C. Under omrøring ved 4 °C blev der tilsat 5 % polyethylenimin, pH 7,5, til blandingen (0,5 % endelig) og omrørt yderligere i 1 time for at udfælde nukleinsyrer, som blev fjernet ved centrifugering (45 000 g i 20 min. ved 4 °C). Mættet ammoniumsulfat blev tilsat til supernatanten i forholdet 1:1, og blandingen blev omrørt ved 4 °C i 1 time og derefter centrifugeret (45 000 g i 20 min. ved 4 °C). Pelleten indeholdende Tn5-mutantproteinerne blev resuspenderet i 10 mL TNE1, centrifugeret for at fjerne partikler, og den resulterende supernatant blev yderligere fortyndet 5 × med TNE1 og indlæst på en StrepTrap High Performance (HP)-kolonne (GE Healthcare), der blev equilibreret med TNE1 ved hjælp af en AKTA Pure (GE Healthcare).
Efter belastning blev StrepTrap HP-kolonnen vasket med 10 kolonnevolumener (CV) af 100 mM Tris, pH 8,0, 4 M NaCl, 1 mM EDTA efterfulgt af 10 CV 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA. Proteinet blev derefter elueret med en gradient på 10 CV med 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotin (IBA-lifesciences). Fraktioner, der indeholdt toppe ved OD280, blev samlet og påført en HiTrap Heparin HP-kolonne, der var equilibreret med 100 mM Tris, pH 7,5, 100 mM NaCl, 0,2 mM EDTA (GE Healthcare). Efter bindingen blev kolonnen vasket med 15 CV equilibreringsbuffer efterfulgt af en 20 CV saltgradient (100 mM-1 M NaCl). Et enkelt elueret peak ved 0,5 M NaCl blev vist ved natriumdodecylsulfat-polyacrylamidgelelektroforese (SDS-PAGE) at indeholde Strep-Sumo-Tn5-mutanterne ved 66 kDa. Den eluerede top blev koncentreret i en Vivaspin 20 centrifugalkoncentrator med en MWCO på 10 kDa og derefter fortyndet 1:1 med 100 % glycerol med henblik på opbevaring ved -20 °C. Ud fra denne ekspression og oprensning var udbyttet af Tn5-mutanttransposaser ca. 5 mg pr. 1 L kultur.
Transposom samling og aktivitetsnormalisering
Den 19 bp Tn5 mosaic end (ME) transposon sekvens (som også indeholder 14 og 15 bp 5′ adaptor sekvensen, der er kompatibel med Illumina paird-end sekventering) blev annealet ved at opvarme de enkeltstrengede oligoer ved 95 °C i 5 minutter og derefter reducere temperaturen 5 °C hver 2. minut ned til 20 °C. De annealerede ME’er blev kombineret med rensede Tn5-transposaser i et molforhold på 1,2:1 (ME:transposase) og inkuberet ved 37 °C i 1 time. Den resulterende transposom-assemblage blev opbevaret ved -20 °C indtil brug.
Tagmenteringsaktiviteten for hver mutant blev normaliseret ved hjælp af den standardmetode og de reagenser, der er angivet i Nextera DNA-bibliotekspræparationsmetoden (Illumina). Kort sagt blev 25 ng B. cereus genomisk DNA (gDNA) tagmenteret med forskellige koncentrationer af mutanter eller standard Tn5 fra Illumina Nextera-kittet som en kontrol. Størrelsen af det resulterende fragmenterede DNA blev analyseret på Agilents High Sensitivity DNA bioanalyzer-chip fra Agilent. Koncentrationerne af Tn5-mutanter blev derefter normaliseret for at opnå den samme DNA-fragmentstørrelsesfordeling, hvor området under kurven mellem 100 og 300 bp var 20-30 %, 301-600 bp 30-40 % og 601-7000 bp 30-40 %, mens det samlede område under kurven mellem 100 og 7000 bp var ≥90 % (Additional file 2: Figur S1).
DNA-biblioteksfremstilling, sekventering og dataanalyse
5 μL af hvert Tn5-mutanttransposom ved normaliseret koncentration blev brugt til at fremstille sekventeringsbiblioteker for E. coli gDNA (balanceret genom), R. sphaeroides (GC-rigt genom) og B. cereus genomisk DNA (AT-rigt genom) ved hjælp af standard Nextera DNA-biblioteksfremstillingsmetoden. Bibliotekerne blev derefter sekventeret på MiSeq efter Illumina’s standardprotokol. Bias-plots blev genereret ved at tælle antallet af gange, hvor hvert nukleotid blev observeret i hver cyklus for alle læsninger, og rapportere det som en procentdel. Bias-plottet viser en samlet bias ved tagmentering af en transposase. Bemærk, at bias ved hver position kan være uafhængig af andre positioner. Dækningsdiagrammer viser procentdelen af baser, der er observeret ved forskellige sekventeringsdybder. De blev genereret ved hjælp af samtools’ mpileup-indstilling (http://www.htslib.org/). Normaliserede GC-kurver og AT/GC-udfald blev genereret ved hjælp af Picard Tools (http://broadinstitute.github.io/picard/).
Lineær regression
Lineære regressionsmodeller blev anvendt til at estimere vægten af hver enkelt mutation i indsættelsesbiaset. Hver lineær regressionsmodel blev anvendt på indholdet af det dominerende nukleotid på en baseposition i læsningerne, hvilket resulterede i en model pr. baseposition. E. coli-sekventeringsresultater blev anvendt til at tilpasse modellerne. Derfor blev følgende nukleotider anvendt som det dominerende nukleotid mellem basispositionerne 1 og 15: GTTTA***CTGTGCG. Da Tn5 fungerer som en homodimer, er de dominerende nukleotider, der observeres i positionerne 6 til 9, altid komplementbaser til dem i positionerne 1 til 4. Derfor ignorerede vi modeller for base 6, 7 og 8, men beholdt baseposition 9. Selv om position 9 replikerer opførslen af position 1 på grund af symmetri, er position 1 påvirket af sekventeringsartefakter, så vi bruger position 9 til bedre at fange funktionerne i position 1.
Ten-fold krydsvalidering blev anvendt til træning, og vægtene blev gennemsnitliggjort gennem de 10 krydsetræninger. Indgangsmatrixen for prædiktorvariablerne bestod af rækker for hver mutant og kolonner for alle observerede mutationer. Mutationer, der altid optrådte sammen, forårsagede singularitet i matricen. Derfor blev alle kolonner med undtagelse af én kolonne, der var forbundet med disse mutationer, udeladt. Der blev anvendt Least Square-metoden til at løse vægtvektorerne.
For hver position blev de mutationer, der havde signifikante positive eller negative vægte, udvalgt. Der blev oprettet et nyt mutantbibliotek ved at kombinere mutationer fra forskellige positioner. Derfor er mutationer grupperet på grundlag af lignende virkning. Grupper kan have fælles mutationer, der har effekt på flere positioner samtidig.
Tn5/DNA-bindingsstabilitetsassay
Standard Tn5 blev vist at forblive bundet til sit mål-DNA efter tagmentering (upublicerede resultater). Derfor forhindrer sterisk hindring, at det mærkede DNA udfyldes af en polymerase og yderligere amplifikation af DNA’et ved PCR. Tn5 dissocieres imidlertid fra det mærkede DNA ved forhøjet temperatur, hvilket giver mulighed for yderligere udfyldning af hullet og PCR af DNA’et ved hjælp af en polymerase. Den temperatur, der kræves for at tillade PCR-reaktion af en polymerase, kan således anvendes til at sammenligne Tn5/DNA-bindingsstabiliteten af forskellige Tn5-mutanter. Jo højere temperatur der kræves, jo mere stabilt komplekset.
Mutanten Tn5-059 eller standard-Tn5 blev anvendt til at tagge B. cereus gDNA i 1 mL reaktion ved at følge Nextera-standardprotokollen, bortset fra at TD-bufferen blev erstattet af 20 mM Trisacetat pH 7,5, 5 mM magnesiumacetat. TD-buffer indeholder magnesium, så dette burde ikke skabe en ekstra kombineret effekt sammen med mutationerne for at ændre indsættelsesbiaset. Alikvotes af 25 μL reaktion blev fordelt i en PCR-plade i tre eksemplarer og blev inkuberet ved 55 °C i 5 min efterfulgt af centrifugering (1000 g i 5 min ved 4 °C).
For det andet trin, der indeholder PCR, blev der fremstillet en PCR-blanding ved at kombinere 200 μL PPC (PCR-primercocktail), 200 μL i501, 200 μL i507 og 400 μL NPM (reagenser, der leveres i standard Nextera DNA-biblioteksfremstillingssættet). 25 μL af denne blanding blev derefter tilsat til hver af de 25 μL alikvot af tagmenteringsreaktionen på PCR-pladen, blandet med en pipette og returneret til termocykleren. Temperaturgradienten mellem 72 °C og 95 °C blev genereret på tværs af pladens 12 kolonner og holdt i 1 min. Pladen blev derefter inkuberet ved 72 °C i 5 min. efterfulgt af 98 °C i 30 s. Efter dette trin med fyldning af hullet og denaturering blev der udført 5 PCR-cyklusser som angivet i Nextera DNA-bibliotekspræparationsmetoden. Pladen blev derefter centrifugeret ved 1000 g i 5 min. ved 4 °C. Hver tagmenterings-PCR-amplificeret reaktion blev derefter renset ved hjælp af en Zymo Clean and Concentrator 96 brøndplade og elueret med 25 μL 10 mM Tris, pH 8,0. En tredobbelt negativ kontrolprøve blev fremstillet efter standardprotokollen for tagmentering, herunder Zymo-rensning for at fjerne Tn5-transpoase, men uden PCR-trinnet. En tredobbelt positiv kontrolprøve blev fremstillet efter standardprotokollen for tagmentering, herunder Zymo-rensning for at fjerne Tn5-transposase og PCR-trinnet for at amplificere tagmenteret DNA. Alle rensede DNA-produkter blev derefter fortyndet 1:10 i 10 mM Tris, pH 8,0 og kvantificeret ved hjælp af Picogreen og en lambda-DNA-standard.
Resultaterne viste, at standard-Tn5 frigør sig fra det taggede DNA og dermed muliggør efterfølgende gap fill- og PCR-reaktioner ved 74,2 °C, mens Tn5-059 gør det ved 76,6 °C (Additional file 3: Figur S2). Den højere temperatur, der kræves for Tn5-059, indikerer et mere stabilt DNA-bindingskompleks.