Verbesserte Genomsequenzierung unter Verwendung einer manipulierten Transposase

Tn5-Mutantenbibliothek

Tn5-Mutanten wurden durch zufällige Mutagenese mit fehleranfälliger PCR an der gesamten Wildtyp-Tn5-Transposase (NCBI-Zugangscode ‚3ECP_A‘, Additional file 1) erzeugt. Die Sättigung wurde an der modellierten DNA-Bindungsstelle des Proteins durchgeführt. Die mutierten Tn5-Fragmente wurden in einen modifizierten pET11a-Vektor zur Expression in E. coli (Illumina Madison) eingefügt. Der Vektor ist aus Gründen der Plasmidstabilität kanamysinresistent und verfügt über eine Strep-Tag-II-Sumo-Fusion stromabwärts des T7-Promotors/lac-Operons am N-Terminus der Tn5-Kodierungsregion, um die Aufreinigung zu erleichtern. Die durch lineare Regression identifizierten Treibermutationen wurden durch standardmäßige ortsgerichtete Mutagenese (Qiagen) kombiniert.

Mutantenproteinexpression und -reinigung

Die Mutantenbibliothek wurde ausgeplattet, einzelne Kolonien wurden ausgewählt, um 1 L Luria Broth (LB) Medium mit 50 μg/mL kan zu beimpfen und bis zu OD600 = 0,5 wachsen zu lassen. Die Expression der Tn5-Mutanten-Transposasen wurde dann durch Zugabe von 100 μM Isopropyl β-D-1-thiogalactopyranosid (IPTG) und fortgesetzte Inkubation bei 18 °C für 19 h induziert.

Die Zellen wurden durch Zentrifugation geerntet und in TNE1-Puffer (100 mM Tris, pH 8,0, 1 M NaCl, 1 mM Ethylendiamintetraessigsäure (EDTA), 1 mM Dithiothreitol (DTT)) mit komplettem Proteaseinhibitor-Mix (Roche) resuspendiert. Das Zellpellet wurde mit einem Glashomogenisator zerkleinert, bevor es zur Lyse dreimal durch einen Mikrofluidisator geleitet wurde. Dem Lysat wurde Natriumdeoxycholat zugesetzt (0,1 % final), und die Mischung wurde unter Rühren 15 Minuten lang bei Raumtemperatur und anschließend 15 Minuten lang bei 4 °C inkubiert. Während des Rührens bei 4 °C wurde dem Gemisch 5 % Polyethylenimin, pH 7,5, zugesetzt (0,5 % Endkonzentration) und 1 Stunde lang weitergerührt, um die Nukleinsäuren auszufällen, die durch Zentrifugation (45 000 g für 20 min bei 4 °C) entfernt wurden. Der Überstand wurde im Verhältnis 1:1 mit gesättigtem Ammoniumsulfat versetzt und das Gemisch 1 h bei 4 °C gerührt und anschließend zentrifugiert (45.000 g für 20 min bei 4 °C). Das Pellet, das die Tn5-Mutantenproteine enthielt, wurde in 10 mL TNE1 resuspendiert, zentrifugiert, um Partikel zu entfernen, und der resultierende Überstand wurde 5× mit TNE1 weiter verdünnt und auf eine StrepTrap High Performance (HP) Säule (GE Healthcare) geladen, die mit TNE1 unter Verwendung einer AKTA Pure (GE Healthcare) äquilibriert wurde.

Nach der Beladung wurde die StrepTrap HP-Säule mit 10 Säulenvolumina (CV) von 100 mM Tris, pH 8,0, 4 M NaCl, 1 mM EDTA gewaschen, gefolgt von 10 CV 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA. Das Protein wurde dann mit einem 10 CV-Gradienten mit 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotin (IBA-lifesciences) eluiert. Fraktionen, die Peaks bei OD280 enthielten, wurden gepoolt und auf eine HiTrap Heparin HP-Säule aufgetragen, die mit 100 mM Tris, pH 7,5, 100 mM NaCl, 0,2 mM EDTA (GE Healthcare) äquilibriert war. Nach der Bindung wurde die Säule mit 15 CV Äquilibrierungspuffer gewaschen, gefolgt von einem 20 CV Salzgradienten (100 mM-1 M NaCl). Ein einzelner eluierter Peak bei 0,5 M NaCl wurde durch Natriumdodecylsulfat-Polyacrylamid-Gelelektrophorese (SDS-PAGE) nachgewiesen und enthielt die Strep-Sumo-Tn5-Mutanten mit 66 kDa. Der eluierte Peak wurde in einem Vivaspin 20 Zentrifugalkonzentrator mit einem MWCO von 10 kDa konzentriert und dann 1:1 mit 100 % Glycerin verdünnt, um bei -20 °C gelagert zu werden. Bei dieser Expression und Reinigung betrug die Ausbeute an Tn5-Mutanten-Transposasen etwa 5 mg pro 1 L Kultur.

Transposomenzusammenbau und Aktivitätsnormalisierung

Die 19 bp Tn5-Mosaikende (ME)-Transposonsequenz (die auch die 14 und 15 bp 5′-Adaptorsequenz enthält, die mit der Illumina-Paired-End-Sequenzierung kompatibel ist) wurde durch Erhitzen der einzelsträngigen Oligos auf 95 °C für 5 min und anschließendes Reduzieren der Temperatur um 5 °C alle 2 min bis auf 20 °C annealed. Die geglühten MEs wurden mit gereinigten Tn5-Transposasen in einem molaren Verhältnis von 1,2:1 (ME:Transposase) kombiniert und 1 h lang bei 37 °C inkubiert. Der resultierende Transposomenaufbau wurde bis zur Verwendung bei -20 °C gelagert.

Die Tagmentierungsaktivität jeder Mutante wurde mit der Standardmethode und den Reagenzien normalisiert, die in der Methode zur Vorbereitung der Nextera-DNA-Bibliothek (Illumina) angegeben sind. Kurz gesagt, wurden 25 ng genomische B. cereus-DNA (gDNA) mit verschiedenen Konzentrationen von Mutanten oder Standard-Tn5 aus dem Nextera-Kit von Illumina als Kontrolle markiert. Die Größe der resultierenden fragmentierten DNA wurde mit dem Agilent High Sensitivity DNA Bioanalyzer Chip analysiert. Die Konzentrationen der Tn5-Mutanten wurden dann normalisiert, um die gleiche DNA-Fragmentgrößenverteilung zu erhalten, bei der die Fläche unter der Kurve zwischen 100 und 300 bp 20-30%, 301-600 bp 30-40% und 601-7000 bp 30-40% betrug, während die Gesamtfläche unter der Kurve zwischen 100 und 7000 bp ≥90% betrug (Additional file 2: Figure S1).

DNA-Bibliotheksvorbereitung, Sequenzierung und Datenanalyse

5 μL jedes Tn5-Mutanten-Transposoms in normalisierter Konzentration wurden verwendet, um Sequenzierungsbibliotheken für E. coli gDNA (ausgewogenes Genom), R. sphaeroides (GC-reiches Genom) und B. cereus genomische DNA (AT-reiches Genom) unter Verwendung der Standard-Nextera-DNA-Bibliotheksvorbereitungsmethode vorzubereiten. Die Bibliotheken wurden dann auf dem MiSeq gemäß dem Standardprotokoll von Illumina sequenziert. Die Bias-Plots wurden erstellt, indem die Anzahl der Beobachtungen jedes Nukleotids in jedem Zyklus für alle Reads gezählt und als Prozentsatz angegeben wurde. Der Bias-Plot zeigt den gesamten Tagmentierungs-Bias einer Transposase. Beachten Sie, dass die Verzerrung an jeder Position unabhängig von anderen Positionen sein kann. Coverage Plots zeigen den Prozentsatz der Basen, die bei verschiedenen Sequenziertiefen beobachtet wurden. Sie wurden mit der Option mpileup von samtools (http://www.htslib.org/) erstellt. Normalisierte GC-Kurven und AT/GC-Ausfälle wurden mit Picard Tools (http://broadinstitute.github.io/picard/) erstellt.

Lineare Regression

Lineare Regressionsmodelle wurden verwendet, um das Gewicht jeder einzelnen Mutation in der Insertionsverzerrung zu schätzen. Jedes lineare Regressionsmodell wurde auf den Gehalt des dominanten Nukleotids an einer Basenposition in den Reads angewandt, was zu einem Modell pro Basenposition führte. Für die Anpassung der Modelle wurden E. coli-Sequenzierungsergebnisse verwendet. Daher wurden die folgenden Nukleotide als das dominante Nukleotid zwischen den Basenpositionen 1 und 15 verwendet: GTTTA***CTGTGCG. Da Tn5 als Homodimer fungiert, sind die an den Positionen 6 bis 9 beobachteten dominanten Nukleotide immer Komplementbasen zu denen an den Positionen 1 bis 4. Daher haben wir die Modelle für die Basen 6, 7 und 8 ignoriert, aber die Basenposition 9 beibehalten. Obwohl Position 9 aufgrund der Symmetrie das Verhalten von Position 1 nachbildet, wird Position 1 durch Sequenzierungsartefakte beeinträchtigt, so dass wir Position 9 verwenden, um die Merkmale von Position 1 besser zu erfassen.

Zehnfache Kreuzvalidierung wurde für das Training verwendet, und die Gewichte wurden über die 10 Kreuztrainings gemittelt. Die Eingabematrix für die Prädiktorvariablen bestand aus Zeilen für jede Mutante und Spalten für alle beobachteten Mutationen. Mutationen, die immer zusammen auftraten, verursachten eine Singularität in der Matrix. Daher wurden alle Spalten, die mit diesen Mutationen verbunden waren, bis auf eine gestrichen. Für die Lösung der Gewichtsvektoren wurde die Methode der kleinsten Quadrate verwendet.

Für jede Position wurden die Mutationen ausgewählt, die signifikante positive oder negative Gewichte aufwiesen. Eine neue Mutantenbibliothek wurde durch Kombination von Mutationen aus verschiedenen Positionen erstellt. Daher werden die Mutationen aufgrund ihrer ähnlichen Wirkung gruppiert. Gruppen können gemeinsame Mutationen haben, die sich auf mehrere Positionen gleichzeitig auswirken.

Tn5/DNA-Bindungsstabilitätstest

Standard-Tn5 bleibt nach der Tagmentierung nachweislich an seine Ziel-DNA gebunden (unveröffentlichte Ergebnisse). Daher wird die Lückenfüllung der markierten DNA durch eine Polymerase und die weitere Amplifikation der DNA durch PCR durch sterische Hinderung verhindert. Allerdings dissoziiert Tn5 bei erhöhter Temperatur von der markierten DNA, so dass eine weitere Lückenfüllung und PCR der DNA durch eine Polymerase möglich ist. Die Temperatur, die erforderlich ist, um eine PCR-Reaktion mit einer Polymerase zu ermöglichen, kann daher zum Vergleich der Tn5/DNA-Bindungsstabilität verschiedener Tn5-Mutanten verwendet werden. Je höher die erforderliche Temperatur ist, desto stabiler ist der Komplex.

Die Mutante Tn5-059 oder Standard-Tn5 wurde zur Markierung von B. cereus gDNA in einer 1-mL-Reaktion verwendet, indem das Standard-Nextera-Protokoll befolgt wurde, außer dass der TD-Puffer durch 20 mM Tris-Acetat pH 7,5, 5 mM Magnesiumacetat ersetzt wurde. Der TD-Puffer enthält Magnesium, so dass dies keinen zusätzlichen kombinierten Effekt mit den Mutationen hervorrufen sollte, um den Insertionsbias zu verändern. Aliquots von 25 μL Reaktion wurden in dreifacher Ausfertigung in eine PCR-Platte gegeben und 5 Minuten lang bei 55 °C inkubiert, gefolgt von einer Zentrifugation (1000 g für 5 Minuten bei 4 °C).

Für den zweiten Schritt, der die PCR enthielt, wurde ein PCR-Mix hergestellt, indem 200 μL PPC (PCR-Primer-Cocktail), 200 μL i501, 200 μL i507 und 400 μL NPM (Reagenzien, die im Standard-Nextera-DNA-Bibliotheksvorbereitungskit enthalten sind) kombiniert wurden. 25 μL dieser Mischung wurden dann zu jedem der 25 μL Tagmentierungsreaktionsaliquots auf der PCR-Platte hinzugefügt, mit der Pipette gemischt und in den Thermocycler zurückgegeben. Der Temperaturgradient zwischen 72 °C und 95 °C wurde über die 12 Säulen der Platte erzeugt und 1 Minute lang gehalten; anschließend wurde die Platte 5 Minuten lang bei 72 °C und anschließend 30 Sekunden lang bei 98 °C inkubiert. Nach diesem Schritt des Auffüllens der Lücke und der Denaturierung wurden 5 PCR-Zyklen gemäß der Nextera-DNA-Bibliotheksvorbereitungsmethode durchgeführt. Die Platte wurde dann bei 1000 g für 5 min bei 4 °C zentrifugiert. Jede Tagmentierungs-PCR-Amplifikationsreaktion wurde dann mit einer Zymo Clean and Concentrator 96-Well-Platte gereinigt und mit 25 μl 10 mM Tris, pH 8,0 eluiert. Eine dreifache Negativkontrollprobe wurde nach dem Standardprotokoll für die Tagmentierung einschließlich der Zymo-Reinigung zur Entfernung der Tn5-Transpoase, jedoch ohne den PCR-Schritt, hergestellt. Eine dreifache Positivkontrolle wurde nach dem Standardprotokoll für die Tagmentierung hergestellt, einschließlich der Zymo-Reinigung zur Entfernung der Tn5-Transposase und dem PCR-Schritt zur Amplifizierung der getaggten DNA. Alle gereinigten DNA-Produkte wurden dann 1:10 in 10 mM Tris, pH 8,0, verdünnt und mit Picogreen und einem Lambda-DNA-Standard quantifiziert.

Die Ergebnisse zeigten, dass Standard-Tn5 sich bei 74,2 °C von der markierten DNA löst und somit nachfolgende Gap-Fill- und PCR-Reaktionen ermöglicht, während Tn5-059 dies bei 76,6 °C tut (Additional file 3: Abbildung S2). Die höhere Temperatur, die für Tn5-059 erforderlich ist, deutet auf einen stabileren DNA-Bindungskomplex hin.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.