Secvențiere îmbunătățită a genomului folosind o transpază modificată

Construcția bibliotecii de mutanți Tn5

Mutanții Tn5 au fost generați prin mutageneză aleatorie folosind PCR predispusă la erori pe întreaga transpază Tn5 de tip sălbatic (cod de acces NCBI „3ECP_A”, fișier suplimentar 1). Saturarea situsului a fost realizată pe situsul de legare la ADN modelat al proteinei. Fragmentele Tn5 mutagenetizate au fost inserate într-un vector pET11a modificat pentru exprimare în E. coli (Illumina Madison). Vectorul este rezistent la kanamizină pentru stabilitate plasmidică și are o fuziune Strep Tag II-sumo în aval de promotorul T7/operonul lac la extremitatea N-terminală a regiunii de codificare a Tn5 pentru a facilita purificarea. Mutațiile driver identificate prin regresie liniară au fost combinate prin metoda standard de mutageneză dirijată la fața locului (Qiagen).

Expresia și purificarea proteinei mutante

Biblioteca de mutații a fost plantată, au fost selectate colonii unice pentru a inocula 1 L de mediu Luria Broth (LB) cu 50 μg/mL kan și au fost lăsate să crească până la OD600 = 0,5. Expresia transpazelor mutante Tn5 a fost apoi indusă prin adăugarea a 100 μM de izopropil β-D-1-thiogalactopiranozidă (IPTG) și incubarea continuă la 18 °C timp de 19 h.

Celele au fost recoltate prin centrifugare și resuspendate în tampon TNE1 (100 mM Tris, pH 8,0, 1 M NaCl, 1 mM acid etilendiaminotetraacetic (EDTA), 1 mM ditiotreitol (DTT)) care conține un amestec complet de inhibitori de protează (Roche). S-a folosit un omogenizator de sticlă pentru a sparge peletul de celule înainte de a fi trecut de trei ori printr-un microfluidizator pentru liză. În lizat s-a adăugat deoxicolat de sodiu (0,1 % final) și amestecul a fost incubat la temperatura camerei în timp ce se agită timp de 15 minute, urmat de 15 minute la 4 °C. În timp ce se agită la 4 °C, în amestec s-a adăugat 5% polietilenimină, pH 7,5 (0,5% final) și s-a agitat în continuare timp de 1 oră pentru a precipita acizii nucleici, care au fost eliminați prin centrifugare (45 000 g timp de 20 minute la 4 °C). Sulfatul de amoniu saturat a fost adăugat la supernatant în proporție de 1:1, iar amestecul a fost agitat la 4 °C timp de 1 h și apoi centrifugat (45 000 g timp de 20 min la 4 °C). Peletul care conținea proteinele mutante Tn5 a fost resuspendat în 10 ml de TNE1, centrifugat pentru a elimina particulele, iar supernatantul rezultat a fost diluat 5× cu TNE1 și încărcat pe o coloană StrepTrap High Performance (HP) (GE Healthcare) care a fost echilibrată cu TNE1 cu ajutorul unui AKTA Pure (GE Healthcare).

După încărcare, coloana StrepTrap HP a fost spălată cu 10 volume de coloană (CV) de 100 mM Tris, pH 8,0, 4 M NaCl, 1 mM EDTA, urmate de 10 CV 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA. Proteina a fost apoi eluată cu un gradient de 10 CV folosind 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotină (IBA-lifesciences). Fracțiunile care conțin vârfuri la OD280 au fost grupate și aplicate pe o coloană HiTrap Heparin HP care a fost echilibrată cu 100 mM Tris, pH 7,5, 100 mM NaCl, 0,2 mM EDTA (GE Healthcare). După legare, coloana a fost spălată cu un tampon de echilibrare de 15 CV, urmat de un gradient de sare de 20 CV (100 mM-1 M NaCl). Un singur vârf eluat la 0,5 M NaCl a fost demonstrat prin electroforeză în gel de poliacrilamidă cu dodecil sulfat de sodiu (SDS-PAGE) pentru a conține mutanții Strep-Sumo-Tn5 la 66 kDa. Vârful eluat a fost concentrat într-un concentrator centrifugal Vivaspin 20 cu un MWCO de 10 kDa, apoi diluat 1:1 cu glicerol 100% pentru a fi păstrat la -20 °C. În urma acestei exprimări și purificări, randamentul transpazelor mutante Tn5 a fost de aproximativ 5 mg pe 1 L de cultură.

Asamblarea transpozomului și normalizarea activității

Secvența de 19 bp a transpozonului Tn5 mozaic end (ME) (care conține, de asemenea, secvența adaptoare 5′ de 14 și 15 bp, compatibilă cu secvențierea Illumina pe perechi) a fost aneantizată prin încălzirea oligozoarelor monocatenare la 95 °C timp de 5 minute, apoi prin reducerea temperaturii cu 5 °C la fiecare 2 minute până la 20 °C. ME-urile recorectate au fost combinate cu transpazele Tn5 purificate într-un raport molar de 1,2:1 (ME:transpază) și incubate la 37 °C timp de 1 h. Ansamblul transpozomic rezultat a fost depozitat la -20 °C până la utilizare.

Activitatea de marcare a fiecărui mutant a fost normalizată utilizând metoda standard și reactivii specificați în metoda de pregătire a bibliotecilor de ADN Nextera (Illumina). Pe scurt, 25 ng de ADN genomic (gDNA) de B. cereus a fost marcat cu diferite concentrații de mutanți sau cu Tn5 standard din kitul Illumina Nextera ca martor. Dimensiunea ADN-ului fragmentat rezultat a fost analizată pe cipul bioanalizator Agilent High Sensitivity DNA bioanalyzer. Concentrațiile de mutanți Tn5 au fost apoi normalizate pentru a obține aceeași distribuție a dimensiunii fragmentelor de ADN, în care aria de sub curbă între 100 și 300 bp a fost de 20-30%, 301-600 bp 30-40% și 601-7000 bp 30-40%, în timp ce aria totală de sub curbă între 100 și 7000 bp a fost ≥90% (Fișier suplimentar 2: Figura S1).

Prepararea bibliotecilor de ADN, secvențierea și analiza datelor

5 μL din fiecare transpozom mutant Tn5 la concentrație normalizată au fost utilizate pentru a pregăti bibliotecile de secvențiere pentru ADNg de E. coli (genom echilibrat), R. sphaeroides (genom bogat în GC) și ADN genomic de B. cereus (genom bogat în AT) utilizând metoda standard de pregătire a bibliotecilor de ADN Nextera. Bibliotecile au fost apoi secvențiate pe MiSeq în conformitate cu protocolul standard Illumina. Diagramele de părtinire au fost generate prin numărarea numărului de ori în care fiecare nucleotidă a fost observată în fiecare ciclu pentru toate citirile și raportarea acesteia ca procent. Bias plot arată o tendință generală de marcare a unei transposaze. Rețineți că polarizarea la fiecare poziție poate fi independentă de alte poziții. Graficele de acoperire arată procentul de baze observate la diferite adâncimi de secvențiere. Acestea au fost generate cu ajutorul opțiunii mpileup din samtools (http://www.htslib.org/). Curbele GC normalizate și abandonurile AT/GC au fost generate cu ajutorul Picard Tools (http://broadinstitute.github.io/picard/).

Regresie liniară

Modelele de regresie liniară au fost utilizate pentru a estima ponderea fiecărei mutații individuale în polarizarea inserției. Fiecare model de regresie liniară a fost aplicat conținutului de nucleotidă dominantă la o poziție de bază din lecturi, rezultând un model pentru fiecare poziție de bază. Rezultatele secvențierii E. coli au fost utilizate pentru ajustarea modelelor. Astfel, următoarele nucleotide au fost utilizate ca nucleotidă dominantă între pozițiile de bază 1 și 15: GTTTA***CTGTGCG. Deoarece Tn5 acționează ca un homodimer, nucleotidele dominante observate la pozițiile 6 până la 9 sunt întotdeauna baze complementare celor din pozițiile 1 până la 4. Prin urmare, am ignorat modelele pentru bazele 6, 7 și 8, dar am păstrat poziția bazei 9. Deși poziția 9 reproduce comportamentul poziției 1 datorită simetriei, poziția 1 este afectată de artefactele de secvențiere, astfel încât folosim poziția 9 pentru a surprinde mai bine caracteristicile poziției 1.

Pentru instruire s-a folosit validarea încrucișată de zece ori, iar ponderile au fost mediate prin cele 10 antrenamente încrucișate. Matricea de intrare pentru variabilele predictoare a constat din rânduri pentru fiecare mutant și coloane pentru toate mutațiile observate. Mutațiile care au apărut întotdeauna împreună au cauzat singularitate în matrice. Prin urmare, au fost eliminate toate coloanele asociate acestor mutații, cu excepția uneia dintre ele. Metoda celui mai mic pătrat a fost utilizată pentru a rezolva vectorii de ponderare.

Pentru fiecare poziție, au fost alese mutațiile care aveau ponderi pozitive sau negative semnificative. Noua bibliotecă de mutanți a fost creată prin combinarea mutațiilor din diferite poziții. Prin urmare, mutațiile sunt grupate în funcție de efectul similar. Grupurile pot avea mutații comune care au efect pe mai multe poziții simultan.

Tn5/DNA binding stability assay

S-a demonstrat că Tn5 standard rămâne legat de ADN-ul său țintă după etichetare (rezultate nepublicate). Prin urmare, umplerea golului ADN-ului marcat de către o polimerază și amplificarea ulterioară a ADN-ului prin PCR vor fi împiedicate de obstacolul steric. Cu toate acestea, Tn5 se disociază de ADN-ul marcat la o temperatură ridicată, permițând astfel umplerea ulterioară a golurilor și PCR a ADN-ului cu o polimerază. Temperatura necesară pentru a permite reacția PCR a unei polimeraze poate fi astfel utilizată pentru a compara stabilitățile de legare Tn5/ADN ale diferitelor mutante Tn5. Cu cât temperatura necesară este mai mare, cu atât complexul este mai stabil.

Mutantul Tn5-059 sau Tn5 standard a fost utilizat pentru a marca ADNg de B. cereus în reacții de 1 ml, urmând protocolul standard Nextera, cu excepția faptului că tamponul TD a fost înlocuit cu 20 mM Tris Acetat pH 7,5, 5 mM acetat de magneziu. Tamponul TD conține magneziu, astfel încât acest lucru nu ar trebui să creeze un efect suplimentar combinat cu mutațiile pentru a modifica polarizarea inserției. S-au distribuit alicote de 25 μL de reacție într-o placă PCR în triplu exemplar și au fost incubate la 55 °C timp de 5 min, urmate de centrifugare (1000 g timp de 5 min la 4 °C).

Pentru a doua etapă care conține PCR, s-a pregătit un amestec PCR prin combinarea a 200 μL PPC (cocktail de amorsă PCR), 200 μL i501, 200 μL i507 și 400 μL NPM (reactivi furnizați în kitul standard de pregătire a bibliotecilor de ADN Nextera). 25 μL din acest amestec au fost apoi adăugate la fiecare dintre cele 25 μL de aliquote de reacție de marcare de 25 μL de pe placa PCR, au fost amestecate cu o pipetă și au fost readuse în termociclator. Gradientul de temperatură între 72 °C și 95 °C a fost generat de-a lungul celor 12 coloane ale plăcii și a fost menținut timp de 1 minut, apoi placa a fost incubată la 72 °C timp de 5 minute, urmată de 98 °C timp de 30 s. După această etapă de umplere și denaturare a intervalului, s-au efectuat 5 cicluri de PCR specificate în metoda de pregătire a bibliotecilor de ADN Nextera. Placa a fost apoi centrifugată la 1000 g timp de 5 minute la 4 °C. Fiecare reacție amplificată prin marcare-PCR a fost apoi purificată folosind o placă Zymo Clean and Concentrator cu 96 de godeuri și a fost eluată cu 25 μl de Tris 10 mM, pH 8,0. Un triplu exemplar de probă de control negativ a fost preparat urmând protocolul standard de marcare, inclusiv curățarea Zymo pentru a elimina transpoza Tn5, dar fără etapa PCR. Un triplicat de control pozitiv a fost preparat în conformitate cu protocolul standard de marcare, inclusiv curățarea Zymo pentru a elimina transpoza Tn5 și etapa PCR pentru amplificarea ADN-ului marcat. Toți produșii de ADN purificat au fost apoi diluați 1:10 în 10 mM Tris, pH 8,0 și au fost cuantificați folosind Picogreen și un standard de ADN lambda.

Rezultatele au demonstrat că Tn5 standard se eliberează din ADN-ul marcat și, astfel, permite reacții ulterioare de umplere a golurilor și PCR la 74,2 °C, în timp ce Tn5-059 face acest lucru la 76,6 °C (Fișier suplimentar 3: Figura S2). Temperatura mai ridicată necesară pentru Tn5-059 a indicat un complex de legare a ADN-ului mai stabil.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.