Konstrukce knihovny mutantů Tn5
Mutanti Tn5 byli vytvořeni náhodnou mutagenezí pomocí PCR náchylné k chybám na celém divokém typu transpozázy Tn5 (přístupový kód NCBI „3ECP_A“, další soubor 1). Saturace místa byla provedena na modelovaném vazebném místě proteinu pro DNA. Mutagenizované fragmenty Tn5 byly vloženy do upraveného vektoru pET11a pro expresi v E. coli (Illumina Madison). Vektor je odolný vůči kanamysinu kvůli stabilitě plazmidu a má Strep Tag II-sumo fúzi za promotorem T7/lac operonem na N-konci kódující oblasti Tn5 pro usnadnění purifikace. Řídící mutace identifikované lineární regresí byly zkombinovány pomocí standardní mutageneze řízené na místě (Qiagen).
Exprese a purifikace mutantního proteinu
Mutantní knihovna byla naočkována, jednotlivé kolonie byly vybrány k inokulaci na 1 médium Luria Broth (LB) s 50 μg/ml kan a byly ponechány růst do OD600 = 0,5. V případě, že byly mutace identifikovány pomocí lineární regrese, byly zkombinovány pomocí standardní mutageneze řízené na místě. Exprese mutantních transpozit Tn5 byla poté indukována přidáním 100 μM isopropyl β-D-1-thiogalaktopyranosidu (IPTG) a pokračovala inkubací při 18 °C po dobu 19 hodin.
Buňky byly sklizeny centrifugací a resuspendovány v pufru TNE1 (100 mM Tris, pH 8,0, 1 M NaCl, 1 mM kyselina ethylendiamintetraoctová (EDTA), 1 mM dithiotreitol (DTT)) obsahujícím kompletní směs inhibitorů proteáz (Roche). Skleněný homogenizátor byl použit k rozbití buněčné pelety předtím, než byla třikrát propasírována přes mikrofluidizér pro lýzu. K lyzátu byl přidán deoxycholát sodný (konečná hodnota 0,1 %) a směs byla inkubována při pokojové teplotě za stálého míchání po dobu 15 min a poté 15 min při 4 °C. Za míchání při 4 °C byl ke směsi přidán 5% polyethylenimin, pH 7,5 (konečná hodnota 0,5 %) a dále se míchal 1 h, aby se vysrážely nukleové kyseliny, které byly odstraněny centrifugací (45 000 g po dobu 20 min při 4 °C). K supernatantu byl přidán nasycený síran amonný v poměru 1:1 a směs byla míchána 1 h při 4 °C a poté odstředěna (45 000 g po dobu 20 min při 4 °C). Peleta obsahující mutantní proteiny Tn5 byla resuspendována v 10 ml TNE1, odstředěna k odstranění částic a výsledný supernatant byl dále naředěn 5× TNE1 a vložen na vysoce výkonnou kolonu StrepTrap (HP) (GE Healthcare), která byla ekvilibrována TNE1 pomocí AKTA Pure (GE Healthcare).
Po zatížení byla kolona StrepTrap HP promyta 10 objemy kolony (CV) 100 mM Tris, pH 8,0, 4 M NaCl, 1 mM EDTA, následovanými 10 CV 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA. Protein byl poté eluován gradientem 10 CV s použitím 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotin (IBA-lifesciences). Frakce obsahující píky při OD280 byly sloučeny a použity na kolonu HiTrap Heparin HP, která byla ekvilibrována 100 mM Tris, pH 7,5, 100 mM NaCl, 0,2 mM EDTA (GE Healthcare). Po navázání byla kolona promyta 15 CV ekvilibračního pufru a následně 20 CV gradientu soli (100 mM-1 M NaCl). Polyakrylamidová gelová elektroforéza na dodecylsulfátu sodném (SDS-PAGE) prokázala, že jediný eluovaný pík při 0,5 M NaCl obsahuje mutanty Strep-Sumo-Tn5 o hmotnosti 66 kDa. Eluovaný pík byl zahuštěn v centrifugálním koncentrátoru Vivaspin 20 s MWCO 10 kDa a poté zředěn 1:1 100% glycerolem pro skladování při -20 °C. Z této exprese a purifikace byl výtěžek mutantních transpozáz Tn5 přibližně 5 mg na 1 l kultury.
Sestavení transpozomů a normalizace aktivity
19 bp sekvence transpozonu Tn5 s mozaikovým koncem (ME) (obsahující také 14 a 15 bp 5′ adaptorovou sekvenci kompatibilní s párovým sekvenováním Illumina) byla žíhána zahříváním jednovláknových oligos při 95 °C po dobu 5 minut a následným snížením teploty o 5 °C každé 2 minuty až na 20 °C. Žíhané ME byly kombinovány s purifikovanou transpozázou Tn5 v molárním poměru 1,2:1 (ME:transpozáza) a inkubovány při 37 °C po dobu 1 h. Výsledná sestava transpozomů byla až do použití skladována při -20 °C.
Tagmentační aktivita každého mutanta byla normalizována pomocí standardní metody a činidel uvedených v metodě přípravy knihovny DNA Nextera (Illumina). Stručně řečeno, 25 ng genomové DNA (gDNA) B. cereus bylo značkováno různými koncentracemi mutantů nebo standardní Tn5 ze soupravy Illumina Nextera jako kontrola. Velikost výsledné fragmentované DNA byla analyzována na čipu vysoce citlivého bioanalyzátoru DNA společnosti Agilent. Koncentrace mutantů Tn5 byly poté normalizovány tak, aby bylo dosaženo stejné distribuce velikosti fragmentů DNA, kdy plocha pod křivkou mezi 100 a 300 bp byla 20-30 %, 301-600 bp 30-40 % a 601-7000 bp 30-40 %, zatímco celková plocha pod křivkou mezi 100 a 7000 bp byla ≥90 % (Additional file 2: Figure S1).
Příprava knihoven DNA, sekvenování a analýza dat
5 μl každého mutantního transpozomu Tn5 v normalizované koncentraci bylo použito k přípravě sekvenačních knihoven pro gDNA E. coli (vyvážený genom), R. sphaeroides (genom bohatý na GC) a genomovou DNA B. cereus (genom bohatý na AT) pomocí standardní metody přípravy knihoven DNA Nextera. Knihovny byly poté sekvenovány na přístroji MiSeq podle standardního protokolu společnosti Illumina. Grafy zkreslení byly vytvořeny spočítáním počtu výskytů jednotlivých nukleotidů v každém cyklu pro všechna čtení a jejich vykázáním v procentech. Bias plot ukazuje celkové zkreslení tagmentace transpozice. Všimněte si, že bias na každé pozici může být nezávislý na ostatních pozicích. Grafy pokrytí ukazují procento pozorovaných bází při různé hloubce sekvenování. Byly vytvořeny pomocí volby mpileup v nástroji samtools (http://www.htslib.org/). Normalizované GC křivky a AT/GC výpadky byly generovány pomocí Picard Tools (http://broadinstitute.github.io/picard/).
Lineární regrese
K odhadu váhy každé jednotlivé mutace v inzertním biasu byly použity lineární regresní modely. Každý lineární regresní model byl aplikován na obsah dominantního nukleotidu na pozici báze ve čtení, čímž vznikl model na pozici báze. Pro fitování modelů byly použity výsledky sekvenování E. coli. Proto byly jako dominantní nukleotid mezi pozicemi bází 1 a 15 použity následující nukleotidy: GTTTA***CTGTGCG. Vzhledem k tomu, že Tn5 funguje jako homodimer, dominantní nukleotidy pozorované v pozicích 6 až 9 jsou vždy komplementárními bázemi k bázím v pozicích 1 až 4. Proto jsme ignorovali modely pro báze 6, 7 a 8, ale zachovali jsme pozici báze 9. Ačkoli pozice 9 díky symetrii kopíruje chování pozice 1, pozice 1 je ovlivněna artefakty sekvenování, proto jsme použili pozici 9, abychom lépe zachytili vlastnosti pozice 1.
Pro trénování byla použita desetinásobná křížová validace a váhy byly zprůměrovány prostřednictvím 10 křížových trénování. Vstupní matice pro predikční proměnné se skládala z řádků pro každého mutanta a sloupců pro všechny pozorované mutace. Mutace, které se vždy vyskytovaly společně, způsobovaly v matici singularitu. Proto byly všechny sloupce spojené s těmito mutacemi kromě jednoho vypuštěny. K řešení váhových vektorů byla použita metoda nejmenších čtverců.
Pro každou pozici byly vybrány mutace, které měly významné kladné nebo záporné váhy. Kombinací mutací z různých pozic byla vytvořena nová knihovna mutantů. Proto byly mutace seskupeny na základě podobného účinku. Skupiny mohou mít společné mutace, které mají vliv na více pozic současně.
Test stability vazby Tn5/DNA
Bylo prokázáno, že standardní Tn5 zůstává navázán na svou cílovou DNA po označení (nepublikované výsledky). Proto vyplnění mezery ve značené DNA polymerázou a další amplifikaci DNA pomocí PCR zabrání sterická překážka. Tn5 se však při zvýšené teplotě oddělí od označené DNA, což umožní další vyplnění mezery a PCR DNA polymerázou. Teplotu potřebnou k umožnění PCR reakce polymerázy lze tedy použít k porovnání vazebné stability Tn5/DNA různých mutant Tn5. Čím vyšší teplota je nutná, tím je komplex stabilnější.
Mutant Tn5-059 nebo standardní Tn5 byl použit ke značení gDNA B. cereus v 1 ml reakce podle standardního protokolu Nextera s výjimkou toho, že TD pufr byl nahrazen 20 mM Tris acetátem pH 7,5, 5 mM octanem hořečnatým. TD pufr obsahuje hořčík, takže by to nemělo vytvořit další kombinovaný účinek s mutacemi, který by změnil inzertní bias. Alikvoty 25 μl reakce byly dávkovány do destičky PCR ve třech opakováních a byly inkubovány při 55 °C po dobu 5 minut, poté následovala centrifugace (1000 g po dobu 5 minut při 4 °C).
Pro druhý krok obsahující PCR byla připravena směs PCR kombinací 200 μl PPC (PCR Primer cocktail), 200 μl i501, 200 μl i507 a 400 μl NPM (činidla dodávaná ve standardní sadě pro přípravu DNA knihovny Nextera). 25 μl této směsi bylo poté přidáno do každého 25 μl alikvotu reakce značení na destičce PCR, promícháno pipetou a vráceno do termocykléru. Teplotní gradient mezi 72 °C a 95 °C byl vytvořen napříč 12 sloupci destičky a udržován po dobu 1 min, poté byla destička inkubována při 72 °C po dobu 5 min a následně při 98 °C po dobu 30 s. Po tomto kroku vyplnění mezery a denaturace bylo provedeno 5 cyklů PCR uvedených v metodě přípravy DNA knihovny Nextera. Destička byla poté odstředěna při 1000 g po dobu 5 min při 4 °C. Každá reakce amplifikovaná pomocí tagmentace a PCR byla poté přečištěna pomocí 96jamkové destičky Zymo Clean and Concentrator a eluována 25 μl 10 mM Tris, pH 8,0. Trojnásobek negativního kontrolního vzorku byl připraven podle standardního protokolu značení včetně čištění Zymo pro odstranění transpoázy Tn5, ale bez kroku PCR. Trojnásobek pozitivní kontroly byl připraven podle standardního protokolu značení včetně čištění Zymo pro odstranění transpozázy Tn5 a kroku PCR pro amplifikaci značené DNA. Všechny přečištěné produkty DNA byly poté zředěny v poměru 1:10 v 10 mM Tris, pH 8,0 a kvantifikovány pomocí Picogreenu a standardu lambda DNA.
Výsledky ukázaly, že standardní Tn5 se uvolňuje ze značené DNA a umožňuje tak následné vyplnění mezery a PCR reakce při teplotě 74,2 °C, zatímco Tn5-059 tak činí při teplotě 76,6 °C (Additional file 3: Figure S2). Vyšší teplota potřebná pro Tn5-059 naznačuje stabilnější vazebný komplex na DNA.
.