Konstrukcja biblioteki mutantów Tn5
Mutanty Tn5 zostały wygenerowane przez losową mutagenezę przy użyciu PCR podatnego na błędy na całej transpozazie Tn5 typu dzikiego (kod akcesyjny NCBI '3ECP_A’, plik dodatkowy 1). Saturacja miejsca została przeprowadzona na modelowanym miejscu wiązania DNA białka. Zmutowane fragmenty Tn5 wstawiono do zmodyfikowanego wektora pET11a w celu ekspresji w E. coli (Illumina Madison). Wektor jest odporny na kanamyzynę w celu zapewnienia stabilności plazmidu i posiada fuzję Strep Tag II-sumo poniżej promotora T7/operonu Lac na N-końcu regionu kodującego Tn5 w celu ułatwienia oczyszczania. Mutacje sterujące zidentyfikowane przez regresję liniową zostały połączone przez standardową mutagenezę ukierunkowaną na miejsce (Qiagen).
Wyrażanie i oczyszczanie zmutowanego białka
Bibliotekę mutantów posiano, wybrano pojedyncze kolonie do inokulacji 1 L podłoża Luria Broth (LB) z 50 μg/mL kan i pozwolono im rosnąć do OD600 = 0,5. Ekspresja zmutowanych transpozaz Tn5 była następnie indukowana przez dodanie 100 μM izopropylowego β-D-1-tiogalaktopiranozydu (IPTG) i kontynuowano inkubację w temperaturze 18 °C przez 19 h.
Komórki zbierano przez odwirowanie i ponownie zawieszano w buforze TNE1 (100 mM Tris, pH 8,0, 1 M NaCl, 1 mM kwas etylenodiaminotetraoctowy (EDTA), 1 mM Dithiothreitol (DTT)) zawierającym kompletną mieszankę inhibitorów proteaz (Roche). Szklany homogenizator został użyty do rozbicia osadu komórkowego przed trzykrotnym przepuszczeniem go przez mikrofluidyzator w celu lizy. Do lizatu dodano dezoksycholan sodu (0,1% końcowy) i mieszaninę inkubowano w temperaturze pokojowej, mieszając przez 15 min, a następnie przez 15 min w 4 °C. Podczas mieszania w 4 °C do mieszaniny dodano 5% polietylenoiminy, pH 7,5 (0,5% końcowe) i mieszano dalej przez 1 h w celu wytrącenia kwasów nukleinowych, które usunięto przez odwirowanie (45 000 g przez 20 min w 4 °C). Do supernatantu dodano nasycony siarczan amonu w stosunku 1:1, mieszaninę mieszano w temperaturze 4 °C przez 1 h, a następnie odwirowano (45 000 g przez 20 min w temperaturze 4 °C). Osad zawierający zmutowane białka Tn5 ponownie zawieszano w 10 mL TNE1, odwirowywano w celu usunięcia cząstek stałych, a powstały supernatant dalej rozcieńczano 5-krotnie TNE1 i umieszczano na kolumnie StrepTrap High Performance (HP) (GE Healthcare), którą zrównano z TNE1 przy użyciu AKTA Pure (GE Healthcare).
Po załadowaniu, kolumnę StrepTrap HP przemyto 10 objętościami kolumny (CV) 100 mM Tris, pH 8.0, 4 M NaCl, 1 mM EDTA, a następnie 10 CV 100 mM Tris, pH 7.5, 100 mM NaCl, 1 mM EDTA. Białko było następnie eluowane gradientem 10 CV przy użyciu 100 mM Tris, pH 7.5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotin (IBA-lifesciences). Frakcje zawierające piki przy OD280 były łączone i nanoszone na kolumnę HiTrap Heparin HP, która była kalibrowana 100 mM Tris, pH 7.5, 100 mM NaCl, 0.2 mM EDTA (GE Healthcare). Po związaniu, kolumnę przemyto 15 CV buforem równoważącym, po czym zastosowano 20 CV gradient soli (100 mM-1 M NaCl). Pojedynczy eluowany pik przy 0,5 M NaCl został wykazany przez elektroforezę w żelu poliakrylamidowym z dodecylosiarczanem sodu (SDS-PAGE) jako zawierający mutanty Strep-Sumo-Tn5 o masie 66 kDa. Wyeluowany pik był zatężany w koncentratorze wirówkowym Vivaspin 20 o MWCO 10 kDa, a następnie rozcieńczany 1:1 w 100% glicerolu do przechowywania w -20 °C. Z tej ekspresji i oczyszczania, wydajność zmutowanych transpozaz Tn5 wynosiła około 5 mg na 1 L kultury.
Składanie transpozonów i normalizacja aktywności
Sekwencja transpozonu Tn5 z końcem mozaikowym (ME) o długości 19 bp (zawierająca również 14 i 15 bp 5′ sekwencji adaptorowej zgodnej z sekwencjonowaniem Illumina paired-end) została zneutralizowana przez ogrzewanie jednoniciowych oligosów w 95 °C przez 5 min, a następnie obniżanie temperatury o 5 °C co 2 min do 20 °C. Zanegowane ME połączono z oczyszczonymi transpozazami Tn5 w stosunku molowym 1,2:1 (ME:transpozazy) i inkubowano w temperaturze 37 °C przez 1 h. Powstały zespół transpozomów przechowywano w temperaturze -20 °C do czasu użycia.
Aktywność tagowania każdego mutanta normalizowano przy użyciu standardowej metody i odczynników określonych w metodzie przygotowania biblioteki DNA Nextera (Illumina). W skrócie, 25 ng genomowego DNA B. cereus (gDNA) było tagowane różnymi stężeniami mutantów lub standardowym Tn5 z zestawu Nextera firmy Illumina jako kontrola. Wielkość powstałego fragmentarycznego DNA analizowano na chipie bioanalizatora DNA High Sensitivity firmy Agilent. Stężenia mutantów Tn5 zostały następnie znormalizowane, aby uzyskać taki sam rozkład wielkości fragmentów DNA, gdzie obszar pod krzywą między 100 a 300 bp wynosił 20-30%, 301-600 bp 30-40%, a 601-7000 bp 30-40%, podczas gdy całkowity obszar pod krzywą między 100 a 7000 bp wynosił ≥90% (plik dodatkowy 2: Rysunek S1).
Przygotowanie biblioteki DNA, sekwencjonowanie i analiza danych
5 μL każdego zmutowanego transpozomu Tn5 w znormalizowanym stężeniu wykorzystano do przygotowania bibliotek sekwencjonujących dla E. coli gDNA (genom zrównoważony), R. sphaeroides (genom bogaty w GC) i genomowego DNA B. cereus (genom bogaty w AT) przy użyciu standardowej metody przygotowania biblioteki DNA Nextera. Biblioteki były następnie sekwencjonowane na MiSeq zgodnie ze standardowym protokołem firmy Illumina. Bias plot został wygenerowany poprzez policzenie liczby przypadków, w których każdy nukleotyd został zaobserwowany w każdym cyklu dla wszystkich odczytów i przedstawienie tego jako procent. Bias plot pokazuje ogólną tendencję do tagowania transpozaz. Należy zauważyć, że bias na każdej pozycji może być niezależny od innych pozycji. Wykresy pokrycia pokazują procentowy udział baz obserwowanych przy różnych głębokościach sekwencjonowania. Zostały one wygenerowane przy użyciu opcji mpileup programu samtools (http://www.htslib.org/). Znormalizowane krzywe GC i zrzuty AT/GC zostały wygenerowane przy użyciu Picard Tools (http://broadinstitute.github.io/picard/).
Regresja liniowa
Modele regresji liniowej zostały użyte do oszacowania wagi każdej pojedynczej mutacji w insertion bias. Każdy model regresji liniowej został zastosowany do zawartości dominującego nukleotydu w pozycji bazy w odczytach, co dało model na pozycję bazy. Do dopasowania modeli wykorzystano wyniki sekwencjonowania E. coli. I tak, następujące nukleotydy zostały użyte jako nukleotydy dominujące pomiędzy pozycjami bazowymi 1 i 15: GTTTA***CTGTGCG. Ponieważ Tn5 działa jako homodimer, dominujące nukleotydy obserwowane w pozycjach od 6 do 9 są zawsze zasadami komplementarnymi do tych w pozycjach od 1 do 4. Dlatego zignorowaliśmy modele dla pozycji 6, 7 i 8, ale utrzymaliśmy pozycję 9. Chociaż pozycja 9 replikuje zachowanie pozycji 1 z powodu symetrii, pozycja 1 jest dotknięta artefaktami sekwencjonowania, więc używamy pozycji 9, aby lepiej uchwycić cechy pozycji 1.
Dziesięciokrotna walidacja krzyżowa została użyta do treningu, a wagi zostały uśrednione przez 10 treningów krzyżowych. Macierz wejściowa dla zmiennych predykcyjnych składała się z wierszy dla każdego mutanta i kolumn dla wszystkich zaobserwowanych mutacji. Mutacje, które zawsze występowały razem, powodowały osobliwość w macierzy. W związku z tym wszystkie kolumny związane z tymi mutacjami, z wyjątkiem jednej, zostały usunięte. Metoda najmniejszych kwadratów została użyta do rozwiązania dla wektorów wag.
Dla każdej pozycji, mutacje, które miały znaczące pozytywne lub negatywne wagi zostały wybrane. Nowa biblioteka mutantów została utworzona przez połączenie mutacji z różnych pozycji. Stąd mutacje są grupowane na podstawie podobnego efektu. Grupy mogą mieć wspólne mutacje, które mają wpływ na wiele pozycji jednocześnie.
Tn5/DNA binding stability assay
Standardowy Tn5 został pokazany, aby pozostać związany z docelowym DNA po tagowaniu (niepublikowane wyniki). Dlatego wypełnianie luki przez polimerazę i dalsza amplifikacja DNA przez PCR będą uniemożliwione przez przeszkodę steryczną. Jednakże, Tn5 dysocjuje od znakowanego DNA w podwyższonej temperaturze, umożliwiając w ten sposób dalsze wypełnianie luki i PCR DNA przez polimerazę. Temperatura wymagana do umożliwienia reakcji PCR polimerazy może być zatem użyta do porównania stabilności wiązania Tn5/DNA różnych mutantów Tn5. Im wyższa wymagana temperatura, tym bardziej stabilny kompleks.
Mutant Tn5-059 lub standardowy Tn5 został użyty do znakowania B. cereus gDNA w 1 mL reakcji, postępując zgodnie ze standardowym protokołem Nextera, z wyjątkiem buforu TD zastąpiono 20 mM Tris Acetate pH 7,5, 5 mM octan magnezu. Bufor TD zawiera magnez, więc nie powinien on tworzyć dodatkowego połączonego efektu z mutacjami, aby zmienić tendencję do wstawiania. Podwielokrotności 25 μL reakcji dozowano do płytki PCR w triplikacie i inkubowano w 55 °C przez 5 min, po czym wirowano (1000 g przez 5 min w 4 °C).
Dla drugiego etapu zawierającego PCR, przygotowano mieszaninę PCR łącząc 200 μL PPC (koktajl PCR Primer), 200 μL i501, 200 μL i507, i 400 μL NPM (odczynniki dostarczane w standardowym zestawie do przygotowania biblioteki DNA Nextera). Następnie 25 μL tej mieszaniny dodawano do każdej z 25 μL porcji reakcji tagowania na płytce PCR, mieszano pipetą i ponownie umieszczano w termocyklerze. Gradient temperatury między 72 °C a 95 °C został wytworzony w 12 kolumnach płytki i utrzymany przez 1 min, płytka była następnie inkubowana w temperaturze 72 °C przez 5 min, a następnie w 98 °C przez 30 s. Po tym etapie wypełnienia luki i denaturacji wykonano 5 cykli PCR określonych w metodzie przygotowania biblioteki DNA Nextera. Następnie płytkę odwirowano przy 1000 g przez 5 min w temp. 4 °C. Każda reakcja amplifikacji tagmentacji-PCR została następnie oczyszczona przy użyciu 96-dołkowej płytki Zymo Clean and Concentrator i eluowana 25 μL 10 mM Tris, pH 8,0. Triplikat negatywnej próbki kontrolnej przygotowano zgodnie ze standardowym protokołem znakowania, włączając w to czyszczenie Zymo w celu usunięcia transpobazy Tn5, ale bez etapu PCR. Triplikat kontroli pozytywnej przygotowano zgodnie ze standardowym protokołem znakowania, włączając w to czyszczenie Zymo w celu usunięcia transpozazy Tn5 oraz etap PCR w celu amplifikacji znakowanego DNA. Wszystkie oczyszczone produkty DNA rozcieńczono następnie w stosunku 1:10 w 10 mM Tris, pH 8,0 i oznaczono ilościowo przy użyciu Picogreen i standardu DNA lambda.
Wyniki wykazały, że standardowy Tn5 uwalnia się od znakowanego DNA, a tym samym umożliwia późniejsze wypełnianie szczelin i reakcje PCR w temperaturze 74,2 °C, podczas gdy Tn5-059 robi to w 76,6 °C (Dodatkowy plik 3: Figura S2). Wyższa temperatura wymagana dla Tn5-059 wskazywała na bardziej stabilny kompleks wiążący DNA.
.