Construção de biblioteca mutante Tn5
Tn5 mutantes foram gerados por mutagênese aleatória usando PCR de erro em toda a transposase tipo selvagem Tn5 (código de acesso NCBI ‘3ECP_A’, arquivo adicional 1). A saturação do local foi realizada no local de ligação de DNA modelado da proteína. Os fragmentos de Tn5 mutagenizados foram inseridos num vector pET11a modificado para expressão em E. coli (Illumina Madison). O vector é resistente à canamysina para estabilidade plasmídica e tem uma fusão Strep Tag II-sumo a jusante do promotor T7/operação láctica na região N-terminus da codificação Tn5 para auxiliar a purificação. As mutações condutoras identificadas por regressão linear foram combinadas por mutagénese padrão local dirigida (Qiagen).
Expressão e purificação da proteína mutante
Biblioteca de mutantes foi chapeada, foram seleccionadas colónias únicas para inocular 1 L de caldo de lúria (LB) com 50 μg/mL de Kan e foi permitido o crescimento para OD600 = 0,5. A expressão das transposições mutantes Tn5 foi então induzida pela adição de 100 μM isopropil β-D-1-iogalactopiranósido (IPTG) e continuou a incubação a 18 °C durante 19 h.
Células foram colhidas por centrifugação e ressuspendidas em tampão TNE1 (100 mM Tris, pH 8,0, 1 M NaCl, 1 mM Ácido etilenodiaminotetracético (EDTA), 1 mM Dithiothreitol (DTT)) contendo mistura protease-inibitora completa (Roche). Um homogeneizador de vidro foi usado para quebrar o pellet celular antes de ser passado por um microfluidificador três vezes para lise. O deoxicolato de sódio foi adicionado ao lisado (0,1% final) e a mistura foi incubada à temperatura ambiente enquanto se agitavava durante 15 min seguidos de 15 min a 4 °C. Enquanto se agitava a 4 °C, 5% de polietilenoimina, adicionou-se pH 7,5 à mistura (0,5% final) e agitou-se ainda durante 1 h para precipitar os ácidos nucleicos que foram removidos por centrifugação (45.000 g durante 20 min a 4 °C). Sulfato de amónio saturado foi adicionado ao sobrenadante a uma razão 1:1 e a mistura foi agitada a 4 °C durante 1 h e depois centrifugada (45.000 g durante 20 min a 4 °C). O granulado contendo as proteínas Tn5 mutantes foi ressuspenso em 10 mL de TNE1, centrifugado para remover partículas e o sobrenadante resultante foi diluído 5× com TNE1 e carregado em uma coluna StrepTrap High Performance (HP) (GE Healthcare) que foi equilibrada com TNE1 usando um AKTA Pure (GE Healthcare).
Pós-carga, a coluna StrepTrap HP foi lavada com 10 volumes de coluna (CV) de 100 mM Tris, pH 8,0, 4 M NaCl, 1 mM EDTA seguido de 10 CV 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA. A proteína foi então eluídas com um gradiente de 10 CV utilizando 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotin (IBA-lifesciences). Frações contendo picos em OD280 foram agrupadas e aplicadas em uma coluna HP de Heparina HiTrap que foi equilibrada com 100 mM Tris, pH 7,5, 100 mM NaCl, 0,2 mM EDTA (GE Healthcare). Após a ligação, a coluna foi lavada com 15 CV de tampão de equilíbrio seguido por um gradiente de sal de 20 CV (100 mM-1 M NaCl). Um único pico eluido a 0,5 M NaCl foi mostrado por eletroforese em gel de poliacrilamida sulfato de sódio (SDS-PAGE) para conter os mutantes Strep-Sumo-Tn5 a 66 kDa. O pico eluido foi concentrado em um concentrador centrífugo Vivaspin 20 com 10 kDa MWCO, depois diluído 1:1 com 100% de glicerol para armazenamento a -20 °C. A partir desta expressão e purificação, o rendimento das transposases mutantes Tn5 foi de aproximadamente 5 mg por 1 L de cultura.
Conjunto do transformador e normalização da actividade
A sequência de transposição do mosaico Tn5 de 19 bp (ME) (também contendo a sequência do adaptador de 14 e 15 bp 5′ compatível com a sequência Illumina paired-end) foi recozida aquecendo os oligoelementos isolados a 95 °C durante 5 min e depois reduzindo a temperatura de 5 °C a cada 2 min para 20 °C. Os ME recozidos foram combinados com transposases Tn5 purificadas a uma razão molar de 1,2:1 (ME:transposase) e incubados a 37 °C durante 1 h. O conjunto Transposome resultante foi armazenado a -20 °C até a utilização.
Atividade de tagmentação de cada mutante foi normalizada usando o método padrão e os reagentes especificados no método de preparação da biblioteca de DNA Nextera (Illumina). Em resumo, 25 ng de DNA genômico B. cereus (gDNA) foi etiquetado por várias concentrações de mutantes ou Tn5 padrão do kit de Illumina Nextera como controle. O tamanho do DNA fragmentado resultante foi analisado no chip bioanalisador de DNA de Alta Sensibilidade da Agilent. As concentrações de Tn5 mutantes foram então normalizadas para alcançar a mesma distribuição de tamanho de fragmento de DNA onde a área sob a curva entre 100 e 300 bp era de 20-30%, 301-600 bp 30-40%, e 601-7000 bp 30-40%, enquanto a área total sob a curva entre 100 e 7000 bp era de ≥90% (arquivo adicional 2: Figura S1).
Biblioteca de DNA preparação, sequenciamento e análise de dados
5 μL de cada Tn5 mutante O Transposome em concentração normalizada foi usado para preparar bibliotecas de sequenciamento para E. coli gDNA (genoma balanceado), R. sphaeroides (genoma rico em GC), e B. cereus genomic DNA (genoma rico em AT) usando o método padrão de preparação da biblioteca de DNA Nextera. As bibliotecas foram então sequenciadas em MiSeq seguindo o protocolo padrão de Illumina. Os gráficos de polarização foram gerados pela contagem do número de vezes que cada nucleotídeo foi observado em cada ciclo para todas as leituras e relatando como uma porcentagem. O gráfico de viés mostra um viés geral de tagmentation de um transposase. Note que o viés em cada posição pode ser independente de outras posições. Os gráficos de cobertura mostram a percentagem de bases observadas em diferentes profundidades de seqüenciamento. Eles foram gerados usando a opção mpileup do samtools (http://www.htslib.org/). Curvas GC normalizadas e dropouts AT/GC foram gerados usando ferramentas Picard (http://broadinstitute.github.io/picard/).
Regessão linear
Modelos de regressão linear foram usados para estimar o peso de cada mutação individual no viés de inserção. Cada modelo de regressão linear foi aplicado ao conteúdo do nucleotídeo dominante em uma posição base nas leituras, resultando em um modelo por posição base. Os resultados do sequenciamento E. coli foram usados para encaixar os modelos. Assim, os seguintes nucleotídeos foram usados como nucleotídeos dominantes entre as posições base 1 e 15: GTTTA***CTGTGCG. Como o Tn5 atua como um homodímero, os nucleotídeos dominantes observados nas posições 6 a 9 são sempre bases complementares àquelas nas posições 1 a 4. Portanto, ignoramos modelos para as bases 6, 7 e 8, mas mantivemos a posição base 9. Apesar da posição 9 replicar o comportamento da posição 1 devido à simetria, a posição 1 é afetada por artefatos de seqüenciamento, então usamos a posição 9 para melhor capturar as características da posição 1.
Validação cruzada de dez vezes foi usada para treinamento e os pesos foram calculados como média através dos 10 treinamentos cruzados. A matriz de entrada para as variáveis preditoras consistiu de linhas para cada mutante e colunas para todas as mutações observadas. As mutações que sempre apareceram juntas causaram singularidade na matriz. Assim, todas as colunas associadas a essas mutações, exceto uma, foram abandonadas. Para os vetores de peso foi usado o método do quadrado mínimo para resolver.
Para cada posição, as mutações que tinham pesos significativos, positivos ou negativos, foram escolhidas. Uma nova biblioteca mutante foi criada pela combinação de mutações de diferentes posições. Assim, as mutações são agrupadas com base em efeitos similares. Grupos podem ter mutações comuns que têm efeito em múltiplas posições simultaneamente.
Tn5/DNA binding stability assay
Standard Tn5 foi mostrado para permanecer ligado ao seu ADN alvo pós-agmentação (resultados não publicados). Portanto, o preenchimento da lacuna do ADN marcado por uma polimerase e a amplificação posterior do ADN por PCR será evitada por impedimento estéreo. No entanto, o Tn5 dissocia-se do ADN tagmentado após uma temperatura elevada, permitindo assim um maior preenchimento de lacuna e a PCR do ADN por uma polimerase. A temperatura necessária para permitir a reacção PCR de uma polimerase pode assim ser usada para comparar as estabilidades de ligação Tn5/DNA de vários mutantes Tn5. Quanto mais alta a temperatura necessária, mais estável o complexo.
O mutante Tn5-059 ou Tn5 padrão foi usado para marcar B. cereus gDNA em 1 mL de reação seguindo o protocolo padrão Nextera, exceto o tampão TD foi substituído por 20 mM Tris Acetate pH 7.5, 5 mM acetato de magnésio. O tampão TD contém magnésio, portanto não deve criar um efeito combinado extra com as mutações para alterar o viés de inserção. Alíquotas de 25 μL de reacção foram distribuídas numa placa PCR em triplicado e foram incubadas a 55 °C durante 5 min seguidas de centrifugação (1000 g durante 5 min a 4 °C).
Para o segundo passo contendo a PCR, foi preparada uma mistura de PCR combinando 200 μL PPC (PCR Primer cocktail), 200 μL i501, 200 μL i507, e 400 μL NPM (reagentes fornecidos no kit standard de preparação da biblioteca de ADN Nextera). 25 μL desta mistura foi então adicionado a cada uma das 25 μL alíquotas de reacção de tagmentation na placa PCR, misturado por pipeta e devolvido ao termociclador. O gradiente de temperatura entre 72 °C e 95 °C foi gerado nas 12 colunas da placa e mantido durante 1 min, a placa foi então incubada a 72 °C durante 5 min, seguida de 98 °C durante 30 s. Após esta etapa de preenchimento da lacuna, foram realizados 5 ciclos de PCR especificados no método de preparação da biblioteca de ADN Nextera. A placa foi então centrifugada a 1000 g durante 5 min. a 4 °C. Cada reacção amplificada por PCR foi então purificada utilizando uma placa de poço Zymo Clean and Concentrator 96 e eluídas com 25 μL 10 mM Tris, pH 8.0. Uma triplicata da amostra de controlo negativo foi preparada seguindo o protocolo de marcação padrão incluindo a limpeza com Zymo para remover o Tn5 transpoase mas sem a etapa de PCR. Uma triplicata do controlo positivo foi preparada seguindo o protocolo de marcação padrão, incluindo a limpeza com Zymo para remover a transpoase Tn5 e a etapa de PCR para amplificar o ADN marcado. Todos os produtos de ADN purificado foram então diluídos 1:10 em 10 mM Tris, pH 8.0 e quantificados usando Picogreen e um padrão de ADN lambda.
Os resultados demonstraram que o padrão Tn5 liberta do ADN tagmentado e assim permite o preenchimento subsequente de lacunas e reacções PCR a 74.2 °C, enquanto que o Tn5-059 o faz a 76.6 °C (Ficheiro adicional 3: Figura S2). A temperatura mais elevada requerida para o Tn5-059 indicou um complexo de ligação de ADN mais estável.