Secuenciación mejorada del genoma utilizando una transposasa de ingeniería

Construcción de una biblioteca de mutantes Tn5

Los mutantes Tn5 se generaron mediante mutagénesis aleatoria utilizando una PCR propensa a errores en toda la transposasa Tn5 de tipo salvaje (código de acceso NCBI ‘3ECP_A’, archivo adicional 1). La saturación del sitio se realizó en el sitio de unión al ADN modelado de la proteína. Los fragmentos de Tn5 mutagenizados se insertaron en un vector pET11a modificado para su expresión en E. coli (Illumina Madison). El vector es resistente a la kanamysina para lograr la estabilidad del plásmido y tiene una fusión Strep Tag II-sumo aguas abajo del promotor T7/operón Lac en el N-terminal de la región de codificación de Tn5 para facilitar la purificación. Las mutaciones conductoras identificadas por regresión lineal se combinaron mediante mutagénesis dirigida al sitio estándar (Qiagen).

Expresión y purificación de la proteína mutante

Se chapó la biblioteca de mutantes, se seleccionaron colonias individuales para inocular 1 L de medio de caldo Luria (LB) con 50 μg/mL de kan y se dejaron crecer hasta una DO600 = 0,5. A continuación, se indujo la expresión de las transposasas mutantes Tn5 mediante la adición de 100 μM de isopropil β-D-1-tiogalactopiranósido (IPTG) y se continuó la incubación a 18 °C durante 19 h.

Las células se cosecharon por centrifugación y se resuspendieron en tampón TNE1 (100 mM Tris, pH 8,0, 1 M NaCl, 1 mM de ácido etilendiaminotetraacético (EDTA), 1 mM de ditiotreitol (DTT)) que contenía una mezcla completa de inhibidores de proteasa (Roche). Se utilizó un homogeneizador de vidrio para romper el pellet de células antes de pasarlo por un microfluidizador tres veces para su lisis. Se añadió desoxicolato de sodio al lisado (0,1% final) y la mezcla se incubó a temperatura ambiente mientras se agitaba durante 15 minutos, seguidos de 15 minutos a 4 °C. Mientras se agitaba a 4 °C, se añadió a la mezcla polietilenimina al 5%, pH 7,5 (0,5% final) y se agitó más durante 1 h para precipitar los ácidos nucleicos, que se eliminaron por centrifugación (45.000 g durante 20 min a 4 °C). Se añadió sulfato de amonio saturado al sobrenadante en una proporción de 1:1 y la mezcla se agitó a 4 °C durante 1 h y luego se centrifugó (45.000 g durante 20 min a 4 °C). El pellet que contenía las proteínas mutantes Tn5 se resuspendió en 10 mL de TNE1, se centrifugó para eliminar las partículas y el sobrenadante resultante se diluyó de nuevo 5× con TNE1 y se cargó en una columna StrepTrap de alto rendimiento (HP) (GE Healthcare) que se equilibró con TNE1 utilizando un AKTA Pure (GE Healthcare).

Después de la carga, la columna StrepTrap HP se lavó con 10 volúmenes de columna (CV) de 100 mM Tris, pH 8,0, 4 M NaCl, 1 mM EDTA seguido de 10 CV 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA. A continuación, la proteína se eluyó con un gradiente de 10 CV utilizando 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotin (IBA-lifesciences). Las fracciones que contenían picos de DO280 se agruparon y se aplicaron a una columna HiTrap Heparin HP que se equilibró con 100 mM Tris, pH 7,5, 100 mM NaCl, 0,2 mM EDTA (GE Healthcare). Tras la unión, la columna se lavó con un tampón de equilibrio de 15 CV seguido de un gradiente de sal de 20 CV (100 mM-1 M NaCl). La electroforesis en gel de poliacrilamida con dodecil sulfato de sodio (SDS-PAGE) demostró que un único pico eluido a 0,5 M de NaCl contenía los mutantes Strep-Sumo-Tn5 a 66 kDa. El pico eluido se concentró en un concentrador centrífugo Vivaspin 20 con un MWCO de 10 kDa y luego se diluyó 1:1 con glicerol al 100% para su almacenamiento a -20 °C. A partir de esta expresión y purificación, el rendimiento de las transposasas mutantes Tn5 fue de aproximadamente 5 mg por 1 L de cultivo.

Ensamblaje del transposoma y normalización de la actividad

La secuencia del transposón Tn5 de 19 pb de extremo de mosaico (ME) (que también contiene la secuencia adaptadora de 14 y 15 pb de 5′ compatible con la secuenciación de extremo pareado de Illumina) se recoció calentando los oligos monocatenarios a 95 °C durante 5 minutos y luego reduciendo la temperatura 5 °C cada 2 minutos hasta 20 °C. Los ME recocidos se combinaron con transposasas Tn5 purificadas en una proporción molar de 1,2:1 (ME:transposasa) y se incubaron a 37 °C durante 1 h. El conjunto de transposomas resultante se almacenó a -20 °C hasta su uso.

La actividad de etiquetado de cada mutante se normalizó utilizando el método estándar y los reactivos especificados en el método de preparación de bibliotecas de ADN Nextera (Illumina). En resumen, se marcaron 25 ng de ADN genómico de B. cereus (ADNg) con varias concentraciones de mutantes o con el Tn5 estándar del kit Nextera de Illumina como control. El tamaño del ADN fragmentado resultante se analizó en el chip bioanalizador de ADN de alta sensibilidad de Agilent. A continuación, se normalizaron las concentraciones de los mutantes de Tn5 para conseguir la misma distribución del tamaño de los fragmentos de ADN, en la que el área bajo la curva entre 100 y 300 pb era del 20-30%, 301-600 pb del 30-40% y 601-7000 pb del 30-40%, mientras que el área total bajo la curva entre 100 y 7000 pb era ≥90% (archivo adicional 2: figura S1).

Preparación de bibliotecas de ADN, secuenciación y análisis de datos

Se utilizaron 5 μL de cada transposoma mutante Tn5 a una concentración normalizada para preparar bibliotecas de secuenciación de ADNg de E. coli (genoma equilibrado), R. sphaeroides (genoma rico en GC) y ADN genómico de B. cereus (genoma rico en AT) utilizando el método estándar de preparación de bibliotecas de ADN Nextera. Las bibliotecas se secuenciaron en MiSeq siguiendo el protocolo estándar de Illumina. Los gráficos de sesgo se generaron contando el número de veces que se observó cada nucleótido en cada ciclo para todas las lecturas e informando de ello como un porcentaje. El diagrama de sesgo muestra el sesgo global de etiquetado de una transposasa. Tenga en cuenta que el sesgo en cada posición puede ser independiente de otras posiciones. Los gráficos de cobertura muestran el porcentaje de bases observadas a diferentes profundidades de secuenciación. Se generaron utilizando la opción mpileup de samtools (http://www.htslib.org/). Las curvas de GC normalizadas y los abandonos de AT/GC se generaron utilizando Picard Tools (http://broadinstitute.github.io/picard/).

Regresión lineal

Se utilizaron modelos de regresión lineal para estimar el peso de cada mutación individual en el sesgo de inserción. Cada modelo de regresión lineal se aplicó al contenido del nucleótido dominante en una posición de base en las lecturas, dando lugar a un modelo por posición de base. Los resultados de la secuenciación de E. coli se utilizaron para ajustar los modelos. Así, se utilizaron los siguientes nucleótidos como nucleótido dominante entre las posiciones de base 1 y 15: GTTTA***CTGTGCG. Dado que la Tn5 actúa como un homodímero, los nucleótidos dominantes observados en las posiciones 6 a 9 son siempre bases complementarias a las de las posiciones 1 a 4. Por lo tanto, ignoramos los modelos para las bases 6, 7 y 8 pero mantuvimos la posición de la base 9. Aunque la posición 9 replica el comportamiento de la posición 1 debido a la simetría, la posición 1 se ve afectada por artefactos de secuenciación, por lo que utilizamos la posición 9 para capturar mejor las características de la posición 1.

Se utilizó una validación cruzada de diez veces para el entrenamiento y los pesos se promediaron a través de los 10 entrenamientos cruzados. La matriz de entrada para las variables predictoras consistía en filas para cada mutante y columnas para todas las mutaciones observadas. Las mutaciones que siempre aparecían juntas causaban singularidad en la matriz. Por lo tanto, se eliminaron todas las columnas asociadas a esas mutaciones, excepto una. Se utilizó el método de mínimos cuadrados para resolver los vectores de pesos.

Para cada posición, se eligieron las mutaciones que tenían pesos positivos o negativos significativos. Se creó una nueva biblioteca de mutantes combinando mutaciones de diferentes posiciones. Por lo tanto, las mutaciones se agrupan en base a un efecto similar. Los grupos pueden tener mutaciones comunes que tienen efecto en varias posiciones simultáneamente.

Ensayo de estabilidad de unión de Tn5/ADN

Se demostró que la Tn5 estándar permanece unida a su ADN diana después del etiquetado (resultados no publicados). Por lo tanto, el llenado de huecos del ADN marcado por una polimerasa y la posterior amplificación del ADN por PCR se verán impedidos por el impedimento estérico. Sin embargo, la Tn5 se disocia del ADN marcado cuando se eleva la temperatura, permitiendo así el llenado de huecos y la PCR del ADN por una polimerasa. La temperatura requerida para permitir la reacción de PCR de una polimerasa puede utilizarse, por tanto, para comparar las estabilidades de unión Tn5/ADN de varios mutantes de Tn5. Cuanto mayor sea la temperatura requerida, más estable será el complejo.

El mutante Tn5-059 o el Tn5 estándar se utilizó para marcar el ADNg de B. cereus en una reacción de 1 mL siguiendo el protocolo estándar de Nextera, excepto que el tampón TD se sustituyó por 20 mM de acetato de Tris, pH 7,5, 5 mM de acetato de magnesio. El tampón TD contiene magnesio, por lo que esto no debería crear un efecto adicional combinado con las mutaciones para cambiar el sesgo de inserción. Se dispensaron alícuotas de 25 μL de reacción en una placa de PCR por triplicado y se incubaron a 55 °C durante 5 min, seguidas de centrifugación (1000 g durante 5 min a 4 °C).

Para el segundo paso que contiene la PCR, se preparó una mezcla de PCR combinando 200 μL de PPC (cóctel de cebadores de PCR), 200 μL de i501, 200 μL de i507 y 400 μL de NPM (reactivos suministrados en el kit estándar de preparación de bibliotecas de ADN Nextera). A continuación, se añadieron 25 μL de esta mezcla a cada una de las alícuotas de reacción de marcaje de 25 μL de la placa de PCR, se mezclaron con una pipeta y se devolvieron al termociclador. El gradiente de temperatura entre 72 °C y 95 °C se generó a través de las 12 columnas de la placa y se mantuvo durante 1 min, la placa se incubó a 72 °C durante 5 min seguido de 98 °C durante 30 s. Después de este paso de llenado de huecos-desnaturalización, se realizaron 5 ciclos de PCR especificados en el método de preparación de bibliotecas de ADN Nextera. A continuación se centrifugó la placa a 1000 g durante 5 min a 4 °C. Cada reacción amplificada de marcación-PCR se purificó a continuación utilizando una placa de 96 pocillos Zymo Clean and Concentrator y se eluyó con 25 μL de Tris 10 mM, pH 8,0. Se preparó un triplicado de muestra de control negativo siguiendo el protocolo de marcaje estándar, incluyendo la limpieza de Zymo para eliminar la transpoasa Tn5, pero sin el paso de PCR. Se preparó un triplicado de control positivo siguiendo el protocolo de marcaje estándar, incluyendo la limpieza Zymo para eliminar la transposasa Tn5 y el paso de PCR para amplificar el ADN marcado. A continuación, todos los productos de ADN purificados se diluyeron 1:10 en Tris 10 mM, pH 8,0 y se cuantificaron utilizando Picogreen y un estándar de ADN lambda.

Los resultados demostraron que la Tn5 estándar se desprende del ADN marcado y, por lo tanto, permite el posterior relleno de huecos y las reacciones de PCR a 74,2 °C, mientras que la Tn5-059 lo hace a 76,6 °C (archivo adicional 3: Figura S2). La mayor temperatura requerida para Tn5-059 indica un complejo de unión al ADN más estable.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.