Construction d’une bibliothèque de mutants Tn5
Les mutants Tn5 ont été générés par mutagenèse aléatoire à l’aide d’une PCR sujette aux erreurs sur la totalité de la transposase Tn5 de type sauvage (code d’accès NCBI ‘3ECP_A’, fichier supplémentaire 1). La saturation du site a été effectuée sur le site de liaison à l’ADN modélisé de la protéine. Les fragments mutagénisés de Tn5 ont été insérés dans un vecteur pET11a modifié pour l’expression dans E. coli (Illumina Madison). Le vecteur est résistant à la kanamysine pour la stabilité du plasmide et possède une fusion Strep Tag II-sumo en aval du promoteur T7/lac opéron à l’extrémité N-terminale de la région codante de Tn5 pour faciliter la purification. Les mutations pilotes identifiées par régression linéaire ont été combinées par mutagenèse dirigée par site standard (Qiagen).
Expression et purification des protéines mutantes
La bibliothèque de mutants a été plaquée, des colonies uniques ont été sélectionnées pour inoculer 1 L de milieu Luria Broth (LB) avec 50 μg/mL de kan et ont été autorisées à croître jusqu’à OD600 = 0,5. L’expression des transposases mutantes Tn5 a ensuite été induite par l’ajout de 100 μM d’Isopropyl β-D-1-thiogalactopyranoside (IPTG) et une incubation continue à 18 °C pendant 19 h.
Les cellules ont été récoltées par centrifugation et remises en suspension dans le tampon TNE1 (100 mM Tris, pH 8,0, 1 M NaCl, 1 mM acide éthylènediamine-tétraacétique (EDTA), 1 mM Dithiothreitol (DTT)) contenant un mélange complet d’inhibiteurs de protéase (Roche). Un homogénéisateur en verre a été utilisé pour briser le culot cellulaire avant de le faire passer trois fois dans un microfluidiseur pour la lyse. Du désoxycholate de sodium a été ajouté au lysat (0,1 % final) et le mélange a été incubé à température ambiante sous agitation pendant 15 minutes, suivies de 15 minutes à 4 °C. Tout en agitant à 4 °C, de la polyéthylèneimine à 5 %, pH 7,5, a été ajoutée au mélange (0,5 % final) et agitée pendant 1 h pour précipiter les acides nucléiques qui ont été éliminés par centrifugation (45 000 g pendant 20 min à 4 °C). Du sulfate d’ammonium saturé a été ajouté au surnageant dans un rapport 1:1 et le mélange a été agité à 4 °C pendant 1 h, puis centrifugé (45 000 g pendant 20 min à 4 °C). Le culot contenant les protéines mutantes Tn5 a été remis en suspension dans 10 mL de TNE1, centrifugé pour éliminer les particules et le surnageant résultant a encore été dilué 5× avec du TNE1 et chargé sur une colonne StrepTrap haute performance (HP) (GE Healthcare) qui a été équilibrée avec du TNE1 en utilisant un AKTA Pure (GE Healthcare).
Après chargement, la colonne StrepTrap HP a été lavée avec 10 volumes de colonne (CV) de 100 mM Tris, pH 8,0, 4 M NaCl, 1 mM EDTA, suivis de 10 CV de 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA. La protéine a ensuite été éluée avec un gradient de 10 CV utilisant 100 mM Tris, pH 7,5, 100 mM NaCl, 1 mM EDTA, 5 mM Desthiobiotin (IBA-lifesciences). Les fractions contenant des pics à OD280 ont été regroupées et appliquées sur une colonne HiTrap Heparin HP qui a été équilibrée avec 100 mM Tris, pH 7,5, 100 mM NaCl, 0,2 mM EDTA (GE Healthcare). Après la liaison, la colonne a été lavée avec un tampon d’équilibrage de 15 CV suivi d’un gradient de sel de 20 CV (100 mM-1 M NaCl). L’électrophorèse sur gel de polyacrylamide au dodécylsulfate de sodium (SDS-PAGE) a montré qu’un seul pic élué à 0,5 M NaCl contenait les mutants Strep-Sumo-Tn5 à 66 kDa. Le pic élué a été concentré dans un concentrateur centrifuge Vivaspin 20 avec un MWCO de 10 kDa, puis dilué 1:1 avec du glycérol à 100 % pour être conservé à -20 °C. A partir de cette expression et de cette purification, le rendement des transposases mutantes Tn5 était d’environ 5 mg par 1 L de culture.
Assemblage des transposomes et normalisation de l’activité
La séquence du transposon Tn5 à extrémité en mosaïque (ME) de 19 pb (contenant également la séquence adaptatrice 5′ de 14 et 15 pb compatible avec le séquençage Illumina en paires) a été recuite en chauffant les oligos simple brin à 95 °C pendant 5 min puis en réduisant la température de 5 °C toutes les 2 min jusqu’à 20 °C. Les ME recuits ont été combinés avec des transposases Tn5 purifiées à un rapport molaire de 1,2:1 (ME:transposase) et incubés à 37 °C pendant 1 h. L’assemblage de transposomes résultant a été stocké à -20 °C jusqu’à son utilisation.
L’activité de marquage de chaque mutant a été normalisée en utilisant la méthode standard et les réactifs spécifiés dans la méthode de préparation de bibliothèque d’ADN Nextera (Illumina). En bref, 25 ng d’ADN génomique (ADNg) de B. cereus ont été tagués par différentes concentrations de mutants ou par le Tn5 standard du kit Nextera d’Illumina comme contrôle. La taille de l’ADN fragmenté résultant a été analysée sur la puce du bioanalyseur d’ADN haute sensibilité d’Agilent. Les concentrations des mutants de Tn5 ont ensuite été normalisées pour obtenir la même distribution de la taille des fragments d’ADN, où l’aire sous la courbe entre 100 et 300 pb était de 20-30 %, 301-600 pb de 30-40 % et 601-7000 pb de 30-40 %, tandis que l’aire totale sous la courbe entre 100 et 7000 pb était ≥90 % (fichier supplémentaire 2 : figure S1).
Préparation des bibliothèques d’ADN, séquençage et analyse des données
5 μL de chaque Transposome mutant Tn5 à concentration normalisée ont été utilisés pour préparer des bibliothèques de séquençage de l’ADNg d’E. coli (génome équilibré), de R. sphaeroides (génome riche en GC) et de l’ADN génomique de B. cereus (génome riche en AT) en utilisant la méthode standard de préparation des bibliothèques d’ADN Nextera. Les bibliothèques ont ensuite été séquencées sur MiSeq en suivant le protocole standard d’Illumina. Les diagrammes de biais ont été générés en comptant le nombre de fois où chaque nucléotide a été observé dans chaque cycle pour toutes les lectures et en le rapportant sous forme de pourcentage. Le diagramme de biais montre le biais global de marquage d’une transposase. Notez que le biais à chaque position peut être indépendant des autres positions. Les graphiques de couverture montrent le pourcentage de bases observées à différentes profondeurs de séquençage. Ils ont été générés à l’aide de l’option mpileup de samtools (http://www.htslib.org/). Les courbes GC normalisées et les abandons AT/GC ont été générés à l’aide des outils Picard (http://broadinstitute.github.io/picard/).
Régression linéaire
Des modèles de régression linéaire ont été utilisés pour estimer le poids de chaque mutation individuelle dans le biais d’insertion. Chaque modèle de régression linéaire a été appliqué au contenu du nucléotide dominant à une position de base dans les lectures, résultant en un modèle par position de base. Les résultats du séquençage d’E. coli ont été utilisés pour l’ajustement des modèles. Ainsi, les nucléotides suivants ont été utilisés comme nucléotide dominant entre les positions de base 1 et 15 : GTTTA***CTGTGCG. Comme Tn5 agit comme un homodimère, les nucléotides dominants observés aux positions 6 à 9 sont toujours des bases complémentaires à celles des positions 1 à 4. Par conséquent, nous avons ignoré les modèles pour les bases 6, 7 et 8 mais conservé la position 9. Bien que la position 9 reproduise le comportement de la position 1 en raison de la symétrie, la position 1 est affectée par des artefacts de séquençage, nous utilisons donc la position 9 pour mieux capturer les caractéristiques de la position 1.
Une validation croisée à dix reprises a été utilisée pour l’entraînement et les poids ont été calculés en moyenne à travers les 10 entraînements croisés. La matrice d’entrée pour les variables prédicteurs était composée de lignes pour chaque mutant et de colonnes pour toutes les mutations observées. Les mutations qui apparaissent toujours ensemble provoquent une singularité dans la matrice. Par conséquent, toutes les colonnes associées à ces mutations, sauf une, ont été supprimées. La méthode des moindres carrés a été utilisée pour résoudre les vecteurs de poids.
Pour chaque position, les mutations qui avaient des poids positifs ou négatifs significatifs ont été choisies. Une nouvelle bibliothèque de mutants a été créée en combinant les mutations de différentes positions. Par conséquent, les mutations sont regroupées en fonction de leur effet similaire. Les groupes peuvent avoir des mutations communes qui ont un effet sur plusieurs positions simultanément.
Tn5/DNA binding stability assay
Il a été démontré que la Tn5 standard reste liée à son ADN cible après le marquage (résultats non publiés). Par conséquent, le comblement des lacunes de l’ADN marqué par une polymérase et l’amplification ultérieure de l’ADN par PCR seront empêchés par l’encombrement stérique. Cependant, Tn5 se dissocie de l’ADN marqué à une température élevée, permettant ainsi le remplissage de l’espace et la PCR de l’ADN par une polymérase. La température requise pour permettre la réaction PCR d’une polymérase peut donc être utilisée pour comparer les stabilités de liaison Tn5/ADN de divers mutants Tn5. Plus la température requise est élevée, plus le complexe est stable.
Le mutant Tn5-059 ou le Tn5 standard a été utilisé pour marquer l’ADNg de B. cereus dans une réaction de 1 mL en suivant le protocole standard de Nextera, sauf que le tampon TD a été remplacé par 20 mM d’acétate de Tris pH 7,5, 5 mM d’acétate de magnésium. Le tampon TD contient du magnésium, donc cela ne devrait pas créer un effet combiné supplémentaire avec les mutations pour modifier le biais d’insertion. Des aliquotes de 25 μL de réaction ont été distribuées dans une plaque PCR en triplicata et ont été incubées à 55 °C pendant 5 min, suivies d’une centrifugation (1000 g pendant 5 min à 4 °C).
Pour la deuxième étape contenant la PCR, un mélange PCR a été préparé en combinant 200 μL de PPC (cocktail d’amorces PCR), 200 μL de i501, 200 μL de i507 et 400 μL de NPM (réactifs fournis dans le kit standard de préparation de bibliothèque d’ADN Nextera). 25 μL de ce mélange ont ensuite été ajoutés à chacune des aliquotes de réaction de marquage de 25 μL sur la plaque PCR, mélangés à la pipette et remis dans le thermocycleur. Le gradient de température entre 72 °C et 95 °C a été généré à travers les 12 colonnes de la plaque et maintenu pendant 1 min, la plaque a ensuite été incubée à 72 °C pendant 5 min, puis à 98 °C pendant 30 s. Après cette étape de remplissage des espaces et de dénaturation, 5 cycles de PCR spécifiés dans la méthode de préparation des bibliothèques d’ADN Nextera ont été effectués. La plaque a ensuite été centrifugée à 1000 g pendant 5 min à 4 °C. Chaque réaction amplifiée de tagmentation-PCR a ensuite été purifiée à l’aide d’une plaque 96 puits Zymo Clean and Concentrator et éluée avec 25 μL de Tris 10 mM, pH 8,0. Un triplicat d’échantillon de contrôle négatif a été préparé en suivant le protocole de marquage standard, y compris le nettoyage Zymo pour éliminer la transpoase Tn5, mais sans l’étape de PCR. Un triplicat de contrôle positif a été préparé en suivant le protocole standard de marquage incluant le nettoyage Zymo pour éliminer la transposase Tn5 et l’étape de PCR pour amplifier l’ADN marqué. Tous les produits d’ADN purifiés ont ensuite été dilués au 1:10 dans du Tris 10 mM, pH 8,0 et quantifiés à l’aide de Picogreen et d’un standard d’ADN lambda.
Les résultats ont démontré que le Tn5 standard se libère de l’ADN tagué et permet ainsi les réactions ultérieures de gap fill et de PCR à 74,2 °C, tandis que le Tn5-059 le fait à 76,6 °C (fichier additionnel 3 : figure S2). La température plus élevée requise pour Tn5-059 indique un complexe de liaison à l’ADN plus stable.