- Raison d’être expérimentale de la SNP-ChIP
- SNP-ChIP d’une protéine chromosomique à évolution rapide
- SNP-ChIP est robuste à la variation de la profondeur de séquençage et de la fraction de cellules spike-in
- Profils de liaison obtenus directement à partir d’expériences SNP-ChIP
- Les niveaux globaux de Red1 sont réduits dans les mutants de cohésine et hop1∆
- Les niveaux deγ-H2AX ne changent pas dans les séries de souches dosées Red1
Raison d’être expérimentale de la SNP-ChIP
Le principe de base de la SNP-ChIP est que les cellules d’une même espèce peuvent servir de matériel de piquage à condition qu’elles abritent une diversité génétique suffisante, principalement sous la forme de polymorphismes mononucléotidiques (SNP). Le signal de chaque polymorphisme fournit une mesure indépendante du rapport échantillon test/échantillon spike-in qui permet de calculer un facteur de normalisation et de mettre à l’échelle les résultats de ChIP-seq (Fig. 1a). Si la diversité génétique est suffisante pour permettre l’attribution d’une grande fraction des lectures de séquençage aux génomes d’origine, la SNP-ChIP permet en outre de générer des profils de distribution de cibles à l’échelle du génome. Il est important de noter que, comme la SNP-ChIP utilise la même espèce comme source de matériel de pointe, elle fonctionnera avec pratiquement n’importe quelle cible dans le protéome de l’organisme, y compris les modifications post-traductionnelles, à condition qu’un anticorps de qualité ChIP soit disponible.
SNP-ChIP d’une protéine chromosomique à évolution rapide
Pour tester l’utilité des spike-ins intra-espèces, nous nous sommes tournés vers les analyses de chromatine chez la levure. Nous nous sommes spécifiquement concentrés sur les chromosomes en méiose car ce processus implique de nombreuses protéines chromosomiques largement distribuées et des modifications post-traductionnelles. Un exemple typique est la protéine Red1 de l’élément axial, qui joue un rôle important dans la recombinaison méiotique. Red1 est largement répartie le long des chromosomes mais, comme d’autres facteurs méiotiques, sa séquence a divergé même chez des espèces étroitement apparentées. En outre, comme de nombreuses protéines, Red1 ne peut pas être facilement étiqueté sans perturber la fonction de la protéine. Ces attributs signifient que Red1 ne se prête pas aux approches standard de marquage, ce qui en fait une cible particulièrement adaptée au SNP-ChIP. En outre, les mutations qui modifient les niveaux globaux et la distribution chromosomique de Red1 sont disponibles , fournissant des repères pour évaluer l’efficacité de SNP-ChIP.
SNP-ChIP de Red1 a été réalisée en utilisant le fond génétique SK1 comme souche de test et une variante optimisée pour la méiose de la souche de référence S288c largement utilisée comme spike-in . Pour les deux milieux génétiques, des assemblages de génome de bout en bout de haute qualité sont disponibles. Ces assemblages diffèrent par environ 76 000 SNP, espacés d’une distance médiane globale de 70 pb (fichier additionnel 1 : figure S1a) de manière cohérente sur tous les chromosomes (fichier additionnel 1 : figure S1b), ce qui constitue une variation suffisante pour permettre l’attribution non ambiguë d’une grande partie des lectures de séquençage. Pour réaliser le SNP-ChIP, les cellules tests (SK1) ont été mélangées avec une fraction constante de cellules méiotiques spike-in (S288c) avant de soumettre les mélanges à un protocole standard de ChIP-seq. Les lectures générées ont été alignées sur un génome hybride construit en concaténant les assemblages génomiques des génomes test et spike-in. Les lectures ont été alignées dans des conditions de correspondance parfaite, en excluant toute lecture s’alignant sur plus d’un emplacement. Par conséquent, toutes les lectures chevauchant au moins un SNP ont été attribuées à un génome et à un emplacement génomique spécifiques, tandis que les lectures ne chevauchant pas un polymorphisme ont cartographié les deux génomes et ont donc été écartées.
Nous avons initialement étudié la capacité de la SNP-ChIP à détecter les changements d’association chromatinienne résultant d’une production réduite de protéines. L’allèle red1ycs4S est causé par une mutation dans le promoteur de RED1 qui entraîne une réduction des niveaux de Red1 à environ 20-25% du type sauvage et une perte presque complète des éléments axiaux observables cytologiquement . Il est important de noter que l’analyse ChIP-seq traditionnelle n’a pas permis de détecter ce changement dans l’abondance des protéines et a produit des profils Red1 indiscernables entre le type sauvage et les mutants red1ycs4S. En revanche, lorsque nous avons appliqué l’analyse SNP-ChIP pour comparer ces deux souches, les niveaux de liaison réduits de Red1 étaient facilement visibles (Fig. 1b). Le calcul d’un facteur de normalisation du spike-in basé sur l’abondance relative de l’échantillon total et des lectures du spike-in a donné un niveau de Red1 dans le mutant red1ycs4S de 28,8 ± 5,1 % (S.D.) du type sauvage, correspondant étroitement au changement rapporté dans les niveaux de Red1 obtenus par l’analyse occidentale. Ce facteur de normalisation a permis une mise à l’échelle appropriée du signal des profils ChIP-seq pour les deux conditions (Fig. 1c).
La SNP-ChIP a été validée davantage en l’appliquant à une série de dosage de Red1, qui consiste en différentes combinaisons d’allèles RED1 (RED1, red1ycs4S, red1Δ) produisant une diminution progressive des niveaux de Red1 (Fig. 1d) . Les mesures SNP-ChIP de l’association chromatinienne de Red1 dans cette série correspondent à nouveau étroitement aux niveaux de protéines précédemment publiés (Fig. 1d). En fait, les mesures SNP-ChIP semblent plus précises que l’analyse quantitative par western, qui n’a pas permis de résoudre la réduction attendue des niveaux de protéines entre les cellules RED1/red1ycs4S et RED1/red1Δ. Prises ensemble, ces données montrent que SNP-ChIP mesure avec précision les réductions de la liaison globale de Red1 sur une large gamme de niveaux de protéines cibles.
SNP-ChIP est robuste à la variation de la profondeur de séquençage et de la fraction de cellules spike-in
Nous avons utilisé plusieurs approches pour sonder la robustesse technique de SNP-ChIP. Les technologies de séquençage à haut débit produisent un nombre variable de lectures par échantillon, en fonction de facteurs tels que l’instrument de séquençage et le mutiplexage des échantillons. Pour modéliser l’effet d’une profondeur de séquençage plus faible sur la reproductibilité de l’analyse SNP-ChIP, nous avons sous-échantillonné les lectures des échantillons immunoprécipités et d’entrée des conditions de test de type sauvage et red1ycs4S à différentes profondeurs (allant de 1 à 10 millions de lectures). Le tracé de la taille du sous-échantillon en fonction du nombre de lectures alignées a montré une corrélation parfaitement linéaire pour tous les échantillons (Fig. 2a), ce qui indique qu’une large gamme de profondeurs de séquençage produira des informations quantitatives robustes par SNP-ChIP. Pour ces conditions de test particulières, la fraction de lectures correspondant à un génome spécifique, et donc conservée dans l’analyse, était d’environ 20 % pour le type sauvage et de 30 % pour le red1ycs4S. Nous avons calculé le facteur de normalisation du spike-in en utilisant toutes les 10 000 combinaisons possibles de sous-échantillons de lecture (10 sous-échantillons de lecture allant de 1 à 10 millions de lectures pour chacun des quatre échantillons séquencés : ChIP et échantillons d’entrée de type sauvage plus ChIP et échantillons d’entrée de red1ycs4S) et nous avons trouvé une distribution très serrée des résultats (0,2848 ± 0,0015, S.D. ; Fig. 2b). Cela établit que la profondeur de séquençage n’a pas besoin d’être équilibrée entre les échantillons immunoprécipités et les échantillons d’entrée, ou entre différentes conditions, pour produire des proportions exactes de lectures cartographiant les génomes de test et de spike-in.
Une autre condition qui peut affecter les résultats de SNP-ChIP est la quantité de matériel spike-in ajoutée aux échantillons. Les méthodes de normalisation du spike-in supposent une relation linéaire entre la quantité de matériel spike-in et la proportion résultante de lectures spike-in dans l’échantillon immunoprécipité. Cette condition est essentielle pour que les résultats soient indépendants de la quantité de matériel de piquage. Pour vérifier cette hypothèse, nous avons préparé des échantillons avec des proportions de cellules spike-in allant de 5 à 30%. Comme échantillons de test, nous avons utilisé le type sauvage et une souche avec une seule mutation du promoteur red1-pG162A qui phénotype l’allèle red1ycs4S. Alors que red1ycs4S contient une région génomique introgressée avec des dizaines de SNP entourant le locus RED1, le mutant red1-pG162A a été conçu pour ne porter que la mutation spécifique responsable de la réduction des niveaux de Red1. Comme le montre la figure 2c, la proportion de lectures de pointes dans les échantillons d’entrée (reflétant la quantité de matériel de pointes ajouté à l’échantillon testé) est en corrélation linéaire avec la proportion résultante de lectures de pointes dans l’échantillon immunoprécipité, tant pour le type sauvage que pour l’échantillon red1-pG162A. De plus, l’échantillon red1-pG162A a donné une quantité de Red1 très similaire à celle de l’allèle red1ycs4S (28,8 % contre 28,1 % du type sauvage, respectivement, en utilisant 20 % des cellules piégées), ce qui confirme la robustesse de la méthode. De faibles pourcentages de cellules spike-in (5 et 10 %) ont donné lieu à des estimations légèrement plus élevées de la quantité de Red1 (Fig. 2d), probablement en raison d’un bruit accru. Ces résultats suggèrent que des proportions de matériel spike-in de 15% et plus sont appropriées pour SNP-ChIP. Toutes les autres expériences présentées ici ont utilisé une proportion de spike-in de 20%.
Enfin, nous avons étudié l’impact de la méthode de calcul pour calculer le facteur de normalisation du spike-in. Le facteur de normalisation SNP-ChIP calculé dans les exemples présentés jusqu’à présent repose sur le nombre total de lectures alignées sur les génomes de test et de spike-in. Une méthode alternative consiste à calculer la valeur moyenne scalaire du score du pile-up des lectures alignées. Nous avons testé l’utilité de cette alternative en calculant le pileup score à (1) toutes les positions génomiques, (2) aux positions SNP seulement, ou (3) aux positions SNP tombant dans les pics de signaux appelés (voir section Méthodes). La dernière approche permet d’exclure les régions qui ne devraient contenir qu’un signal de fond, ainsi que les régions faussement négatives. Nous avons trouvé des valeurs très similaires et une grande concordance entre les quatre méthodes dans tous les cas (fichier supplémentaire 2 : figure S2a), bien que les empilements de lectures produisent systématiquement des valeurs légèrement inférieures à celles de la méthode de comptage des lectures (fichier supplémentaire 2 : figure S2b). Dans l’ensemble, cependant, la différence est relativement faible et nous pensons que la méthode basée sur le nombre de lectures, qui est beaucoup plus simple sur le plan informatique, représente une approximation appropriée, du moins pour les protéines largement distribuées.
Profils de liaison obtenus directement à partir d’expériences SNP-ChIP
La principale utilité de SNP-ChIP est la génération d’un facteur de normalisation qui permet de mettre à l’échelle les profils obtenus par des expériences ChIP-seq traditionnelles exécutées dans les mêmes conditions (figure 1c). Étant donné la large distribution des SNP dans les deux génomes analysés, nous avons exploré la possibilité que la SNP-ChIP puisse également produire directement des profils de liaison informatifs, même si cette application est clairement limitée par la densité de SNP disponible. La comparaison d’un échantillon séquencé avec spike-in aux données obtenues à l’aide d’un échantillon répliqué, non dopé, montre que les pistes de signal des échantillons dopés reflètent étroitement celles du contrôle non dopé, bien que certaines lacunes de signal puissent être observées dans l’échantillon dopé (fichier supplémentaire 3 : Figure S3a ; exemples indiqués par les flèches rouges). Ainsi, comme on pouvait s’y attendre, l’utilisation de pics de même espèce entraîne une certaine perte d’informations. Ce problème semble négligeable pour les pics larges, car les pics appelés présentent un accord très étroit (fichier supplémentaire 3 : figure S3b). Les pics étroits présentent plus de désaccords, avec seulement un tiers des pics appelés qui se chevauchent entre les deux échantillons. Ces données indiquent que SNP-ChIP peut également fournir des informations directes sur la distribution des protéines, en particulier pour les schémas de liaison à plus grande échelle.
Les niveaux globaux de Red1 sont réduits dans les mutants de cohésine et hop1∆
Nous avons cherché à appliquer SNP-ChIP pour étudier les situations de mutants qui provoquent une large redistribution des protéines. La redistribution est un défi pour les méthodes de quantification traditionnelles, telles que la ChIP-qPCR, car l’identification des régions qui restent non liées est non triviale. En l’absence de la sous-unité conservée de la cohésine Rec8, la distribution de Red1 le long du génome change de façon spectaculaire, montrant de grandes régions de déplétion alternant avec des grappes denses de liaison. Cependant, on ne sait pas encore si les niveaux de liaison globaux de Red1 changent chez les mutants rec8∆. Nous avons utilisé SNP-ChIP pour répondre à cette question et avons trouvé une diminution prononcée des niveaux de liaison globale de Red1 (Fig. 3a). La comparaison directe de l’occupation de Red1 le long de deux chromosomes exemples illustre à la fois la redistribution spectaculaire et la diminution globale de la liaison de Red1 par rapport au type sauvage (Fig. 3b). Ainsi, la cohésine Rec8 est essentielle pour l’enrichissement chromosomique complet de Red1.
Hop1 est une autre protéine importante de l’élément axial de la levure qui interagit physiquement avec Red1 . Les protéines de l’élément axial sont recrutées en plus grande quantité sur les petits chromosomes, mais en l’absence de Hop1, la liaison de Red1 devient moins dépendante de la taille du chromosome . Des travaux antérieurs utilisant une mise à l’échelle in silico ont suggéré que cette réduction résultait d’une augmentation sélective du recrutement de Red1 sur les grands chromosomes. Cette approche de mise à l’échelle, cependant, nécessite la définition de régions génomiques qui ne sont pas liées, ce qui est difficile à vérifier avec des protéines chromosomiques largement distribuées comme Red1. Nous avons donc réexaminé cette question en réalisant une SNP-ChIP de Red1 dans un mutant hop1Δ. La SNP-ChIP a reproduit l’affaiblissement du biais lié à la taille des chromosomes constaté précédemment. Cependant, le facteur de normalisation du spike-in a montré une diminution globale du recrutement de Red1 à 71,9 ± 4,2% de la quantité de Red1 de type sauvage (Fig. 3c, d). Cette diminution est plus forte sur les petits chromosomes (Fig. 3e). Nous notons qu’une perte légère de la liaison de Red1 n’entraîne généralement pas une perte du biais de la taille des chromosomes, car la délétion des histones méthyltransférases Set1 et Dot1 entraîne des réductions similaires d’environ 20 % des niveaux de recrutement globaux de Red1, mais n’affecte pas la distribution de la liaison de Red1 entre les chromosomes (fichier supplémentaire 4 : figure S4). Ces données suggèrent que la perte de Hop1 entraîne une réduction générale du signal Red1 sur tous les chromosomes qui affecte particulièrement les trois plus petits chromosomes.
Les niveaux deγ-H2AX ne changent pas dans les séries de souches dosées Red1
Pour tester si la SNP-ChIP permet également des analyses quantitatives des modifications protéiques, nous avons ciblé la phosphorylation de l’histone H2A sur la sérine 129 (γ-H2AX). Cette modification est rapidement induite après la formation de cassures double-brin (CDB) de l’ADN. Dans la levure mitotique, la modification γ-H2AX s’étend sur environ 50 kb de part et d’autre d’une cassure double-brin. En outre, la modification γ-H2AX constitutive est présente près des télomères tout au long du cycle cellulaire. Pour analyser la distribution et la dépendance de γ-H2AX vis-à-vis des DSB dans la méiose, nous avons effectué des SNP-ChIP dans une souche de type sauvage, ainsi que dans la série de dosage Red1, qui présente une légère (jusqu’à 30 %) réduction des niveaux de DSB , et un mutant spo11-Y135F, codant pour une protéine Spo11 catalytiquement morte, qui ne forme pas de DSB méiotiques .
La mesure des niveaux de γ-H2AX en méiose n’a révélé aucune différence entre le type sauvage et aucune des souches présentant des niveaux réduits de Red1, quelle que soit la méthode de calcul (figure 4a, b, c). Le signal uniforme le long des chromosomes est cohérent avec la propagation de la marque γ-H2AX à partir de tous les points chauds des DSB de levure, qui sont distribués dans l’ensemble du génome, et explique probablement pourquoi une légère réduction des niveaux de DSB ne conduit pas à une baisse notable du signal γ-H2AX global. Le contrôle spo11-Y135F, en revanche, ne présentait qu’environ 25 % des niveaux γ-H2AX du type sauvage. Le signal était nettement enrichi à proximité des télomères, les régions interstitielles ne présentant que de faibles signaux probablement associés à l’expression génique. Ces données montrent que le signal γ-H2AX constitutif associé aux télomères est également maintenu au cours de la prophase méiotique. De plus, la mise à l’échelle des pistes de signal indique que le signal γ-H2AX adjacent au télomère reste largement inchangé dans le mutant spo11-Y135F, ce qui est cohérent avec le fait que la formation de DSB méiotiques est presque indétectable dans ces régions. Ensemble, ces données montrent que SNP-ChIP permet des comparaisons quantitatives entre les expériences ChIP-seq indépendamment de l’antigène et fournit donc une méthode polyvalente pour mesurer les associations chromatiniennes globales sans avoir besoin de tags d’épitopes.
.