- Eksperimentelt rationale for SNP-ChIP
- SNP-ChIP af et hurtigt udviklende kromosomalt protein
- SNP-ChIP er robust over for variation i sekventeringsdybde og fraktion af spike-in-celler
- Bindingsprofiler opnået direkte fra SNP-ChIP-eksperimenter
- Globale Red1-niveauer er reduceret i cohesin- og hop1∆-mutanter
- γ-H2AX-niveauer ændres ikke i Red1-doseringsstamserier
Eksperimentelt rationale for SNP-ChIP
Den grundlæggende præmis for SNP-ChIP er, at celler fra samme art kan tjene som spike-in-materiale, forudsat at de har tilstrækkelig genetisk diversitet, primært i form af enkelt-nucleotid-polymorfismer (SNP’er). Signalet ved hver polymorfi giver et uafhængigt mål for forholdet mellem testprøve/spike-in-forholdet, der sammen giver mulighed for beregning af en normaliseringsfaktor og passende skalering af ChIP-seq-resultater (Fig. 1a). Hvis der er tilstrækkelig genetisk diversitet til, at en stor del af sekventeringslæsningerne kan tildeles de oprindelige genomer, giver SNP-ChIP desuden mulighed for at generere genomdækkende målfordelingsprofiler. Det er vigtigt, at SNP-ChIP, fordi SNP-ChIP bruger den samme art som kilden til spike-in-materialet, vil fungere med stort set ethvert mål i organismens proteom, herunder posttranslationelle modifikationer, forudsat at et antistof af ChIP-kvalitet er tilgængeligt.
SNP-ChIP af et hurtigt udviklende kromosomalt protein
For at teste nytten af intra-species spike-ins vendte vi os til kromatinanalyser i gær. Vi fokuserede specifikt på kromosomer i meiose, fordi denne proces involverer mange bredt distribuerede kromosomale proteiner og posttranslationelle modifikationer. Et typisk eksempel er det aksiale elementprotein Red1, som spiller vigtige roller i meiotisk rekombination. Red1 er bredt bundet langs kromosomerne, men ligesom andre meiotiske faktorer er dets sekvens divergeret, selv hos nært beslægtede arter . Som mange andre proteiner kan Red1 desuden ikke let mærkes uden at forstyrre proteinfunktionen . Disse egenskaber betyder, at Red1 ikke er egnet til standard spike-in-tilgange, hvilket gør det til et særligt velegnet mål for SNP-ChIP. Desuden er mutationer, der ændrer de samlede niveauer og den kromosomale fordeling af Red1, tilgængelige , hvilket giver benchmarks til evaluering af SNP-ChIP’s effektivitet.
SNP-ChIP af Red1 blev udført ved hjælp af den genetiske baggrund SK1 som teststamme og en meiosis-optimeret variant af den almindeligt anvendte S288c-referencestamme som spike-in . For begge genetiske baggrunde er der tilgængelige end-to-end-genomsamlinger af høj kvalitet . Disse samlinger adskiller sig fra hinanden med ca. 76.000 SNP’er, der er placeret med en samlet medianafstand på 70 bp (Yderligere fil 1: Figur S1a) konsekvent på tværs af alle kromosomer (Yderligere fil 1: Figur S1b), hvilket udgør tilstrækkelig variation til at muliggøre en entydig tildeling af en stor del af sekventeringslæsninger. For at udføre SNP-ChIP blev testceller (SK1) blandet med en konstant fraktion af meiotiske spike-in-celler (S288c), før blandingerne blev underkastet en standard ChIP-seq-protokol. De genererede læsninger blev justeret til et hybridgenom, der blev bygget ved at sammenkæde genomsamlinger af test- og spike-in-genomerne. Læserne blev justeret med perfekte matchbetingelser, idet alle læserne blev udelukket fra at blive justeret til mere end ét sted. Følgelig blev alle læs, der overlappede mindst én SNP, tildelt et specifikt genom og genomisk placering, mens læs, der ikke overlappede en polymorfisme, blev kortlagt til begge genomer og blev således kasseret.
Vi undersøgte oprindeligt SNP-ChIP’s evne til at detektere ændringer i kromatinassociation som følge af reduceret proteinproduktion. Red1ycs4S-allelen er forårsaget af en mutation i promotoren af RED1, der fører til en reduktion af Red1-niveauerne til omkring 20-25% af vildtypen og et næsten fuldstændigt tab af cytologisk observerbare aksiale elementer . Det er vigtigt, at traditionel ChIP-seq-analyse ikke var i stand til at detektere denne ændring i proteinoverflod og producerede uadskillelige Red1-profiler mellem vild type og red1ycs4S-mutanter . I modsætning hertil, da vi anvendte SNP-ChIP til at sammenligne disse to stammer, var de reducerede Red1-bindingsniveauer let synlige (Fig. 1b). Beregning af en spike-in-normaliseringsfaktor baseret på den relative overflod af total prøve og spike-in-reads gav et Red1-niveau i red1ycs4S-mutanten på 28.8 ± 5.1% (S.D.) af den vilde type, hvilket nøje matcher den rapporterede ændring i Red1-niveauer opnået fra vestlig analyse . Denne normaliseringsfaktor tillod passende signalskalering af ChIP-seq-profiler for de to betingelser (Fig. 1c).
SNP-ChIP blev yderligere valideret ved at anvende den på en Red1-doseringsserie, som består af forskellige kombinationer af RED1-alleler (RED1, red1ycs4S, red1Δ), der giver et trinvist fald i Red1-niveauer (Fig. 1d) . SNP-ChIP-målinger af Red1-kromatinassociation i denne serie matchede igen tæt med tidligere offentliggjorte proteinniveauer (Fig. 1d). Faktisk syntes SNP-ChIP-målinger mere nøjagtige end kvantitativ vestlig analyse, som ikke kunne opløse den forventede reduktion i proteinniveauer mellem RED1/red1ycs4S og RED1/red1Δ-celler . Samlet set viser disse data, at SNP-ChIP nøjagtigt måler reduktioner i global Red1-binding over et bredt spektrum af målproteinniveauer.
SNP-ChIP er robust over for variation i sekventeringsdybde og fraktion af spike-in-celler
Vi brugte flere tilgange til at undersøge den tekniske robusthed af SNP-ChIP. Højhastigheds-sekventeringsteknologier producerer et varierende antal læsninger pr. prøve, afhængigt af faktorer som sekventeringsinstrument og mutiplexing af prøven. For at modellere effekten af lavere sekventeringsdybde på reproducerbarheden af SNP-ChIP-analysen underprøvetagede vi reads af de immunoprecipiterede og inputprøver fra wild type og red1ycs4S-testbetingelser til forskellige dybder (fra 1 til 10 millioner reads). Plottet af delprøvestørrelse mod antallet af alignede reads viste en perfekt lineær korrelation for alle prøver (Fig. 2a), hvilket indikerer, at et bredt spektrum af sekventeringsdybder vil give robuste kvantitative oplysninger ved SNP-ChIP. For disse særlige testbetingelser var brøkdelen af læsninger, der mappede til et specifikt genom, og som således blev bevaret i analysen, omkring 20% for vildtypen og 30% for red1ycs4S. Vi beregnede spike-in-normaliseringsfaktoren ved hjælp af alle 10.000 mulige kombinationer af read-underprøver (10 read-underprøver, der varierer fra 1 til 10 millioner reads for hver af fire sekventerede prøver: wild type ChIP og inputprøver plus red1ycs4S ChIP og inputprøver) og fandt en meget stram fordeling af resultaterne (0,2848 ± 0,0015, S.D.; Fig. 2b). Dette fastslår, at sekventeringsdybden ikke behøver at være afbalanceret mellem immunoprecipiterede og inputprøver eller mellem forskellige betingelser for at producere nøjagtige proportioner af læsninger, der kortlægger til testgenomet og spike-in-genomet.
En anden betingelse, der kan påvirke resultaterne af SNP-ChIP, er mængden af spike-in-materiale, der er tilsat prøverne. Spike-in-normaliseringsmetoder forudsætter et lineært forhold mellem mængden af spike-in-materiale og den resulterende andel af spike-in-reads i den immunoprecipiterede prøve. Denne betingelse er afgørende for, at resultaterne er uafhængige af mængden af spike-in-materiale. For at verificere denne antagelse fremstillede vi prøver med spike-in-celleandele, der varierede fra 5 til 30 %. Som testprøver brugte vi vildtype og en stamme med en enkelt red1-pG162A-promotermutation, der fænokopierer red1ycs4S-allelen. Mens red1ycs4S indeholder en introgresseret genomisk region med snesevis af SNP’er omkring RED1-lokussen, blev red1-pG162A-mutanten konstrueret til kun at bære den specifikke mutation, der er ansvarlig for reduktionen i Red1-niveauerne . Som vist i Fig. 2c korrelerer andelen af spike-in-reads i inputprøverne (som afspejler mængden af spike-in-materiale, der er tilsat til testprøven) lineært med den resulterende andel af spike-in-reads i den immunoprecipiterede prøve, både for vildtypen og red1-pG162A-prøven. Desuden gav red1-pG162A-prøven en meget lignende Red1-mængde som red1ycs4S-allelen (henholdsvis 28,8 % mod 28,1 % af vildtypen, når der anvendes 20 % spike-in-celler), hvilket yderligere understøtter metodens robusthed. Lave procentdele af spike-in-celler (5 og 10%) resulterede i noget øgede estimater af Red1-mængden (Fig. 2d), sandsynligvis på grund af øget støj. Disse resultater tyder på, at spike-in materialeprocenter på 15 % og højere er passende til SNP-ChIP. Alle andre eksperimenter, der er vist her, anvendte en spike-in-proportion på 20%.
Slutteligt undersøgte vi virkningen af beregningsmetoden til beregning af spike-in-normaliseringsfaktoren. SNP-ChIP-normaliseringsfaktoren, der er beregnet i de hidtil viste eksempler, er baseret på det samlede antal læsninger, der er afstemt efter testgenomet og spike-in-genomet. En alternativ metode er at beregne den skalariske middelværdi af den justerede læsningspileup-score. Vi testede nytten af dette alternativ ved at beregne pileup-score ved (1) alle genomiske positioner, (2) kun ved SNP-positioner eller (3) ved SNP-positioner, der falder inden for de såkaldte signaltoppe (se afsnittet Metoder). Den sidste fremgangsmåde vil effektivt udelukke regioner, der kun forventes at indeholde baggrundssignal, sammen med eventuelle falsk negative regioner. Vi fandt meget ens værdier og høj overensstemmelse mellem alle fire metoder i alle tilfælde (Yderligere fil 2: Figur S2a), selv om read pileups konsekvent giver lidt lavere værdier end read count-metoden (Yderligere fil 2: Figur S2b). Samlet set er forskellen dog relativt lille, og vi mener, at den læsetællingsbaserede metode, som er beregningsmæssigt meget enklere, repræsenterer en passende tilnærmelse, i det mindste for bredt distribuerede proteiner.
Bindingsprofiler opnået direkte fra SNP-ChIP-eksperimenter
Den primære nytte af SNP-ChIP er genereringen af en normaliseringsfaktor, der gør det muligt at skalere profiler opnået ved traditionelle ChIP-seq-eksperimenter udført under de samme betingelser (Fig. 1c). I betragtning af den brede fordeling af SNP’er på tværs af de to analyserede genomer udforskede vi muligheden for, at SNP-ChIP også direkte kunne give informative bindingsprofiler, selv om denne anvendelse klart er begrænset af den tilgængelige SNP-tæthed. Sammenligning af en prøve sekventeret med spike-in med data opnået ved hjælp af en replikat, ikke-spiked prøve viser, at signalsporene i spikede prøver nøje afspejler dem i den ikke-spikede kontrol, selv om der kan ses nogle signalløfter i den spikede prøve (Additional file 3: Figur S3a; eksempler angivet med de røde pile). Som forventet medfører brugen af spike-in af samme art således som forventet et vist tab af information. Dette problem synes at være ubetydeligt for brede toppe, da de såkaldte toppe viser en meget tæt overensstemmelse (Yderligere fil 3: Figur S3b). Smalle toppe viser større uoverensstemmelse, idet kun omkring en tredjedel af de kaldte toppe overlapper mellem de to prøver. Disse data indikerer, at SNP-ChIP også kan give direkte information om proteinfordeling, især for bindingsmønstre i større skala.
Globale Red1-niveauer er reduceret i cohesin- og hop1∆-mutanter
Vi søgte at anvende SNP-ChIP til at undersøge mutantsituationer, der forårsager en bred proteinomfordeling. Omfordeling er en udfordring for traditionelle kvantificeringsmetoder, såsom ChIP-qPCR, fordi identifikation af regioner, der forbliver ubundne, er ikke triviel. I fravær af den konserverede cohesinunderenhed Rec8 ændres Red1-fordelingen langs genomet dramatisk, idet der vises store regioner med udtømning, der veksler med tætte klynger af binding . Det er dog stadig uklart, om de samlede bindingsniveauer af Red1 ændres i rec8∆-mutanter. Vi anvendte SNP-ChIP til at løse dette spørgsmål og fandt et udtalt fald i de samlede Red1-bindingsniveauer (Fig. 3a). Direkte sammenligning af Red1-belægning langs to eksempelkromosomer illustrerer både den dramatiske omfordeling og det samlede fald i Red1-binding i forhold til vild type (Fig. 3b). Rec8-kohesin er således afgørende for den fulde kromosomale berigelse af Red1.
Hop1 er et andet vigtigt protein i det aksiale element i gær, som fysisk interagerer med Red1 . Axialelementproteiner rekrutteres i større mængder til små kromosomer, men i fravær af Hop1 bliver Red1-binding mindre afhængig af kromosomstørrelse . Tidligere arbejde ved hjælp af in silico skalering , foreslog, at denne reduktion skyldes en selektiv stigning i Red1 rekruttering til store kromosomer . Denne skaleringsmetode kræver imidlertid en definition af genomiske regioner, der ikke er bundet, hvilket er vanskeligt at fastslå med bredt distribuerede kromosomale proteiner som Red1. Derfor genundersøgte vi dette spørgsmål ved at udføre SNP-ChIP af Red1 i en hop1Δ-mutant. SNP-ChIP reproducerede den tidligere fundne svækkelse af kromosomstørrelsesbias. Spike-in-normaliseringsfaktoren viste imidlertid et samlet fald i Red1-rekruttering til 71,9 ± 4,2 % af Red1-mængden fra vildtypen (Fig. 3c, d). Dette fald er stærkere på små kromosomer (fig. 3e). Vi bemærker, at et mildt tab af Red1-binding generelt ikke resulterer i et tab af kromosomstørrelsesbias, fordi deletion af histonmethyltransferaserne Set1 og Dot1 forårsager lignende ~ 20% reduktioner af de samlede Red1-rekrutteringsniveauer, men påvirker ikke fordelingen af Red1-binding blandt kromosomer (Additional file 4: Figur S4). Disse data tyder på, at tab af Hop1 fører til en generel reduktion af Red1-signalet på tværs af alle kromosomer, der især påvirker de tre mindste kromosomer.
γ-H2AX-niveauer ændres ikke i Red1-doseringsstamserier
For at teste, om SNP-ChIP også tillader kvantitative analyser af proteinmodifikationer, målrettede vi fosforylering af histon H2A på serin 129 (γ-H2AX). Denne modifikation induceres hurtigt efter dannelsen af DNA-dobbeltstrengsbrud (DSB’er) . I mitotisk gær spreder γ-H2AX-modifikationen sig omkring 50 kb på hver side af et DSB . Desuden findes konstitutiv γ-H2AX i nærheden af telomerer i hele cellecyklusen . For at analysere fordelingen og DSB-afhængigheden af γ-H2AX i meiose udførte vi SNP-ChIP i en vildtypestamme samt Red1-doseringsrækken, som viser en mild (op til 30%) reduktion i DSB-niveauer , og en spo11-Y135F-mutant, der koder for et katalytisk dødt Spo11-protein, som ikke danner meiotiske DSB’er .
Måling af γ-H2AX-niveauer i meiose afslørede ingen forskel mellem vildtype og nogen af stammerne med reducerede Red1-niveauer, uanset beregningsmetode (Fig. 4a, b, c). Det ensartede signal langs kromosomer er i overensstemmelse med spredningen af γ-H2AX-mærket fra alle gær DSB-hotspots, som er fordelt over hele genomet, og forklarer sandsynligvis, hvorfor en let reduktion i DSB-niveauerne ikke fører til et mærkbart fald i det globale γ-H2AX-signal. spo11-Y135F-kontrollen viste på den anden side kun ca. 25 % af vildtypens γ-H2AX-niveauer. Signalet var markant beriget ved siden af telomerer, idet de interstitielle regioner kun viste svage signaler, der sandsynligvis var forbundet med genekspression . Disse data viser, at det konstitutive telomer-associerede γ-H2AX-signal også opretholdes i meiotisk profase. Desuden viser skalering af signalspor, at det telomertilknyttede γ-H2AX-signal forbliver stort set uændret i spo11-Y135F-mutanten, hvilket er i overensstemmelse med det faktum, at meiotisk DSB-dannelse næsten ikke kan påvises i disse regioner . Tilsammen viser disse data, at SNP-ChIP muliggør kvantitative sammenligninger mellem ChIP-seq-eksperimenter uanset antigenet og dermed giver en alsidig metode til måling af globale kromatinassociationer uden behov for epitoptags.