- Ragionamento sperimentale di SNP-ChIP
- SNP-ChIP di una proteina cromosomica in rapida evoluzione
- SNP-ChIP è robusto alla variazione della profondità di sequenziamento e della frazione di cellule spike-in
- Profili di legame ottenuti direttamente dagli esperimenti SNP-ChIP
- I livelli globali di Red1 sono ridotti nei mutanti di coesina e hop1∆
- I livelli di γ-H2AX non cambiano nella serie di ceppi di dosaggio Red1
Ragionamento sperimentale di SNP-ChIP
La premessa di base di SNP-ChIP è che le cellule della stessa specie possono servire come materiale spike-in purché ospitino sufficiente diversità genetica, principalmente sotto forma di polimorfismi a singolo nucleotide (SNPs). Il segnale ad ogni polimorfismo fornisce una misura indipendente di test-campione / spike-in rapporto che insieme permette il calcolo di un fattore di normalizzazione e scala appropriata di ChIP-seq risultati (Fig. 1a). Se c’è una diversità genetica sufficiente per consentire una grande frazione di sequenziamento legge per essere assegnato ai genomi di origine, SNP-ChIP permette inoltre la generazione di profili di distribuzione genoma-wide target. Inoltre, poiché SNP-ChIP utilizza la stessa specie come fonte del materiale spike-in, funzionerà praticamente con qualsiasi bersaglio nel proteoma dell’organismo, comprese le modifiche post-traslazionali, purché sia disponibile un anticorpo di grado ChIP.
SNP-ChIP di una proteina cromosomica in rapida evoluzione
Per verificare l’utilità di intra-specie spike-in, ci siamo rivolti alle analisi della cromatina in lievito. Ci siamo concentrati in particolare sui cromosomi nella meiosi perché questo processo coinvolge molte proteine cromosomiche ampiamente distribuite e modifiche post-traslazionali. Un esempio tipico è la proteina Red1 dell’elemento assiale, che svolge un ruolo importante nella ricombinazione meiotica. Red1 è ampiamente legato lungo i cromosomi ma, come altri fattori meiotici, la sua sequenza si è differenziata anche in specie strettamente correlate. Inoltre, come molte proteine, Red1 non può essere facilmente etichettato senza interrompere la funzione della proteina. Questi attributi significano che Red1 non è suscettibile di approcci standard di spike-in, rendendolo un obiettivo particolarmente adatto per SNP-ChIP. Inoltre, le mutazioni che cambiano i livelli complessivi e la distribuzione cromosomica di Red1 sono disponibili, fornendo punti di riferimento per valutare l’efficacia di SNP-ChIP.
SNP-ChIP di Red1 è stato eseguito utilizzando il background genetico SK1 come ceppo di prova e una variante ottimizzata per la meiosi del ceppo di riferimento S288c ampiamente utilizzato come spike-in. Per entrambi gli sfondi genetici, sono disponibili assemblaggi del genoma end-to-end di alta qualità. Questi assemblaggi differiscono di circa 76.000 SNPs, distanziati ad una distanza mediana complessiva di 70 bp (Additional file 1: Figura S1a) in modo coerente attraverso tutti i cromosomi (Additional file 1: Figura S1b), che costituisce una variazione sufficiente per consentire l’assegnazione univoca di una gran parte delle letture di sequenziamento. Per eseguire SNP-ChIP, cellule di prova (SK1) sono stati mescolati con una frazione costante di meiotica spike-in cellule (S288c) prima di sottoporre le miscele di un protocollo standard ChIP-seq. Le letture generate sono state allineate a un genoma ibrido costruito concatenando le assemblee del genoma del test e spike-in genomi. Le letture sono state allineate con condizioni di corrispondenza perfetta, escludendo qualsiasi legge che si allinea a più di una posizione. Di conseguenza, tutte le letture che si sovrappongono ad almeno uno SNP sono state assegnate a uno specifico genoma e posizione genomica, mentre le letture che non si sovrappongono a un polimorfismo sono state mappate a entrambi i genomi e quindi scartate.
All’inizio abbiamo studiato la capacità di SNP-ChIP di rilevare i cambiamenti nell’associazione della cromatina derivanti dalla ridotta produzione di proteine. L’allele red1ycs4S è causato da una mutazione nel promotore di RED1 che porta ad una riduzione dei livelli di Red1 a circa il 20-25% del wild type e una perdita quasi completa di elementi assiali citologicamente osservabili. È importante notare che l’analisi ChIP-seq tradizionale non è stata in grado di rilevare questo cambiamento nell’abbondanza della proteina e ha prodotto profili Red1 indistinguibili tra il tipo selvaggio e i mutanti red1ycs4S. Al contrario, quando abbiamo applicato SNP-ChIP per confrontare questi due ceppi, i ridotti livelli di legame Red1 erano facilmente evidenti (Fig. 1b). Calcolo di un fattore di normalizzazione spike-in basato sull’abbondanza relativa del campione totale e spike-in legge prodotto un livello Red1 nel mutante red1ycs4S del 28,8 ± 5,1% (S.D.) del tipo selvatico, strettamente corrispondente al cambiamento riportato nei livelli Red1 ottenuti da analisi occidentale. Questo fattore di normalizzazione ha permesso di scalare il segnale appropriato dei profili ChIP-seq per le due condizioni (Fig. 1c).
SNP-ChIP è stato ulteriormente convalidato applicandolo a una serie di dosaggio Red1, che consiste di diverse combinazioni di alleli RED1 (RED1, red1ycs4S, red1Δ) producendo una diminuzione graduale dei livelli Red1 (Fig. 1d). SNP-ChIP misurazioni di associazione cromatina Red1 in questa serie ancora una volta strettamente abbinato livelli di proteine precedentemente pubblicati (Fig. 1d). Infatti, le misure SNP-ChIP sono apparse più accurate dell’analisi quantitativa occidentale, che non è riuscita a risolvere la prevista riduzione dei livelli proteici tra RED1/red1ycs4S e RED1/red1Δ cellule. Nel complesso, questi dati dimostrano che SNP-ChIP misura accuratamente le riduzioni nel legame globale di Red1 su una vasta gamma di livelli di proteine bersaglio.
SNP-ChIP è robusto alla variazione della profondità di sequenziamento e della frazione di cellule spike-in
Abbiamo usato diversi approcci per sondare la robustezza tecnica di SNP-ChIP. Le tecnologie di sequenziamento ad alta velocità producono un numero variabile di letture per campione, a seconda di fattori come lo strumento di sequenziamento e il mutiplexing del campione. Per modellare l’effetto di una minore profondità di sequenziamento sulla riproducibilità dell’analisi SNP-ChIP, abbiamo sottocampionato le letture dei campioni immunoprecipitati e di ingresso da condizioni di prova wild type e red1ycs4S a diverse profondità (che vanno da 1 a 10 milioni di letture). Tracciare la dimensione del sottocampione contro il numero di letture allineate ha mostrato una correlazione perfettamente lineare per tutti i campioni (Fig. 2a), indicando che una vasta gamma di profondità di sequenziamento produrrà robuste informazioni quantitative da SNP-ChIP. Per queste particolari condizioni di prova, la frazione di letture di mappatura a un genoma specifico, e quindi mantenuto nell’analisi, era circa il 20% per il tipo selvaggio e il 30% per il red1ycs4S. Abbiamo calcolato il fattore di normalizzazione spike-in utilizzando tutte le 10.000 possibili combinazioni di sottocampioni di lettura (10 sottocampioni di lettura che vanno da 1 a 10 milioni di letture per ciascuno dei quattro campioni sequenziati: wild type ChIP e campioni di ingresso più red1ycs4S ChIP e campioni di ingresso) e trovato una distribuzione molto stretta dei risultati (0,2848 ± 0,0015, S.D.; Fig. 2b). Questo stabilisce che la profondità di sequenziamento non ha bisogno di essere bilanciato tra immunoprecipitati e campioni di ingresso, o tra diverse condizioni, per produrre proporzioni accurate di legge mappatura al test e il spike-in genomi.
Un’altra condizione che può influenzare i risultati di SNP-ChIP è la quantità di materiale spike-in aggiunto ai campioni. I metodi di normalizzazione spike-in presuppongono una relazione lineare tra la quantità di materiale spike-in e la proporzione risultante di letture spike-in nel campione immunoprecipitato. Questa condizione è essenziale perché i risultati siano indipendenti dalla quantità di materiale spike-in. Per verificare questa ipotesi, abbiamo preparato campioni con proporzioni di cellule spike-in che vanno dal 5 al 30%. Come campioni di prova abbiamo usato wild type e un ceppo con una singola mutazione del promotore red1-pG162A che fenocopia l’allele red1ycs4S. Mentre red1ycs4S contiene una regione genomica introgressiva con dozzine di SNPs che circondano il locus RED1, il mutante red1-pG162A è stato ingegnerizzato per portare solo la mutazione specifica responsabile della riduzione dei livelli di Red1. Come mostrato in Fig. 2c, la proporzione di spike-in legge nei campioni di input (che riflette la quantità di spike-in materiale aggiunto al campione di prova) si correla linearmente con la proporzione risultante di spike-in legge nel campione immunoprecipitato, sia per il tipo selvatico e il red1-pG162A campione. Inoltre, il campione red1-pG162A ha prodotto una quantità molto simile Red1 all’allele red1ycs4S (28,8% contro 28,1% del tipo selvatico, rispettivamente, quando si utilizza il 20% delle cellule spike-in), sostenendo ulteriormente la robustezza del metodo. Basso spike-in percentuali di cellule (5 e 10%) ha portato a stime un po ‘aumentato della quantità Red1 (Fig. 2d), probabilmente a causa di un aumento del rumore. Questi risultati suggeriscono che spike-in proporzioni di materiale del 15% e superiori sono appropriati per SNP-ChIP. Tutti gli altri esperimenti mostrati qui usato un spike-in proporzione del 20%.
Infine, abbiamo studiato l’impatto del metodo di calcolo per calcolare il fattore di normalizzazione spike-in. Il fattore di normalizzazione SNP-ChIP calcolato negli esempi mostrati finora si basa sul numero totale di letture allineate al test e ai genomi spike-in. Un metodo alternativo è quello di calcolare il valore medio scalare del punteggio di accumulo delle letture allineate. Abbiamo testato l’utilità di questa alternativa calcolando il punteggio pileup in (1) tutte le posizioni genomiche, (2) solo nelle posizioni SNP, o (3) nelle posizioni SNP che cadono all’interno dei picchi di segnale chiamati (vedi sezione Metodi). L’ultimo approccio escluderà efficacemente le regioni che si ritiene tengano solo il segnale di fondo, insieme a qualsiasi regione falsamente negativa. Abbiamo trovato valori molto simili e un’alta concordanza tra tutti e quattro i metodi in tutti i casi (file aggiuntivo 2: Figura S2a), anche se le pile di lettura producono costantemente valori leggermente inferiori al metodo di conteggio della lettura (file aggiuntivo 2: Figura S2b). Nel complesso, tuttavia, la differenza è relativamente piccola e crediamo che il metodo basato sul conteggio delle letture, che è computazionalmente molto più semplice, rappresenti un’approssimazione appropriata, almeno per le proteine ampiamente distribuite.
Profili di legame ottenuti direttamente dagli esperimenti SNP-ChIP
L’utilità primaria di SNP-ChIP è la generazione di un fattore di normalizzazione che permette la scalatura dei profili ottenuti da esperimenti ChIP-seq tradizionali eseguiti nelle stesse condizioni (Fig. 1c). Data l’ampia distribuzione di SNPs attraverso i due genomi analizzati, abbiamo esplorato la possibilità che SNP-ChIP potrebbe anche direttamente produrre profili di legame informativo, anche se questa applicazione è chiaramente limitata dalla densità SNP disponibile. Confrontando un campione sequenziato con spike-in ai dati ottenuti utilizzando una replica, campione non-spiked mostra che le tracce di segnale di campioni spiked strettamente rispecchiano quelli del controllo non-spiked, anche se alcuni vuoti di segnale può essere visto nel campione spiked (file aggiuntivo 3: Figura S3a; esempi indicati dalle frecce rosse). Così, come previsto, l’uso della stessa specie spike-in provoca una certa perdita di informazioni. Questo problema sembra trascurabile per i picchi ampi, come chiamato picchi mostrano un accordo molto vicino (Additional file 3: Figura S3b). I picchi stretti mostrano più disaccordo, con solo circa un terzo dei picchi chiamati che si sovrappongono tra i due campioni. Questi dati indicano che SNP-ChIP può anche fornire informazioni dirette sulla distribuzione della proteina, in particolare per i modelli di legame su larga scala.
I livelli globali di Red1 sono ridotti nei mutanti di coesina e hop1∆
Abbiamo cercato di applicare SNP-ChIP per indagare situazioni di mutanti che causano un’ampia ridistribuzione delle proteine. La ridistribuzione è una sfida per i metodi tradizionali di quantificazione, come ChIP-qPCR, perché identificare le regioni che rimangono non legate non è banale. In assenza della subunità di coesina conservata Rec8, la distribuzione di Red1 lungo il genoma cambia drammaticamente, mostrando grandi regioni di esaurimento alternate a densi gruppi di legame. Se i livelli complessivi di legame di Red1 cambiano nei mutanti Rec8∆, tuttavia, rimane poco chiaro. Abbiamo impiegato SNP-ChIP per affrontare questa domanda e trovato una marcata diminuzione dei livelli complessivi di legame Red1 (Fig. 3a). Confronto diretto di occupazione Red1 lungo due cromosomi esempio illustra sia la ridistribuzione drammatica e la diminuzione complessiva del legame Red1 rispetto al tipo selvatico (Fig. 3b). Così, Rec8-coesina è essenziale per l’arricchimento cromosomico completo di Red1.
Hop1 è un’altra importante proteina dell’elemento assiale del lievito che interagisce fisicamente con Red1 . Le proteine dell’elemento assiale sono reclutate in quantità maggiori nei cromosomi piccoli, ma in assenza di Hop1, il legame di Red1 diventa meno dipendente dalle dimensioni del cromosoma. Il lavoro precedente utilizzando in silico scaling, ha suggerito che questa riduzione è derivata da un aumento selettivo del reclutamento di Red1 ai grandi cromosomi. Questo approccio di scaling, tuttavia, richiede la definizione di regioni genomiche che non sono legate, che è difficile da accertare con proteine cromosomiche ampiamente distribuite come Red1. Pertanto, abbiamo indagato nuovamente questa domanda eseguendo SNP-ChIP di Red1 in un mutante hop1Δ. SNP-ChIP ha riprodotto l’indebolimento precedentemente trovato di bias di dimensione del cromosoma. Tuttavia, il fattore di normalizzazione spike-in ha mostrato una diminuzione complessiva del reclutamento Red1 al 71,9 ± 4,2% della quantità di Red1 di tipo selvatico (Fig. 3c, d). Questa diminuzione è più forte sui piccoli cromosomi (Fig. 3e). Notiamo che la perdita lieve di Red1 legame non si traduce generalmente in una perdita di cromosoma dimensioni bias, perché la delezione del metiltransferasi istone Set1 e Dot1 cause simili ~ 20% riduzioni dei livelli di reclutamento Red1 complessivo, ma non influenza la distribuzione del legame Red1 tra i cromosomi (file aggiuntivo 4: Figura S4). Questi dati suggeriscono che la perdita di Hop1 porta ad una riduzione generale del segnale Red1 in tutti i cromosomi che colpisce in particolare i tre cromosomi più piccoli.
I livelli di γ-H2AX non cambiano nella serie di ceppi di dosaggio Red1
Per verificare se SNP-ChIP permette anche analisi quantitative delle modifiche delle proteine, abbiamo mirato la fosforilazione dell’istone H2A sulla serina 129 (γ-H2AX). Questa modifica è rapidamente indotta in seguito alla formazione di rotture del doppio filamento di DNA (DSB). Nel lievito mitotico, la modifica γ-H2AX si diffonde circa 50 kb su entrambi i lati di un DSB. Inoltre, γ-H2AX costitutivo si trova vicino ai telomeri durante tutto il ciclo cellulare. Per analizzare la distribuzione e la dipendenza da DSB di γ-H2AX in meiosi, abbiamo eseguito SNP-ChIP in un ceppo wild type, così come la serie di dosaggio Red1, che mostra una lieve (fino al 30%) riduzione dei livelli di DSB, e un mutante spo11-Y135F, che codifica una proteina Spo11 cataliticamente morta, che non forma DSB meiotici.
Misurare i livelli di γ-H2AX in meiosi non ha rivelato alcuna differenza tra il tipo selvaggio e nessuno dei ceppi con ridotti livelli di Red1, indipendentemente dal metodo di calcolo (Fig. 4a, b, c). Il segnale uniforme lungo i cromosomi è coerente con la diffusione del marchio γ-H2AX da tutti gli hotspot DSB del lievito, che sono distribuiti in tutto il genoma, e probabilmente spiega perché una lieve riduzione dei livelli DSB non porta ad un calo notevole del segnale γ-H2AX globale. Il controllo spo11-Y135F, d’altra parte, ha mostrato solo circa il 25% dei livelli di γ-H2AX del tipo selvaggio. Il segnale era marcatamente arricchito vicino ai telomeri, con le regioni interstiziali che mostravano solo deboli segnali probabilmente associati all’espressione genica. Questi dati dimostrano che il segnale di γ-H2AX costitutivo associato ai telomeri è mantenuto anche nella meiotica prophase. Inoltre, il ridimensionamento delle tracce del segnale indica che il segnale γ-H2AX adiacente al telomero rimane in gran parte invariato nel mutante spo11-Y135F, coerente con il fatto che la formazione di DSB meiotica è quasi impercettibile in queste regioni. Insieme, questi dati dimostrano che SNP-ChIP permette confronti quantitativi tra gli esperimenti ChIP-seq indipendentemente dall’antigene e quindi fornisce un metodo versatile per misurare le associazioni globali della cromatina senza la necessità di tag epitopo.