SNP-ChIP: a versatile and tag-free method to quantify changes in protein binding across the genome

Raționamente experimentale ale SNP-ChIP

Principiul de bază al SNP-ChIP este că celulele din aceeași specie pot servi ca material pentru spike-in, cu condiția ca acestea să adăpostească o diversitate genetică suficientă, în principal sub formă de polimorfisme de un singur nucleotid (SNP). Semnalul la fiecare polimorfism oferă o măsură independentă a raportului eșantion de testare/spike-in care, împreună, permite calcularea unui factor de normalizare și scalarea corespunzătoare a rezultatelor ChIP-seq (Fig. 1a). În cazul în care există suficientă diversitate genetică pentru a permite ca o fracțiune mare de citiri de secvențiere să fie atribuite genomurilor de origine, SNP-ChIP permite, în plus, generarea de profiluri de distribuție a țintelor la nivelul întregului genom. Este important de menționat faptul că, deoarece SNP-ChIP utilizează aceeași specie ca sursă a materialului spike-in, va funcționa cu aproape orice țintă din proteomul organismului, inclusiv modificările posttraducționale, cu condiția să fie disponibil un anticorp de calitate ChIP.

Fig. 1

SNP-ChIP adaugă la ChIP-seq-ul tradițional capacitatea de a măsura cantități semicantitative de proteine țintă. a Etapele principale ale SNP-ChIP exemplificate pentru două condiții ipotetice. b Nivelurile de proteină țintă Red1 produse de SNP-ChIP (echivalente cu factorul de normalizare spike-in normalizat de tip sălbatic), comparativ cu nivelurile publicate anterior, măsurate prin western blot (medie +/- S.E.M.) . Punctele reprezintă valorile individuale ale replicilor obținute prin SNP-ChIP, iar barele reprezintă valoarea medie. c Alcătuirea de fragmente produsă cu ajutorul MACS2 cu normalizarea adâncimii de secvențiere SPMR (fragment pileup per million reads) a unui cromozom și a unei regiuni cromozomiale de exemplu, înainte (panoul de sus) și după (panoul de jos) normalizarea spike-in. d Nivelurile proteinei țintă Red1 pentru seria de tulpini de dozare Red1 în comparație cu nivelurile publicate anterior, măsurate prin western blot (medie +/- S.E.M.) , ca în (b)

SNP-ChIP al unei proteine cromozomiale cu evoluție rapidă

Pentru a testa utilitatea spike-in-urilor intra-specie, ne-am orientat către analizele de cromatină în drojdie. Ne-am concentrat în mod special asupra cromozomilor în meioză, deoarece acest proces implică multe proteine cromozomiale larg distribuite și modificări post-translaționale. Un exemplu tipic este proteina Red1 a elementului axial, care joacă un rol important în recombinarea meiotică. Red1 este legată pe scară largă de-a lungul cromozomilor, dar, la fel ca și alți factori meiotici, secvența sa a deviat chiar și la speciile strâns înrudite . În plus, la fel ca multe proteine, Red1 nu poate fi ușor marcată fără a perturba funcția proteică . Aceste atribute înseamnă că Red1 nu se pretează la abordări standard de tip „spike-in”, ceea ce îl face o țintă deosebit de potrivită pentru SNP-ChIP. Mai mult decât atât, sunt disponibile mutații care modifică nivelurile globale și distribuția cromozomială a Red1 , oferind repere pentru evaluarea eficacității SNP-ChIP.

SNP-ChIP a Red1 a fost realizată utilizând fondul genetic SK1 ca tulpină de testare și o variantă optimizată pentru meioză a tulpinii de referință S288c, utilizată pe scară largă, ca spike-in . Pentru ambele medii genetice, sunt disponibile ansambluri genomice de înaltă calitate de la un capăt la altul . Aceste ansambluri diferă prin aproximativ 76 000 de SNP-uri, distanțate la o distanță mediană globală de 70 pb (Fișier suplimentar 1: Figura S1a), în mod constant pe toți cromozomii (Fișier suplimentar 1: Figura S1b), ceea ce constituie o variație suficientă pentru a permite atribuirea neambiguă a unei proporții mari de citiri de secvențiere. Pentru a efectua SNP-ChIP, celulele de test (SK1) au fost amestecate cu o fracție constantă de celule meiotice spike-in (S288c) înainte de a supune amestecurile unui protocol ChIP-seq standard. Lecturile generate au fost aliniate la un genom hibrid construit prin concatenarea ansamblurilor genomice ale genomurilor test și spike-in. Citirile au fost aliniate în condiții de potrivire perfectă, excluzând orice citire care se aliniază la mai mult de o locație. În consecință, orice lecturi care se suprapuneau cu cel puțin un SNP au fost atribuite unui genom și unei locații genomice specifice, în timp ce lecturile care nu se suprapuneau cu un polimorfism au fost alocate ambelor genomuri și, prin urmare, au fost eliminate.

Am investigat inițial capacitatea SNP-ChIP de a detecta modificările în asocierea cromatinei care rezultă din producția redusă de proteine. Alela red1ycs4S este cauzată de o mutație în promotorul RED1 care duce la o reducere a nivelurilor de Red1 la aproximativ 20-25% din tipul sălbatic și la o pierdere aproape completă a elementelor axiale observabile din punct de vedere citologic . În mod important, analiza ChIP-seq tradițională nu a putut detecta această modificare a abundenței proteinei și a produs profiluri Red1 nediferențiabile între tipul sălbatic și mutanții red1ycs4S . În schimb, atunci când am aplicat SNP-ChIP pentru a compara aceste două tulpini, nivelurile reduse de legare Red1 au fost ușor de observat (Fig. 1b). Calcularea unui factor de normalizare spike-in bazat pe abundența relativă a eșantionului total și a citirilor spike-in a dus la un nivel Red1 în mutantul red1ycs4S de 28,8 ± 5,1 % (S.D.) din tipul sălbatic, care se potrivește îndeaproape cu modificarea raportată a nivelurilor Red1 obținută din analiza western . Acest factor de normalizare a permis o scalare adecvată a semnalului profilelor ChIP-seq pentru cele două condiții (Fig. 1c).

SNP-ChIP a fost validat în continuare prin aplicarea sa la o serie de dozaj Red1, care constă în diferite combinații de alele RED1 (RED1, red1ycs4S, red1Δ), producând o scădere în trepte a nivelurilor Red1 (Fig. 1d) . Măsurătorile SNP-ChIP ale asocierii cromatinei Red1 în această serie s-au potrivit din nou îndeaproape cu nivelurile de proteine publicate anterior (Fig. 1d). De fapt, măsurătorile SNP-ChIP au părut mai precise decât analiza cantitativă western, care nu a reușit să rezolve reducerea așteptată a nivelurilor de proteine între celulele RED1/red1ycs4S și RED1/red1Δ . Luate împreună, aceste date arată că SNP-ChIP măsoară cu acuratețe reducerile în legarea globală a Red1 pe o gamă largă de niveluri ale proteinelor țintă.

SNP-ChIP este robust la variația adâncimii de secvențiere și a fracțiunii de celule spike-in

Am folosit mai multe abordări pentru a sonda robustețea tehnică a SNP-ChIP. Tehnologiile de secvențiere de mare randament produc un număr variabil de citiri per eșantion, în funcție de factori precum instrumentul de secvențiere și mutiplexarea eșantionului. Pentru a modela efectul unei profunzimi de secvențiere mai mici asupra reproductibilității analizei SNP-ChIP, am subeșantionat citirile din probele imunoprecipitate și din probele de intrare din condițiile de testare de tip sălbatic și red1ycs4S la diferite profunzimi (variind de la 1 la 10 milioane de citiri). Reprezentarea grafică a mărimii subeșantioanelor în funcție de numărul de citiri aliniate a arătat o corelație perfect liniară pentru toate probele (Fig. 2a), ceea ce indică faptul că o gamă largă de adâncimi de secvențiere va produce informații cantitative robuste prin SNP-ChIP. Pentru aceste condiții speciale de testare, fracțiunea de citiri care se corelează cu un genom specific și, prin urmare, a fost păstrată în analiză, a fost de aproximativ 20 % pentru tipul sălbatic și de 30 % pentru red1ycs4S. Am calculat factorul de normalizare spike-in utilizând toate cele 10 000 de combinații posibile de subeșantioane de citire (10 subeșantioane de citire variind de la 1 la 10 milioane de citiri pentru fiecare dintre cele patru eșantioane secvențiate: tipul sălbatic ChIP și eșantioane de intrare plus red1ycs4S ChIP și eșantioane de intrare) și am constatat o distribuție foarte strânsă a rezultatelor (0,2848 ± 0,0015, S.D.; Fig. 2b). Acest lucru stabilește că nu este necesar ca adâncimea de secvențiere să fie echilibrată între probele imunoprecipitate și cele de intrare sau între diferite condiții pentru a produce proporții exacte de citiri care se mapează la genomul de test și la genomul spike-in.

Fig. 2

SNP-ChIP este robust la variația atât a adâncimii de secvențiere, cât și a cantității de celule spike-in. a Numărul de citiri aliniate în SNP-ChIP în funcție de dimensiunea totală a eșantionului de citire brută. Pentru fiecare eșantion au fost obținute subeșantioane sistematice de citire brută de dimensiuni cuprinse între 1 și 10 milioane, care au fost mapate pe genomul hibrid SK1-S288c. b Distribuția factorilor de normalizare spike-in calculați utilizând toate cele 10 000 de combinații posibile de subeșantioane de citire din (a). Inserția este un zoom-in pe o fereastră îngustă a axei x în care se află toate valorile. c Procentul de citiri care se aliniază la genomul spike-in în proba de intrare față de proba imunoprecipitată (ChIP) pentru tulpinile de tip sălbatic și red1-pG162A. Notă: Spre deosebire de red1ycs4S, care conține o regiune introgresată cu zeci de SNP în jurul locusului RED1, mutantul red1-pG162A poartă doar mutația cauzală a promotorului. d Factorul de normalizare a spike-in-ului normalizat de tip sălbatic rezultat (echivalent cu cantitatea de Red1) în tulpina red1-pG162A după efectuarea SNP-ChIP cu procente de celule spike-in adăugate variind între 5 și 30 %. Rezultatele sugerează că procentele de material spike-in de 15% și mai mari sunt adecvate pentru SNP-ChIP

O altă condiție care poate afecta rezultatele SNP-ChIP este cantitatea de material spike-in adăugat în probe. Metodele de normalizare Spike-in presupun o relație liniară între cantitatea de material Spike-in și proporția rezultată de citiri Spike-in în proba imunoprecipitată. Această condiție este esențială pentru ca rezultatele să fie independente de cantitatea de material „spike-in”. Pentru a verifica această ipoteză, am pregătit probe cu proporții de celule spike-in cuprinse între 5 și 30 %. Ca eșantioane de testare, am utilizat tipul sălbatic și o tulpină cu o singură mutație a promotorului red1-pG162A care fenotipă alela red1ycs4S. În timp ce red1ycs4S conține o regiune genomică introgresată cu zeci de SNP-uri în jurul locusului RED1, mutantul red1-pG162A a fost creat pentru a purta doar mutația specifică responsabilă de reducerea nivelului de Red1 . După cum se arată în Fig. 2c, proporția de citiri spike-in în probele de intrare (care reflectă cantitatea de material spike-in adăugat la proba de testare) se corelează liniar cu proporția rezultată de citiri spike-in în proba imunoprecipitată, atât pentru tipul sălbatic, cât și pentru proba red1-pG162A. Mai mult, proba red1-pG162A a produs o cantitate de Red1 foarte asemănătoare cu cea a alelei red1ycs4S (28,8 % față de 28,1 % din tipul sălbatic, respectiv, atunci când se utilizează 20 % din celulele spike-in), ceea ce susține și mai mult robustețea metodei. Procentajele scăzute de celule spike-in (5 și 10 %) au dus la estimări oarecum mai mari ale cantității de Red1 (Fig. 2d), probabil din cauza creșterii zgomotului. Aceste rezultate sugerează că proporțiile de material spike-in de 15 % și mai mari sunt adecvate pentru SNP-ChIP. Toate celelalte experimente prezentate aici au folosit o proporție de spike-in de 20%.

În cele din urmă, am investigat impactul metodei de calcul pentru calcularea factorului de normalizare a spike-in. Factorul de normalizare SNP-ChIP calculat în exemplele prezentate până acum se bazează pe numărul total de citiri aliniate la genomul de test și la genomul spike-in. O metodă alternativă este de a calcula valoarea medie scalară a scorului de pileup al citirilor aliniate. Am testat utilitatea acestei alternative prin calcularea scorului pileup la (1) toate pozițiile genomice, (2) numai la pozițiile SNP sau (3) la pozițiile SNP care se încadrează în vârfurile de semnal numite (a se vedea secțiunea Metode). Ultima abordare va exclude efectiv regiunile care se așteaptă să conțină doar semnal de fond, împreună cu orice regiune fals negativă. Am găsit valori foarte asemănătoare și o concordanță ridicată între toate cele patru metode în toate cazurile (Fișier suplimentar 2: Figura S2a), deși grămezile de citire produc în mod constant valori ușor mai mici decât metoda de numărare a citirilor (Fișier suplimentar 2: Figura S2b). În general, totuși, diferența este relativ mică și considerăm că metoda bazată pe numărul de citiri, care este mult mai simplă din punct de vedere computațional, reprezintă o aproximare adecvată, cel puțin pentru proteinele larg distribuite.

Profile de legare obținute direct din experimentele SNP-ChIP

Utilitatea principală a SNP-ChIP este generarea unui factor de normalizare care permite scalarea profilurilor obținute prin experimente ChIP-seq tradiționale efectuate în aceleași condiții (Fig. 1c). Având în vedere distribuția largă a SNP-urilor în cele două genomuri analizate, am explorat posibilitatea ca SNP-ChIP să producă, de asemenea, în mod direct profiluri informative de legare, chiar dacă această aplicație este în mod clar limitată de densitatea SNP disponibilă. Compararea unei probe secvențiate cu spike-in cu datele obținute folosind o probă replicată, fără spike-in, arată că urmele de semnal ale probelor cu spike-in le reflectă îndeaproape pe cele ale controlului fără spike-in, deși pot fi observate unele lacune de semnal în proba cu spike-in (Fișier suplimentar 3: Figura S3a; exemple indicate de săgețile roșii). Astfel, așa cum era de așteptat, utilizarea de spike-in de aceeași specie cauzează o anumită pierdere de informații. Această problemă pare neglijabilă pentru vârfurile largi, deoarece vârfurile apelate prezintă o concordanță foarte strânsă (Fișier suplimentar 3: Figura S3b). Vârfurile înguste prezintă un dezacord mai mare, doar aproximativ o treime din vârfurile apelate se suprapun între cele două eșantioane. Aceste date indică faptul că SNP-ChIP poate furniza, de asemenea, informații directe despre distribuția proteinelor, în special pentru modelele de legare la scară mai mare.

Nivelurile globale de Red1 sunt reduse în mutanții cohesin și hop1∆

Am căutat să aplicăm SNP-ChIP pentru a investiga situațiile de mutanți care determină o redistribuire largă a proteinelor. Redistribuirea este o provocare pentru metodele tradiționale de cuantificare, cum ar fi ChIP-qPCR, deoarece identificarea regiunilor care rămân nelegate nu este trivială. În absența subunității conservate de cohesină Rec8, distribuția Red1 de-a lungul genomului se schimbă dramatic, prezentând regiuni mari de epuizare care alternează cu grupuri dense de legare . Cu toate acestea, rămâne neclar dacă nivelurile globale de legare a Red1 se schimbă în mutanții rec8∆. Am utilizat SNP-ChIP pentru a aborda această întrebare și am constatat o scădere pronunțată a nivelurilor globale de legare a Red1 (Fig. 3a). Comparația directă a ocupării Red1 de-a lungul a doi cromozomi de exemplu ilustrează atât redistribuirea dramatică, cât și scăderea globală a legăturii Red1 în comparație cu tipul sălbatic (Fig. 3b). Astfel, Rec8-cohesina este esențială pentru îmbogățirea cromozomială completă a Red1.

Fig. 3

Analiză SNP-ChIP la mutanți cu redistribuire pe scară largă a țintelor. a Nivelurile de proteină țintă Red1 într-un mutant rec8∆ în raport cu tipul sălbatic produs prin SNP-ChIP. Punctele reprezintă valorile replicilor individuale, iar barele reprezintă valoarea medie. b Spike-in-normalized fragment pileups în tulpini de tip sălbatic și în tulpini mutante rec8∆ produse utilizând MACS2 cu normalizarea adâncimii de secvențiere SPMR (fragment pileup per million reads), reprezentate grafic pe doi cromozomi de exemplu. c Nivelurile de Red1 în mutantul hop1∆ în raport cu tipul sălbatic, produse prin SNP-ChIP (ca în a). d Spike-in-normalizate în cazul celulelor de tip sălbatic și al tulpinilor mutante hop1∆ (ca în b). e Semnalul Red1 mediu Spike-in normalizat pe cromozomi individuali la un mutant hop1∆

Hop1 este o altă proteină importantă a elementului axial al drojdiei care interacționează fizic cu Red1 . Proteinele elementului axial sunt recrutate în cantități mai mari pe cromozomii mici, dar în absența lui Hop1, legarea Red1 devine mai puțin dependentă de dimensiunea cromozomului . Lucrările anterioare folosind scalarea in silico , au sugerat că această reducere a rezultat dintr-o creștere selectivă a recrutării Red1 pe cromozomi mari . Cu toate acestea, această abordare de scalare necesită definirea regiunilor genomice care nu sunt legate, ceea ce este dificil de stabilit în cazul proteinelor cromozomiale larg răspândite precum Red1. Prin urmare, am reinvestigat această întrebare prin efectuarea SNP-ChIP a Red1 într-un mutant hop1Δ. SNP-ChIP a reprodus slăbirea constatată anterior a tendinței de polarizare a dimensiunii cromozomului. Cu toate acestea, factorul de normalizare spike-in a arătat o scădere generală a recrutării Red1 la 71,9 ± 4,2% din cantitatea de Red1 de tip sălbatic (Fig. 3c, d). Această scădere este mai puternică pe cromozomii mici (Fig. 3e). Observăm că pierderea ușoară a legăturii Red1 nu are ca rezultat, în general, o pierdere a prejudecății în funcție de mărimea cromozomului, deoarece deleția histone metiltransferazelor Set1 și Dot1 provoacă reduceri similare de ~ 20% ale nivelurilor globale de recrutare Red1, dar nu afectează distribuția legăturii Red1 între cromozomi (Fișier suplimentar 4: Figura S4). Aceste date sugerează că pierderea lui Hop1 duce la o reducere generală a semnalului Red1 pe toți cromozomii, care afectează în special cei mai mici trei cromozomi.

Nivelurile de γ-H2AX nu se modifică în seria de tulpini cu dozaj Red1

Pentru a testa dacă SNP-ChIP permite, de asemenea, analize cantitative ale modificărilor proteice, am vizat fosforilarea histonei H2A pe serina 129 (γ-H2AX). Această modificare este indusă rapid în urma formării rupturilor de dublu catenă de ADN (DSBs) . În drojdia mitotică, modificarea γ-H2AX se întinde pe aproximativ 50 kb de o parte și de alta a unei DSB . În plus, γ-H2AX constitutiv se găsește în apropierea telomerilor pe tot parcursul ciclului celular . Pentru a analiza distribuția și dependența DSB a γ-H2AX în meioză, am efectuat SNP-ChIP într-o tulpină de tip sălbatic, precum și în seria de doze Red1, care prezintă o reducere ușoară (până la 30%) a nivelurilor DSB , și un mutant spo11-Y135F, care codifică o proteină Spo11 moartă catalitic, care nu formează DSB meiotice .

Măsurarea nivelurilor γ-H2AX în meioză nu a relevat nicio diferență între tipul sălbatic și niciuna dintre tulpinile cu niveluri Red1 reduse, indiferent de metoda de calcul (Fig. 4a, b, c). Semnalul uniform de-a lungul cromozomilor este în concordanță cu răspândirea semnului γ-H2AX din toate hotspoturile DSB ale drojdiei, care sunt distribuite în întregul genom, și explică probabil de ce o reducere ușoară a nivelurilor DSB nu duce la o scădere notabilă a semnalului γ-H2AX global. Controlul spo11-Y135F, pe de altă parte, a prezentat doar aproximativ 25% din nivelurile γ-H2AX de tip sălbatic. Semnalul a fost îmbogățit în mod semnificativ lângă telomeri, regiunile interstițiale prezentând doar semnale slabe, probabil asociate cu expresia genică . Aceste date arată că semnalul constitutiv γ-H2AX asociat telomerilor este menținut și în profaza meiotică. Mai mult, scalarea urmelor de semnal indică faptul că semnalul γ-H2AX adiacent telomerului rămâne în mare parte neschimbat în mutantul spo11-Y135F, în concordanță cu faptul că formarea DSB meiotică este aproape nedetectabilă în aceste regiuni . Împreună, aceste date arată că SNP-ChIP permite comparații cantitative între experimentele ChIP-seq indiferent de antigen și, astfel, oferă o metodă versatilă pentru măsurarea asociațiilor globale de cromatină fără a fi nevoie de etichete de epitope.

Fig. 4

Analiza SNP-ChIP a unei modificări proteice. a Nivelurile de γ-H2AX pentru seria de tulpini de dozare Red1 și un mutant spo11-Y135F în raport cu tipul sălbatic, produse prin SNP-ChIP. b Alcătuirea de fragmente produsă utilizând MACS2 cu normalizarea adâncimii de secvențiere SPMR (fragment pileup per milion de citiri) pe un cromozom de exemplu după normalizarea spike-in. c Detaliu al datelor din (b) care arată un zoom-in pe regiunea subtelomerică stângă

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.