- Experimental rationale of SNP-ChIP
- SNP-ChIP szybko ewoluującego białka chromosomalnego
- SNP-ChIP jest odporny na zmienność głębokości sekwencjonowania i frakcji komórek spike-in
- Profile wiązania uzyskane bezpośrednio z eksperymentów SNP-ChIP
- Globalne poziomy Red1 są zmniejszone w mutantach kohezyny i hop1∆
- poziomyγ-H2AX nie zmieniają się w serii szczepów z dawką Red1
Experimental rationale of SNP-ChIP
Podstawowym założeniem SNP-ChIP jest to, że komórki tego samego gatunku mogą służyć jako materiał spike-in pod warunkiem, że są wystarczająco zróżnicowane genetycznie, głównie w postaci polimorfizmów pojedynczego nukleotydu (SNPs). Sygnał przy każdym polimorfizmie stanowi niezależną miarę stosunku próbka badana/spike-in, co razem pozwala na obliczenie współczynnika normalizacji i odpowiednie skalowanie wyników ChIP-seq (Rys. 1a). Jeśli istnieje wystarczająca różnorodność genetyczna, aby umożliwić przypisanie dużej frakcji odczytów sekwencjonowania do genomów pochodzenia, SNP-ChIP dodatkowo pozwala na generowanie profili dystrybucji celów w całym genomie. Co ważne, ponieważ SNP-ChIP wykorzystuje ten sam gatunek jako źródło materiału spike-in, będzie działać z praktycznie każdym celem w proteomie organizmu, w tym z modyfikacjami potranslacyjnymi, pod warunkiem, że dostępne jest przeciwciało klasy ChIP.
SNP-ChIP szybko ewoluującego białka chromosomalnego
Aby sprawdzić użyteczność wewnątrzgatunkowych spike-in, zwróciliśmy się do analiz chromatyny u drożdży. Skupiliśmy się szczególnie na chromosomach w mejozie, ponieważ proces ten obejmuje wiele szeroko rozpowszechnionych białek chromosomalnych i modyfikacji potranslacyjnych. Jednym z typowych przykładów jest białko elementu osiowego Red1, które odgrywa ważną rolę w rekombinacji mejotycznej. Red1 jest szeroko zwi±zane wzdłuż chromosomów, ale, podobnie jak inne czynniki mejotyczne, jego sekwencja różni się nawet u blisko spokrewnionych gatunków. Ponadto, jak wiele białek, Red1 nie może być łatwo oznakowany bez zakłócania funkcji białka. Te cechy oznaczają, że Red1 nie jest podatny na standardowe metody spike-in, co czyni go szczególnie odpowiednim celem dla SNP-ChIP. Co więcej, mutacje, które zmieniają ogólny poziom i chromosomalną dystrybucję Red1 są dostępne, zapewniając wzorce do oceny skuteczności SNP-ChIP.
SNP-ChIP Red1 przeprowadzono przy użyciu tła genetycznego SK1 jako szczepu testowego i zoptymalizowanego pod kątem mejozy wariantu szeroko stosowanego szczepu referencyjnego S288c jako spike-in . Dla obu środowisk genetycznych dostępne są wysokiej jakości zespoły genomowe typu end-to-end. Złożenia te różnią się około 76 000 SNP, rozmieszczonych w ogólnej medianie odległości 70 bp (Dodatkowy plik 1: Figura S1a) konsekwentnie na wszystkich chromosomach (Dodatkowy plik 1: Figura S1b), co stanowi wystarczającą zmienność, aby umożliwić jednoznaczne przypisanie dużej części odczytów sekwencjonowania. W celu wykonania SNP-ChIP, komórki badane (SK1) mieszano ze stałą frakcją komórek mejotycznych spike-in (S288c) przed poddaniem mieszanin standardowemu protokołowi ChIP-seq. Wygenerowane odczyty były wyrównywane do genomu hybrydowego zbudowanego przez konkatenację złożeń genomów komórek testowych i spike-in. Odczyty dopasowywano w warunkach idealnego dopasowania, wykluczając wszelkie odczyty dopasowujące się do więcej niż jednego miejsca. W konsekwencji, wszelkie odczyty pokrywające się z co najmniej jednym SNP zostały przypisane do określonego genomu i lokalizacji genomowej, podczas gdy odczyty nie pokrywające się z polimorfizmem mapowały się do obu genomów, a zatem zostały odrzucone.
Początkowo badaliśmy zdolność SNP-ChIP do wykrywania zmian w asocjacji chromatyny wynikających ze zmniejszonej produkcji białka. Allel red1ycs4S jest spowodowany mutacją w promotorze RED1, która prowadzi do zmniejszenia poziomu Red1 do około 20-25% typu dzikiego i prawie całkowitej utraty cytologicznie obserwowalnych elementów osiowych. Co ważne, tradycyjna analiza ChIP-seq nie była w stanie wykryć tej zmiany w obfitości białka i dała nierozróżnialne profile Red1 pomiędzy typem dzikim i mutantami red1ycs4S . Dla kontrastu, kiedy zastosowaliśmy SNP-ChIP do porównania tych dwóch szczepów, obniżone poziomy wiązania Red1 były łatwo widoczne (Rys. 1b). Obliczenie współczynnika normalizacji spike-in opartego na względnej obfitości całkowitej próbki i odczytów spike-in dało poziom Red1 w mutancie red1ycs4S wynoszący 28,8 ± 5,1% (S.D.) dzikiego typu, ściśle odpowiadający zgłoszonej zmianie w poziomach Red1 uzyskanej z analizy zachodniej. Ten współczynnik normalizacji umożliwił odpowiednie skalowanie sygnału profili ChIP-seq dla dwóch warunków (Rys. 1c).
SNP-ChIP został dalej zwalidowany przez zastosowanie go do serii dawek Red1, która składa się z różnych kombinacji alleli RED1 (RED1, red1ycs4S, red1Δ) dając stopniowy spadek poziomów Red1 (Rys. 1d). Pomiary SNP-ChIP asocjacji chromatyny Red1 w tej serii ponownie ściśle odpowiadały wcześniej opublikowanym poziomom białka (Rys. 1d). W rzeczywistości, pomiary SNP-ChIP okazały się dokładniejsze niż ilościowa analiza zachodnia, która nie rozwiązała oczekiwanej redukcji poziomów białek pomiędzy komórkami RED1/red1ycs4S i RED1/red1Δ. Łącznie, dane te pokazują, że SNP-ChIP dokładnie mierzy redukcje w globalnym wiązaniu Red1 w szerokim zakresie poziomów białek docelowych.
SNP-ChIP jest odporny na zmienność głębokości sekwencjonowania i frakcji komórek spike-in
Użyliśmy kilku podejść do zbadania technicznej odporności SNP-ChIP. Technologie sekwencjonowania o wysokiej przepustowości produkują zmienne liczby odczytów na próbkę, w zależności od czynników takich jak instrument sekwencjonujący i mutipleksowanie próbki. W celu modelowania wpływu mniejszej głębokości sekwencjonowania na odtwarzalność analizy SNP-ChIP, podpróbkowaliśmy odczyty z próbek immunoprecypitowanych i wejściowych z warunków testowych typu dzikiego i red1ycs4S do różnych głębokości (w zakresie od 1 do 10 milionów odczytów). Wykres wielkości podpróbki względem liczby wyrównanych odczytów wykazał idealnie liniową korelację dla wszystkich próbek (Fig. 2a), wskazując, że szeroki zakres głębokości sekwencjonowania dostarczy solidnych informacji ilościowych przez SNP-ChIP. Dla tych szczególnych warunków testowych, frakcja odczytów mapujących do określonego genomu, a zatem zachowanych w analizie, wynosiła około 20% dla typu dzikiego i 30% dla red1ycs4S. Obliczyliśmy współczynnik normalizacji spike-in przy użyciu wszystkich 10 000 możliwych kombinacji podpróbek odczytów (10 podpróbek odczytów w zakresie od 1 do 10 milionów odczytów dla każdej z czterech sekwencjonowanych próbek: dziki typ ChIP i próbki wejściowe plus red1ycs4S ChIP i próbki wejściowe) i znaleźliśmy bardzo ścisły rozkład wyników (0,2848 ± 0,0015, S.D.; Fig. 2b). To dowodzi, że głębokość sekwencjonowania nie musi być zrównoważona między próbkami immunoprecypitowanymi i wejściowymi, ani między różnymi warunkami, aby wytworzyć dokładne proporcje odczytów mapujących do genomów testowych i spike-in.
Innym warunkiem, który może wpłynąć na wyniki SNP-ChIP jest ilość materiału spike-in dodawanego do próbek. Metody normalizacji spike-in zakładają liniową zależność między ilością materiału spike-in a wynikową proporcją odczytów spike-in w próbce poddanej immunoprecypitacji. Warunek ten jest niezbędny, aby wyniki były niezależne od ilości materiału spike-in. Aby zweryfikować to założenie, przygotowaliśmy próbki z proporcjami komórek spike-in w zakresie od 5 do 30%. Jako próbek testowych użyliśmy typu dzikiego i szczepu z pojedynczą mutacją promotora red1-pG162A, który fenokopiuje allel red1ycs4S. Podczas gdy red1ycs4S zawiera introgresowany region genomowy z dziesiątkami SNP otaczających locus RED1, mutant red1-pG162A został zaprojektowany tak, aby przenosił tylko specyficzną mutację odpowiedzialną za redukcję poziomów Red1. Jak pokazano na Rys. 2c, proporcja spike-in reads w próbkach wejściowych (odzwierciedlająca ilość materiału spike-in dodanego do próbki testowej) koreluje liniowo z wynikową proporcją spike-in reads w próbce immunoprecypitowanej, zarówno dla dzikiego typu, jak i próbki red1-pG162A. Co więcej, próbka red1-pG162A dała bardzo podobną ilość Red1 do allelu red1ycs4S (28,8% versus 28,1% typu dzikiego, odpowiednio, przy użyciu 20% komórek spike-in), co dodatkowo potwierdza solidność metody. Niski procent komórek spike-in (5 i 10%) skutkował nieco podwyższonymi szacunkami ilości Red1 (Rys. 2d), prawdopodobnie z powodu zwiększonego szumu. Wyniki te sugerują, że proporcje materiału spike-in wynoszące 15% i więcej są odpowiednie dla SNP-ChIP. Wszystkie inne eksperymenty pokazane tutaj używały proporcji spike-in o wartości 20%.
Wreszcie, zbadaliśmy wpływ metody obliczania współczynnika normalizacji spike-in. Współczynnik normalizacji SNP-ChIP obliczony w przykładach pokazanych do tej pory opiera się na całkowitej liczbie odczytów dopasowanych do genomu testowego i genomu spike-in. Alternatywną metodą jest obliczenie średniej wartości skalarnej wyniku pileup score wyrównanych odczytów. Przetestowaliśmy użyteczność tej alternatywy obliczając wynik pileup score dla (1) wszystkich pozycji genomowych, (2) tylko dla pozycji SNP, lub (3) dla pozycji SNP mieszczących się w nazwanych szczytach sygnału (patrz sekcja Metody). Ostatnie podejście skutecznie wykluczy regiony, w których spodziewany jest jedynie sygnał tła, wraz z wszelkimi regionami fałszywie negatywnymi. Stwierdziliśmy bardzo podobne wartości i wysoką zgodność pomiędzy wszystkimi czterema metodami we wszystkich przypadkach (plik dodatkowy 2: Rysunek S2a), chociaż metoda read pileups konsekwentnie daje nieco niższe wartości niż metoda read count (plik dodatkowy 2: Rysunek S2b). Ogólnie jednak różnica jest stosunkowo niewielka i uważamy, że metoda oparta na liczbie odczytów, która jest znacznie prostsza obliczeniowo, stanowi odpowiednie przybliżenie, przynajmniej dla szeroko rozproszonych białek.
Profile wiązania uzyskane bezpośrednio z eksperymentów SNP-ChIP
Podstawową użytecznością SNP-ChIP jest generowanie współczynnika normalizacji, który umożliwia skalowanie profili uzyskanych przez tradycyjne eksperymenty ChIP-seq prowadzone w tych samych warunkach (ryc. 1c). Biorąc pod uwagę szeroką dystrybucję SNP w obu analizowanych genomach, zbadaliśmy możliwość, że SNP-ChIP może również bezpośrednio dostarczyć informacyjnych profili wiązania, nawet jeśli to zastosowanie jest wyraźnie ograniczone przez dostępną gęstość SNP. Porównanie próbki sekwencjonowanej za pomocą spike-in z danymi uzyskanymi przy użyciu replikowanej próbki bez spikingu pokazuje, że ścieżki sygnału próbek spikowanych ściśle odzwierciedlają te z kontroli bez spikingu, chociaż w próbce spikowanej można zauważyć pewne przerwy w sygnale (plik dodatkowy 3: Figura S3a; przykłady wskazane przez czerwone strzałki). Tak więc, zgodnie z oczekiwaniami, użycie spike-in tego samego gatunku powoduje pewną utratę informacji. Problem ten wydaje się nieistotny w przypadku szerokich pików, ponieważ nazywane szczyty wykazują bardzo bliską zgodność (plik dodatkowy 3: Rysunek S3b). Wąskie szczyty wykazują więcej niezgodności, z tylko około jedną trzecią nazwanych pików pokrywających się między dwiema próbkami. Dane te wskazują, że SNP-ChIP może również dostarczyć bezpośrednich informacji o dystrybucji białek, w szczególności dla wzorów wiązania na większą skalę.
Globalne poziomy Red1 są zmniejszone w mutantach kohezyny i hop1∆
Postaraliśmy się zastosować SNP-ChIP do zbadania sytuacji mutantów, które powodują szeroką redystrybucję białka. Redystrybucja jest wyzwaniem dla tradycyjnych metod kwantyfikacji, takich jak ChIP-qPCR, ponieważ identyfikacja regionów, które pozostają niezwiązane nie jest trywialna. W przypadku braku konserwatywnej podjednostki kohezyny Rec8, dystrybucja Red1 wzdłuż genomu zmienia się dramatycznie, ukazując duże regiony zubożenia na przemian z gęstymi skupiskami wiązania. Nie wiadomo jednak, czy ogólny poziom wiązania Red1 u mutantów rec8∆ ulega zmianie. Aby odpowiedzieć na to pytanie zastosowaliśmy SNP-ChIP i stwierdziliśmy wyraźny spadek ogólnego poziomu wiązania Red1 (Rys. 3a). Bezpośrednie porównanie zajętości Red1 wzdłuż dwóch przykładowych chromosomów ilustruje zarówno dramatyczną redystrybucję, jak i ogólny spadek wiązania Red1 w porównaniu do typu dzikiego (Rys. 3b). Tak więc, kohezyna Rec8 jest niezbędna do pełnego chromosomalnego wzbogacenia Red1.
Hop1 jest kolejnym ważnym białkiem elementu osiowego drożdży, które fizycznie oddziałuje z Red1 . Białka elementu osiowego są rekrutowane w większych ilościach do małych chromosomów, ale w przypadku braku Hop1, wiązanie Red1 staje się mniej zależne od wielkości chromosomu. Poprzednia praca wykorzystująca skalowanie in silico sugerowała, że ta redukcja wynikała z selektywnego wzrostu rekrutacji Red1 do dużych chromosomów. To podejście do skalowania wymaga jednak zdefiniowania regionów genomu, które są niezwiązane, co jest trudne do ustalenia w przypadku szeroko rozpowszechnionych białek chromosomalnych, takich jak Red1. Dlatego ponownie zbadaliśmy to zagadnienie wykonując SNP-ChIP Red1 w mutancie hop1Δ. SNP-ChIP odtworzyło poprzednio stwierdzone osłabienie nierówności w wielkości chromosomów. Jednakże, współczynnik normalizacji spike-in wykazał ogólny spadek rekrutacji Red1 do 71.9 ± 4.2% ilości Red1 typu dzikiego (Rys. 3c, d). Spadek ten jest silniejszy na małych chromosomach (Rys. 3e). Zwracamy uwagę, że łagodna utrata wiązania Red1 generalnie nie skutkuje utratą tendencji do różnicowania wielkości chromosomów, ponieważ delecja metylotransferaz histonowych Set1 i Dot1 powoduje podobne ~ 20% redukcje ogólnego poziomu rekrutacji Red1, ale nie wpływa na dystrybucję wiązania Red1 wśród chromosomów (plik dodatkowy 4: Rysunek S4). Dane te sugerują, że utrata Hop1 prowadzi do ogólnej redukcji sygnału Red1 na wszystkich chromosomach, co szczególnie wpływa na trzy najmniejsze chromosomy.
poziomyγ-H2AX nie zmieniają się w serii szczepów z dawką Red1
Aby sprawdzić, czy SNP-ChIP pozwala również na ilościową analizę modyfikacji białek, wycelowaliśmy w fosforylację histonu H2A na serynie 129 (γ-H2AX). Modyfikacja ta jest gwałtownie indukowana po utworzeniu przerwania podwójnej nici DNA (DSBs). W mitotycznych drożdżach modyfikacja γ-H2AX rozprzestrzenia się na około 50 kb po obu stronach DSB. Ponadto, konstytutywna γ-H2AX jest obecna w pobliżu telomerów w całym cyklu komórkowym. Aby przeanalizować dystrybucję i zależność γ-H2AX od DSB w mejozie, przeprowadziliśmy SNP-ChIP w szczepie typu dzikiego, jak również w serii dawek Red1, która wykazuje łagodne (do 30%) obniżenie poziomu DSB , oraz mutancie spo11-Y135F, kodującym katalitycznie martwe białko Spo11, które nie tworzy mejotycznych DSBs .
Pomiar poziomu γ-H2AX w mejozie nie wykazał różnicy między typem dzikim a żadnym ze szczepów z obniżonym poziomem Red1, niezależnie od metody obliczeniowej (ryc. 4a, b, c). Jednolity sygnał wzdłuż chromosomów jest zgodny z rozprzestrzenianiem się znaku γ-H2AX ze wszystkich drożdżowych hotspotów DSB, które są rozmieszczone w całym genomie, i prawdopodobnie wyjaśnia, dlaczego łagodne obniżenie poziomu DSB nie prowadzi do zauważalnego spadku globalnego sygnału γ-H2AX. Kontrola spo11-Y135F, z drugiej strony, wykazywała tylko około 25% poziomu γ-H2AX typu dzikiego. Sygnał był wyraźnie wzbogacony w pobliżu telomerów, a regiony śródmiąższowe wykazywały jedynie słabe sygnały, prawdopodobnie związane z ekspresją genów. Dane te pokazują, że konstytutywny sygnał γ-H2AX związany z telomerami jest również utrzymywany w fazie mejotycznej. Ponadto, skalowanie ścieżek sygnałowych wskazuje, że sygnał γ-H2AX przylegający do telomerów pozostaje w dużej mierze niezmieniony w mutancie spo11-Y135F, co jest zgodne z faktem, że tworzenie mejotycznych DSB jest prawie niewykrywalne w tych regionach. Łącznie dane te pokazują, że SNP-ChIP umożliwia ilościowe porównania między eksperymentami ChIP-seq niezależnie od antygenu, a tym samym zapewnia wszechstronną metodę pomiaru globalnych asocjacji chromatyny bez potrzeby stosowania znaczników epitopowych.
.