SNP-ChIP: um método versátil e livre de tags para quantificar mudanças na ligação protéica através do genoma

Lógica experimental do SNP-ChIP

A premissa básica do SNP-ChIP é que células da mesma espécie podem servir como material spike-in desde que abrigem diversidade genética suficiente, principalmente na forma de polimorfismos de nucleotídeos únicos (SNPs). O sinal em cada polimorfismo fornece uma medida independente da relação teste-amostra/spike-in que, em conjunto, permite o cálculo de um fator de normalização e uma escala apropriada dos resultados ChIP-seq (Fig. 1a). Se houver diversidade genética suficiente para permitir que uma grande fração de leituras de seqüenciamento seja atribuída aos genomas de origem, o SNP-ChIP permite, adicionalmente, a geração de perfis de distribuição alvo em todo o genoma. Importante, porque o SNP-ChIP utiliza as mesmas espécies que a fonte do material spike-in, ele funcionará com praticamente qualquer alvo no proteoma do organismo, incluindo modificações pós-tradução, desde que um anticorpo de grau ChIP esteja disponível.

Fig. 1

SNP-ChIP adiciona a capacidade de medir quantidades semi-quantitativas de proteína alvo ao tradicional ChIP-seq. a Principais etapas do SNP-ChIP exemplificadas para duas condições hipotéticas. b Níveis da proteína-alvo vermelha1 produzida pelo SNP-ChIP (equivalente ao fator de normalização do pico de penetração do tipo selvagem), em comparação com níveis previamente publicados medidos pelo western blot (média +/- S.E.M.) . Os pontos representam valores individuais de réplicas derivadas do SNP-ChIP e as barras representam o valor médio. c Fragmento de pilha produzido usando MACS2 com SPMR (fragmento de pilha por milhão de leituras) seqüenciando a normalização de profundidade de um exemplo de cromossomo e região cromossômica antes (painel superior) e depois (painel inferior) da normalização de pico de inserção. d Níveis da proteína alvo Red1 para a série de cepas de dosagem Red1 em comparação com níveis previamente publicados medidos pelo western blot (média +/- S.E.M.) , como em (b)

SNP-ChIP de uma proteína cromossômica em rápida evolução

Para testar a utilidade de spike-ins intra-espécies, recorremos à análise cromatina em leveduras. Nós focamos especificamente em cromossomos em meiose porque este processo envolve muitas proteínas cromossômicas amplamente distribuídas e modificações pós-tradução. Um exemplo típico é a proteína de elemento axial Red1, que desempenha papéis importantes na recombinação meiótica. A Red1 está amplamente ligada aos cromossomos mas, como outros fatores meióticos, sua sequência tem divergido mesmo em espécies intimamente relacionadas. Além disso, como muitas proteínas, o Red1 não pode ser facilmente marcado sem perturbar a função proteica. Estes atributos significam que o Red1 não é passível de ser marcado com spike-in, tornando-o um alvo particularmente adequado para o SNP-ChIP. Além disso, mutações que alteram os níveis gerais e a distribuição cromossômica do Red1 estão disponíveis, fornecendo referências para avaliar a eficácia do SNP-ChIP.

SNP-ChIP do Red1 foi realizado usando o fundo genético do SK1 como estirpe de teste e uma variante otimizada para meiose da estirpe de referência S288c amplamente utilizada como spike-in . Para ambos os fundos genéticos, estão disponíveis conjuntos de genoma de alta qualidade de ponta a ponta. Estes conjuntos diferem em cerca de 76.000 SNPs, espaçados a uma distância mediana total de 70 bp (ficheiro adicional 1: Figura S1a) de forma consistente em todos os cromossomas (ficheiro adicional 1: Figura S1b), o que constitui variação suficiente para permitir a atribuição inequívoca de uma grande proporção de leituras sequenciais. Para realizar o SNP-ChIP, as células de teste (SK1) foram misturadas com uma fração constante de células spike-in meióticas (S288c) antes de submeter as misturas a um protocolo ChIP-seq padrão. As leituras geradas foram alinhadas com um genoma híbrido construído pela concatenação dos genomas de teste e dos genomas spike-in. As leituras foram alinhadas com condições de combinação perfeita, excluindo qualquer leitura alinhada a mais de um local. Consequentemente, quaisquer leituras sobrepostas a pelo menos um SNP foram atribuídas a um genoma e localização genômica específicos, enquanto leituras não sobrepostas a um polimorfismo mapeado para ambos os genomas e assim foram descartadas.

Inicialmente investigamos a capacidade do SNP-ChIP de detectar mudanças na associação de cromatina resultantes da redução da produção de proteína. O alelo red1ycs4S é causado por uma mutação no promotor do RED1 que leva a uma redução dos níveis de Red1 para cerca de 20-25% do tipo selvagem e uma perda quase completa dos elementos axiais observáveis citologicamente. É importante ressaltar que a análise tradicional ChIP-seq não foi capaz de detectar esta alteração na abundância de proteínas e produziu perfis de Red1 indistinguíveis entre mutantes do tipo selvagem e mutantes Red1ycs4S . Em contraste, quando aplicamos o SNP-ChIP para comparar essas duas cepas, os níveis reduzidos de ligação do Red1 foram prontamente aparentes (Fig. 1b). O cálculo de um fator de normalização spike-in baseado na abundância relativa da amostra total e leituras spike-in produziu um nível de Vermelho1 no mutante red1ycs4S de 28,8 ± 5,1% (S.D.) do tipo selvagem, correspondendo de perto à mudança relatada nos níveis de Vermelho1 obtida da análise ocidental . Este fator de normalização permitiu uma escala de sinal apropriada dos perfis ChIP-seq para as duas condições (Fig. 1c).

SNP-ChIP foi posteriormente validado aplicando-o a uma série de dosagem Red1, que consiste em diferentes combinações de alelos RED1 (RED1, red1ycs4S, red1Δ) produzindo uma diminuição gradual dos níveis de Red1 (Fig. 1d) . As medidas de SNP-ChIP da associação da cromatina Red1 nesta série correspondem novamente aos níveis de proteína publicados anteriormente (Fig. 1d). De fato, as medidas de SNP-ChIP pareceram mais precisas do que a análise ocidental quantitativa, que não conseguiu resolver a redução esperada nos níveis de proteína entre as células RED1/red1ycs4S e RED1/red1Δ . Em conjunto, estes dados mostram que o SNP-ChIP mede com precisão as reduções na ligação global de Red1 numa ampla gama de níveis de proteína alvo.

SNP-ChIP é robusto à variação na profundidade de sequenciamento e fração de células spike-in

Usamos várias abordagens para sondar a robustez técnica do SNP-ChIP. Tecnologias de sequenciamento de alto rendimento produzem números variáveis de leituras por amostra, dependendo de fatores como instrumento de sequenciamento e mutiplexação da amostra. Para modelar o efeito da menor profundidade de sequenciamento na reprodutibilidade da análise SNP-ChIP, subamos as leituras das amostras imunoprecipitadas e de entrada do tipo selvagem e das condições de teste red1ycs4S para diferentes profundidades (variando de 1 a 10 milhões de leituras). A plotagem do tamanho da subamostra contra o número de leituras alinhadas mostrou uma correlação perfeitamente linear para todas as amostras (Fig. 2a), indicando que uma ampla gama de profundidades de seqüenciamento produzirá informações quantitativas robustas pelo SNP-ChIP. Para estas condições particulares de teste, a fração de leituras mapeadas para um genoma específico, e assim mantidas na análise, foi de cerca de 20% para o tipo selvagem e 30% para o red1ycs4S. Calculamos o fator de normalização spike-in usando todas as 10.000 combinações possíveis de subamostras lidas (10 subamostras lidas variando de 1 a 10 milhões de leituras para cada uma de quatro amostras sequenciadas: amostras do tipo selvagem ChIP e de entrada mais amostras do red1ycs4S ChIP e de entrada) e encontramos uma distribuição muito apertada dos resultados (0,2848 ± 0,0015, S.D.; Fig. 2b). Isto estabelece que a profundidade do sequenciamento não precisa ser equilibrada entre amostras imunoprecipitadas e de entrada, ou entre diferentes condições, para produzir proporções precisas de mapeamento de leituras para o teste e os genomas spike-in.

Fig. 2

SNP-ChIP é robusto à variação tanto na profundidade de sequenciamento quanto na quantidade de células spike-in. a Número de leituras alinhadas no SNP-ChIP em função do tamanho total da amostra bruta lida. Foram obtidas subamostras brutas sistemáticas de leitura de tamanho 1 a 10 milhões para cada amostra e mapeadas para o genoma híbrido SK1-S288c. b Distribuição dos fatores de normalização spike-in computados usando todas as 10.000 combinações possíveis de subamostras lidas em (a). O inset é um zoom-in em uma janela estreita do eixo x onde todos os valores estão localizados. c Porcentagem de leituras alinhadas com o genoma spike-in na amostra de entrada versus a amostra imunoprecipitada (ChIP) para as cepas tipo selvagem e vermelho1-pG162A. Nota: Em contraste com o red1ycs4S, que contém uma região intrograda com dezenas de SNP ao redor do locus RED1, o mutante red1-pG162A carrega apenas a mutação promotora causal. d O fator de normalização do pico de inserção do tipo selvagem (equivalente à quantidade de Red1) na cepa red1-pG162A após a realização do SNP-ChIP com porcentagens de células de pico de inserção adicionadas variando de 5 a 30%. Os resultados sugerem que proporções de material spike-in de 15% ou mais são apropriadas para SNP-ChIP

Outra condição que pode afetar os resultados do SNP-ChIP é a quantidade de material spike-in adicionado às amostras. Os métodos de normalização Spike-in assumem uma relação linear entre a quantidade de material spike-in e a proporção resultante do spike-in lido na amostra imunoprecipitada. Esta condição é essencial para que os resultados sejam independentes da quantidade de material spike-in. Para verificar essa suposição, preparamos amostras com proporções de células spike-in variando de 5 a 30%. Como amostras de teste utilizamos o tipo selvagem e uma estirpe com uma única mutação promotora red1-pG162A que fenocopia o alelo red1ycs4S. Enquanto o red1ycs4S contém uma região genômica intrograda com dezenas de SNPs em torno do locus RED1, o mutante red1-pG162A foi projetado para carregar apenas a mutação específica responsável pela redução dos níveis de Red1. Como mostrado na Fig. 2c, a proporção de leituras de spike-in nas amostras de entrada (refletindo a quantidade de material spike-in adicionado à amostra de teste) correlaciona-se linearmente com a proporção resultante de leituras de spike-in na amostra imunoprecipitada, tanto para o tipo selvagem quanto para a amostra vermelha1-pG162A. Além disso, a amostra red1-pG162A produziu uma quantidade muito semelhante de Red1 ao alelo red1ycs4S (28,8% versus 28,1% do tipo selvagem, respectivamente, quando se usa 20% das células spike-in), suportando ainda mais a robustez do método. Percentagens baixas de células spike-in (5 e 10%) resultaram em estimativas um pouco maiores da quantidade de Red1 (Fig. 2d), provavelmente devido ao aumento do ruído. Estes resultados sugerem que proporções de material spike-in de 15% ou mais são apropriadas para o SNP-ChIP. Todos os outros experimentos aqui mostrados utilizaram uma proporção de spike-in de 20%.

Finalmente, investigamos o impacto do método de cálculo para calcular o fator de normalização do spike-in. O fator de normalização SNP-ChIP calculado nos exemplos mostrados até o momento baseia-se em contagens totais de leitura alinhadas ao teste e aos genomas spike-in. Um método alternativo é calcular o valor médio escalar do escore de pileups de leitura alinhados. Testamos a utilidade desta alternativa calculando a pontuação do pileup em (1) todas as posições genómicas, (2) apenas nas posições SNP, ou (3) nas posições SNP dentro dos chamados picos de sinal (ver secção Métodos). A última abordagem efetivamente excluirá regiões que se espera que contenham apenas sinal de fundo, juntamente com quaisquer regiões falsamente negativas. Encontramos valores muito semelhantes e alta concordância entre os quatro métodos em todos os casos (arquivo adicional 2: Figura S2a), embora os pileups de leitura consistentemente produzam valores ligeiramente inferiores ao método de contagem de leitura (arquivo adicional 2: Figura S2b). No geral, entretanto, a diferença é relativamente pequena e acreditamos que o método baseado na contagem lida, que é computacionalmente muito mais simples, representa uma aproximação apropriada, pelo menos para proteínas amplamente distribuídas.

Perfis de ligação obtidos diretamente dos experimentos SNP-ChIP

A utilidade primária do SNP-ChIP é a geração de um fator de normalização que permite escalonar os perfis obtidos pelos experimentos ChIP-seq tradicionais executados sob as mesmas condições (Fig. 1c). Dada a ampla distribuição dos SNPs pelos dois genomas analisados, exploramos a possibilidade de que o SNP-ChIP também possa produzir diretamente perfis vinculados informativos, ainda que esta aplicação seja claramente limitada pela densidade de SNP disponível. A comparação de uma amostra sequenciada com spike-in com dados obtidos usando uma amostra replicada e não spike-in mostra que faixas de sinal de amostras spike-in espelham de perto as do controle não spike-in, embora algumas lacunas de sinal possam ser vistas na amostra spike-in (arquivo adicional 3: Figura S3a; exemplos indicados pelas setas vermelhas). Assim, como esperado, o uso de spike-in da mesma espécie causa alguma perda de informação. Esta questão parece insignificante para picos amplos, como os chamados picos mostram uma concordância muito próxima (Arquivo adicional 3: Figura S3b). Os picos estreitos mostram mais discordância, com apenas cerca de um terço dos chamados picos sobrepostos entre as duas amostras. Estes dados indicam que o SNP-ChIP também pode fornecer informações diretas sobre a distribuição de proteínas, em particular para padrões de ligação em maior escala.

Níveis de Vermelho Global1 são reduzidos em coesina e hop1∆ mutantes

Tentamos aplicar o SNP-ChIP para investigar situações mutantes que causam uma ampla redistribuição de proteínas. A redistribuição é um desafio para métodos tradicionais de quantificação, como o ChIP-qPCR, pois identificar regiões que permanecem sem restrições não é trivial. Na ausência da subunidade de coesina conservada Rec8, a distribuição Red1 ao longo do genoma muda drasticamente, exibindo grandes regiões de depleção alternando com densos grupos de ligação . No entanto, não está claro se os níveis globais de ligação da Red1 mudam em rec8∆ mutantes. Utilizamos o SNP-ChIP para abordar esta questão e encontramos uma diminuição pronunciada dos níveis globais de ligação do Vermelho1 (Fig. 3a). A comparação direta da ocupação de Red1 ao longo de dois exemplos de cromossomos ilustra tanto a dramática redistribuição como a diminuição geral da ligação Red1 em comparação com o tipo selvagem (Fig. 3b). Assim, o Rec8-cohesin é essencial para o enriquecimento cromossômico completo do Red1.

Fig. 3

Análise de SNP-ChIP em mutantes com redistribuição de alvos em larga escala. a Target protein Red1 levels in a rec8∆ mutant relative to wild type produced by SNP-ChIP. Os pontos representam valores de réplicas individuais e as barras representam o valor médio. b Pilhups de fragmentos de fragmentos de Spike-in-normalizados no tipo selvagem e cepas mutantes rec8∆ produzidos usando MACS2 com SPMR (fragmgment pileup per million read) seqüenciando a normalização da profundidade plotada em dois cromossomos de exemplo. c Níveis Red1 em hop1∆ mutante em relação ao tipo selvagem produzido pelo SNP-ChIP (como em a). d Pilhups de fragmentos em forma de espigão em formato selvagem e hop1∆ cepas mutantes (como em b). e O sinal médio Spike-in-normalized Red1 em cromossomos individuais em um hop1∆ mutante

Hop1 é outra proteína importante do elemento axial da levedura que interage fisicamente com o Red1 . As proteínas do elemento axial são recrutadas em maiores quantidades para pequenos cromossomos, mas na ausência do Hop1, a ligação do Red1 torna-se menos dependente do tamanho dos cromossomas. Trabalhos anteriores utilizando em escala de silico , sugeriram que essa redução resultou de um aumento seletivo no recrutamento de Red1 para cromossomos grandes . Essa abordagem em escala, no entanto, requer a definição de regiões genômicas que não são vinculadas, o que é difícil de ser verificado com proteínas cromossômicas amplamente distribuídas, como o Red1. Portanto, nós reinvestimos esta questão realizando SNP-ChIP do Red1 em um mutante hop1Δ. O SNP-ChIP reproduziu o enfraquecimento previamente encontrado do viés de tamanho cromossômico. Entretanto, o fator de normalização spike-in mostrou uma diminuição global do recrutamento do Red1 para 71,9 ± 4,2% da quantidade de Red1 do tipo selvagem (Fig. 3c, d). Esta diminuição é mais forte em cromossomos pequenos (Fig. 3e). Observamos que a perda leve da ligação Red1 não resulta geralmente em uma perda do viés de tamanho dos cromossomos, porque a deleção das metiltransferases histônicas Set1 e Dot1 causa reduções similares ~ 20% dos níveis globais de recrutamento de Red1, mas não afeta a distribuição da ligação Red1 entre os cromossomos (arquivo adicional 4: Figura S4). Estes dados sugerem que a perda de Hop1 leva a uma redução geral do sinal de Red1 em todos os cromossomos que afeta particularmente os três menores cromossomos.

γ-H2AX níveis não mudam na série de cepas de dosagem de Red1

Para testar se o SNP-ChIP também permite análises quantitativas de modificações protéicas, nós focalizamos a fosforilação da histona H2A na serina 129 (γ-H2AX). Esta modificação é rapidamente induzida após a formação das quebras de DNA de dupla cadeia (DSBs). Na levedura mitótica, a modificação γ-H2AX espalha-se cerca de 50 kb em ambos os lados de um DSB . Além disso, o γ-H2AX constitutivo é encontrado próximo aos telômeros durante todo o ciclo celular . Para analisar a distribuição e dependência do DSB do γ-H2AX na meiose, realizamos SNP-ChIP em uma cepa do tipo selvagem, assim como a série de dosagem Red1, que mostra uma leve (até 30%) redução nos níveis de DSB , e um spo11-Y135F mutante, codificando uma proteína Spo11 catalisada morta, que não forma DSBs meióticos .

Medição γ-H2AX em meiose não revelou diferença entre o tipo selvagem e qualquer uma das cepas com níveis reduzidos de Vermelho1, independentemente do método de cálculo (Fig. 4a, b, c). O sinal uniforme ao longo dos cromossomas é consistente com a propagação da marca γ-H2AX de todos os hotspots de DSB de levedura, que estão distribuídos por todo o genoma, e provavelmente explica porque uma leve redução nos níveis de DSB não leva a uma queda notável no sinal global γ-H2AX. O controle spo11-Y135F, por outro lado, exibiu apenas cerca de 25% dos níveis do tipo selvagem γ-H2AX. O sinal foi nitidamente enriquecido ao lado dos telômeros, com as regiões intersticiais mostrando apenas sinais fracos provavelmente associados à expressão gênica . Estes dados mostram que o sinal do telômero associado ao γ-H2AX também é mantido na prófase meiótica. Além disso, a escala das faixas de sinal indica que o sinal do telômero associado ao γ-H2AX permanece praticamente inalterado no spo11-Y135F mutante, consistente com o fato de que a formação do DSB meiótico é quase indetectável nestas regiões . Juntos, esses dados mostram que o SNP-ChIP permite comparações quantitativas entre experimentos ChIP-seq independentemente do antígeno e, portanto, fornece um método versátil para medir associações globais de cromatina sem a necessidade de epitope tags.

Fig. 4

SNP-ChIP análise de uma modificação de proteína. a γ-H2AX para a série de cepas de dosagem Red1 e um spo11-Y135F mutante em relação ao tipo selvagem produzido pelo SNP-ChIP. b Fragment pileup produzido usando MACS2 com SPMR (fragmgment pileup per million reads) sequenciando a normalização da profundidade em um cromossomo exemplo após a normalização spike-in. c Detalhe dos dados em (b) mostrando um zoom-in na região subtelomérica esquerda

Deixe uma resposta

O seu endereço de email não será publicado.