SNP-ChIP: un método versátil y libre de etiquetas para cuantificar los cambios en la unión de proteínas a través del genoma

Razón de ser experimental de SNP-ChIP

La premisa básica de SNP-ChIP es que las células de la misma especie pueden servir como material de pincho siempre que alberguen suficiente diversidad genética, principalmente en forma de polimorfismos de un solo nucleótido (SNPs). La señal en cada polimorfismo proporciona una medida independiente de la relación muestra de prueba/pico de entrada que, en conjunto, permite el cálculo de un factor de normalización y el escalado apropiado de los resultados de ChIP-seq (Fig. 1a). Si hay suficiente diversidad genética para permitir que una gran fracción de lecturas de secuenciación se asigne a los genomas de origen, SNP-ChIP permite además la generación de perfiles de distribución de objetivos en todo el genoma. Es importante destacar que, dado que SNP-ChIP utiliza la misma especie como fuente del material de spike-in, funcionará con prácticamente cualquier diana del proteoma del organismo, incluidas las modificaciones postraduccionales, siempre que se disponga de un anticuerpo de grado ChIP.

Fig. 1

SNP-ChIP añade la capacidad de medir cantidades semicuantitativas de proteína diana a la ChIP-seq tradicional. a Pasos principales de SNP-ChIP ejemplificados para dos condiciones hipotéticas. b Niveles de la proteína diana Red1 producidos por SNP-ChIP (equivalente al factor de normalización spike-in de tipo salvaje), comparados con los niveles previamente publicados medidos por western blot (media +/- S.E.M.) . Los puntos representan valores individuales de réplica derivados de SNP-ChIP y las barras representan el valor medio. c Pila de fragmentos producida usando MACS2 con normalización de profundidad de secuenciación SPMR (pila de fragmentos por millón de lecturas) de un cromosoma y región cromosómica de ejemplo antes (panel superior) y después (panel inferior) de la normalización spike-in. d Niveles de la proteína diana Red1 para la serie de cepas de dosificación Red1 comparados con los niveles previamente publicados medidos por western blot (media +/- S.E.M.) , como en (b)

SNP-ChIP de una proteína cromosómica de rápida evolución

Para probar la utilidad de los spike-ins intraespecíficos, recurrimos a los análisis de cromatina en la levadura. Nos centramos específicamente en los cromosomas en la meiosis porque este proceso implica muchas proteínas cromosómicas ampliamente distribuidas y modificaciones postraduccionales. Un ejemplo típico es la proteína de elemento axial Red1, que desempeña un papel importante en la recombinación meiótica. Red1 está ampliamente unida a lo largo de los cromosomas pero, al igual que otros factores meióticos, su secuencia ha divergido incluso en especies estrechamente relacionadas. Además, al igual que muchas proteínas, Red1 no se puede marcar fácilmente sin alterar su función. Estos atributos significan que Red1 no es susceptible de enfoques estándar de spike-in, por lo que es un objetivo particularmente adecuado para SNP-ChIP. Además, existen mutaciones que cambian los niveles generales y la distribución cromosómica de Red1, proporcionando puntos de referencia para evaluar la eficacia de SNP-ChIP.

SNP-ChIP de Red1 se llevó a cabo utilizando el fondo genético SK1 como cepa de prueba y una variante optimizada para la meiosis de la cepa de referencia S288c ampliamente utilizada como spike-in . Para ambos antecedentes genéticos, se dispone de ensamblajes genómicos de extremo a extremo de alta calidad. Estos ensamblajes difieren en unos 76.000 SNPs, espaciados a una distancia media global de 70 pb (archivo adicional 1: Figura S1a) de forma consistente en todos los cromosomas (archivo adicional 1: Figura S1b), lo que constituye una variación suficiente para permitir la asignación inequívoca de una gran proporción de lecturas de secuenciación. Para realizar el SNP-ChIP, las células de prueba (SK1) se mezclaron con una fracción constante de células meióticas en espiga (S288c) antes de someter las mezclas a un protocolo estándar de ChIP-seq. Las lecturas generadas se alinearon con un genoma híbrido construido concatenando los ensamblajes del genoma de prueba y del genoma de espiga. Las lecturas se alinearon con condiciones de coincidencia perfecta, excluyendo cualquier lectura que se alineara con más de una localización. Por consiguiente, cualquier lectura que se superponía a por lo menos un SNP se asignaba a un genoma y una localización genómica específicos, mientras que las lecturas que no se superponían a un polimorfismo se asignaban a ambos genomas y por lo tanto se descartaban.

Investigamos inicialmente la capacidad de SNP-ChIP para detectar cambios en la asociación de la cromatina resultantes de la producción reducida de proteínas. El alelo red1ycs4S está causado por una mutación en el promotor de RED1 que conduce a una reducción de los niveles de Red1 a aproximadamente el 20-25% del tipo salvaje y a una pérdida casi completa de elementos axiales observables citológicamente . Es importante destacar que el análisis ChIP-seq tradicional no pudo detectar este cambio en la abundancia de la proteína y produjo perfiles de Red1 indistinguibles entre el tipo salvaje y los mutantes red1ycs4S . Por el contrario, cuando aplicamos el SNP-ChIP para comparar estas dos cepas, los niveles reducidos de unión de Red1 fueron fácilmente evidentes (Fig. 1b). El cálculo de un factor de normalización basado en la abundancia relativa de la muestra total y de las lecturas de spike-in dio como resultado un nivel de Red1 en el mutante red1ycs4S del 28,8 ± 5,1% (S.D.) del tipo salvaje, lo que coincide con el cambio reportado en los niveles de Red1 obtenidos del análisis occidental. Este factor de normalización permitió un escalado adecuado de la señal de los perfiles de ChIP-seq para las dos condiciones (Fig. 1c).

SNP-ChIP se validó además aplicándolo a una serie de dosis de Red1, que consiste en diferentes combinaciones de alelos de RED1 (RED1, red1ycs4S, red1Δ) produciendo una disminución escalonada de los niveles de Red1 (Fig. 1d) . Las mediciones SNP-ChIP de la asociación de cromatina de Red1 en esta serie volvieron a coincidir con los niveles de proteína previamente publicados (Fig. 1d). De hecho, las mediciones SNP-ChIP parecían más precisas que el análisis cuantitativo del oeste, que no pudo resolver la reducción esperada en los niveles de proteína entre las células RED1/red1ycs4S y RED1/red1Δ . En conjunto, estos datos demuestran que SNP-ChIP mide con precisión las reducciones en la unión global de Red1 en una amplia gama de niveles de proteínas objetivo.

SNP-ChIP es robusto a la variación en la profundidad de secuenciación y la fracción de células con picos

Utilizamos varios enfoques para probar la robustez técnica de SNP-ChIP. Las tecnologías de secuenciación de alto rendimiento producen un número variable de lecturas por muestra, dependiendo de factores como el instrumento de secuenciación y la mutiplexación de la muestra. Para modelar el efecto de una menor profundidad de secuenciación en la reproducibilidad del análisis SNP-ChIP, submuestreamos las lecturas de las muestras inmunoprecipitadas y de entrada de las condiciones de prueba de tipo salvaje y red1ycs4S a diferentes profundidades (que van de 1 a 10 millones de lecturas). El trazado del tamaño de la submuestra frente al número de lecturas alineadas mostró una correlación perfectamente lineal para todas las muestras (Fig. 2a), indicando que un amplio rango de profundidades de secuenciación producirá información cuantitativa robusta por SNP-ChIP. Para estas condiciones de prueba particulares, la fracción de lecturas que se alinean con un genoma específico, y por lo tanto se mantienen en el análisis, fue de alrededor del 20% para el tipo salvaje y del 30% para el red1ycs4S. Calculamos el factor de normalización spike-in utilizando todas las 10.000 combinaciones posibles de submuestras de lecturas (10 submuestras de lecturas que van de 1 a 10 millones de lecturas para cada una de las cuatro muestras secuenciadas: ChIP de tipo salvaje y muestras de entrada más ChIP de red1ycs4S y muestras de entrada) y encontramos una distribución muy ajustada de los resultados (0,2848 ± 0,0015, S.D.; Fig. 2b). Esto establece que la profundidad de la secuenciación no necesita ser equilibrada entre las muestras inmunoprecipitadas y de entrada, o entre las diferentes condiciones, para producir proporciones precisas de lecturas que mapean a la prueba y a los genomas del pico.

Fig. 2

SNP-ChIP es robusto a la variación tanto en la profundidad de secuenciación como en la cantidad de células spike-in. a Número de lecturas alineadas en SNP-ChIP como función del tamaño total de la muestra de lecturas crudas. Se obtuvieron submuestras sistemáticas de lecturas crudas de tamaño 1 a 10 millones para cada muestra y se mapearon al genoma híbrido SK1-S288c. b Distribución de los factores de normalización de spike-in calculados usando todas las 10.000 combinaciones posibles de submuestras de lecturas en (a). El recuadro es un zoom en una ventana estrecha del eje x donde se encuentran todos los valores. c Porcentaje de lecturas que se alinean con el genoma spike-in en la muestra de entrada frente a la muestra inmunoprecipitada (ChIP) para las cepas de tipo salvaje y red1-pG162A. Nota: En contraste con red1ycs4S, que contiene una región introgresada con docenas de SNP que rodean el locus RED1, el mutante red1-pG162A sólo lleva la mutación causante del promotor. d Factor de normalización de spike-in resultante de tipo salvaje (equivalente a la cantidad de Red1) en la cepa red1-pG162A después de realizar SNP-ChIP con porcentajes de células spike-in añadidas que varían de 5 a 30%. Los resultados sugieren que proporciones de material spike-in del 15% y superiores son apropiadas para SNP-ChIP

Otra condición que puede afectar a los resultados de SNP-ChIP es la cantidad de material spike-in añadido a las muestras. Los métodos de normalización de spike-in asumen una relación lineal entre la cantidad de material spike-in y la proporción resultante de lecturas spike-in en la muestra inmunoprecipitada. Esta condición es esencial para que los resultados sean independientes de la cantidad de material spike-in. Para verificar esta suposición, preparamos muestras con proporciones de células spike-in que iban del 5 al 30%. Como muestras de prueba utilizamos el tipo salvaje y una cepa con una única mutación del promotor red1-pG162A que fenocopia el alelo red1ycs4S. Mientras que red1ycs4S contiene una región genómica introgresada con docenas de SNPs que rodean el locus RED1, el mutante red1-pG162A fue diseñado para llevar sólo la mutación específica responsable de la reducción de los niveles de Red1 . Como se muestra en la Fig. 2c, la proporción de lecturas de pico en las muestras de entrada (que reflejan la cantidad de material de pico añadido a la muestra de prueba) se correlaciona linealmente con la proporción resultante de lecturas de pico en la muestra inmunoprecipitada, tanto para el tipo salvaje como para la muestra red1-pG162A. Además, la muestra red1-pG162A produjo una cantidad de Red1 muy similar a la del alelo red1ycs4S (28,8% frente al 28,1% del tipo salvaje, respectivamente, cuando se utilizó el 20% de células spike-in), lo que apoya aún más la solidez del método. Los porcentajes bajos de células spike-in (5 y 10%) dieron lugar a estimaciones algo mayores de la cantidad de Red1 (Fig. 2d), probablemente debido al aumento del ruido. Estos resultados sugieren que las proporciones de material spike-in del 15% y superiores son apropiadas para SNP-ChIP. Todos los otros experimentos mostrados aquí utilizaron una proporción de spike-in del 20%.

Finalmente, investigamos el impacto del método de cálculo para computar el factor de normalización de spike-in. El factor de normalización SNP-ChIP calculado en los ejemplos mostrados hasta ahora se basa en los recuentos de lectura totales alineados con la prueba y los genomas spike-in. Un método alternativo es calcular el valor medio escalar de la puntuación de apilamiento de lecturas alineadas. Probamos la utilidad de esta alternativa calculando la puntuación de apilamiento en (1) todas las posiciones genómicas, (2) sólo en las posiciones SNP, o (3) en las posiciones SNP que caen dentro de los llamados picos de señal (véase la sección Métodos). El último enfoque excluirá efectivamente las regiones que se espera que contengan sólo una señal de fondo, junto con cualquier región falsamente negativa. Encontramos valores muy similares y una alta concordancia entre los cuatro métodos en todos los casos (archivo adicional 2: Figura S2a), aunque los apilamientos de lecturas producen sistemáticamente valores ligeramente más bajos que el método de recuento de lecturas (archivo adicional 2: Figura S2b). En general, sin embargo, la diferencia es relativamente pequeña y creemos que el método basado en el recuento de lecturas, que es computacionalmente mucho más simple, representa una aproximación apropiada, al menos para proteínas ampliamente distribuidas.

Perfiles de unión obtenidos directamente de experimentos SNP-ChIP

La principal utilidad de SNP-ChIP es la generación de un factor de normalización que permite escalar los perfiles obtenidos por los experimentos ChIP-seq tradicionales ejecutados en las mismas condiciones (Fig. 1c). Dada la amplia distribución de SNPs en los dos genomas analizados, exploramos la posibilidad de que SNP-ChIP pudiera también producir directamente perfiles de unión informativos, aunque esta aplicación está claramente limitada por la densidad de SNPs disponible. La comparación de una muestra secuenciada con spike-in con los datos obtenidos utilizando una muestra replicada, no spiked, muestra que las pistas de señal de las muestras spiked reflejan estrechamente las del control no spiked, aunque se pueden ver algunos huecos de señal en la muestra spiked (Archivo adicional 3: Figura S3a; ejemplos indicados por las flechas rojas). Por lo tanto, como era de esperar, el uso de picos de la misma especie provoca cierta pérdida de información. Este problema parece insignificante para los picos anchos, ya que los llamados picos muestran una concordancia muy estrecha (archivo adicional 3: Figura S3b). Los picos estrechos muestran más desacuerdo, con sólo un tercio de los picos llamados que se solapan entre las dos muestras. Estos datos indican que SNP-ChIP también puede proporcionar información directa sobre la distribución de la proteína, en particular para los patrones de unión a gran escala.

Los niveles globales de Red1 se reducen en los mutantes de cohesina y hop1∆

Intentamos aplicar SNP-ChIP para investigar situaciones de mutantes que causan una amplia redistribución de la proteína. La redistribución es un reto para los métodos de cuantificación tradicionales, como ChIP-qPCR, porque la identificación de las regiones que permanecen sin unirse no es trivial. En ausencia de la subunidad de cohesina conservada Rec8, la distribución de Red1 a lo largo del genoma cambia drásticamente, mostrando grandes regiones de agotamiento que se alternan con densos grupos de unión. Sin embargo, no está claro si los niveles generales de unión de Red1 cambian en los mutantes Rec8∆. Empleamos SNP-ChIP para abordar esta cuestión y encontramos una pronunciada disminución de los niveles generales de unión de Red1 (Fig. 3a). La comparación directa de la ocupación de Red1 a lo largo de dos cromosomas de ejemplo ilustra tanto la dramática redistribución como la disminución general de la unión de Red1 en comparación con el tipo salvaje (Fig. 3b). Por lo tanto, la Rec8-cohesina es esencial para el enriquecimiento cromosómico completo de Red1.

Fig. 3

Análisis SNP-ChIP en mutantes con redistribución de dianas a gran escala. a Niveles de la proteína diana Red1 en un mutante rec8∆ en relación con el tipo salvaje producido por SNP-ChIP. Los puntos representan los valores de las réplicas individuales y las barras representan el valor medio. b Los apilamientos de fragmentos normalizados en cepas de tipo salvaje y mutantes rec8∆ producidos mediante MACS2 con normalización de la profundidad de secuenciación SPMR (apilamiento de fragmentos por millón de lecturas) trazados en dos cromosomas de ejemplo. c Niveles de Red1 en el mutante hop1∆ en relación con el tipo silvestre producidos por SNP-ChIP (como en a). d Apilamientos de fragmentos normalizados en el tipo silvestre y en las cepas mutantes hop1∆ (como en b). e Señal media de Red1 normalizada en cromosomas individuales en un mutante hop1∆

Hop1 es otra importante proteína del elemento axial de la levadura que interactúa físicamente con Red1 . Las proteínas del elemento axial se reclutan en mayores cantidades en los cromosomas pequeños, pero en ausencia de Hop1, la unión de Red1 se vuelve menos dependiente del tamaño del cromosoma . Trabajos anteriores que utilizaban el escalado in silico , sugerían que esta reducción era el resultado de un aumento selectivo del reclutamiento de Red1 a los cromosomas grandes . Sin embargo, este enfoque de escalado requiere la definición de las regiones genómicas que no se unen, lo cual es difícil de determinar con proteínas cromosómicas ampliamente distribuidas como la Red1. Por lo tanto, volvimos a investigar esta cuestión realizando SNP-ChIP de Red1 en un mutante hop1Δ. El SNP-ChIP reprodujo el debilitamiento del sesgo del tamaño del cromosoma encontrado anteriormente. Sin embargo, el factor de normalización de los picos mostró una disminución general del reclutamiento de Red1 al 71,9 ± 4,2% de la cantidad de Red1 de tipo salvaje (Fig. 3c, d). Esta disminución es más fuerte en los cromosomas pequeños (Fig. 3e). Observamos que la pérdida leve de la unión de Red1 no suele dar lugar a una pérdida del sesgo del tamaño de los cromosomas, ya que la deleción de las histonas metiltransferasas Set1 y Dot1 provoca reducciones similares del ~ 20% de los niveles generales de reclutamiento de Red1, pero no afecta a la distribución de la unión de Red1 entre los cromosomas (archivo adicional 4: figura S4). Estos datos sugieren que la pérdida de Hop1 conduce a una reducción general de la señal de Red1 en todos los cromosomas que afecta particularmente a los tres cromosomas más pequeños.

Los niveles deγ-H2AX no cambian en las series de cepas de dosificación de Red1

Para probar si SNP-ChIP también permite realizar análisis cuantitativos de las modificaciones proteicas, nos dirigimos a la fosforilación de la histona H2A en la serina 129 (γ-H2AX). Esta modificación se induce rápidamente tras la formación de roturas de doble cadena de ADN (DSBs) . En la levadura mitótica, la modificación γ-H2AX se extiende unos 50 kb a cada lado de un DSB . Además, el γ-H2AX constitutivo se encuentra cerca de los telómeros durante todo el ciclo celular. Para analizar la distribución y la dependencia de DSB de γ-H2AX en la meiosis, realizamos SNP-ChIP en una cepa de tipo salvaje, así como en la serie de dosificación Red1, que muestra una leve (hasta un 30%) reducción de los niveles de DSB , y en un mutante spo11-Y135F, que codifica una proteína Spo11 catalíticamente muerta, que no forma DSBs meióticos .

La medición de los niveles de γ-H2AX en meiosis no reveló ninguna diferencia entre el tipo salvaje y ninguna de las cepas con niveles reducidos de Red1, independientemente del método de cálculo (Fig. 4a, b, c). La señal uniforme a lo largo de los cromosomas es consistente con la propagación de la marca γ-H2AX desde todos los puntos calientes de DSB de la levadura, que están distribuidos por todo el genoma, y probablemente explica por qué una leve reducción en los niveles de DSB no conduce a una caída notable en la señal global de γ-H2AX. El control spo11-Y135F, por otra parte, mostró sólo un 25% de los niveles de γ-H2AX de tipo salvaje. La señal estaba notablemente enriquecida junto a los telómeros, y las regiones intersticiales sólo mostraban señales débiles probablemente asociadas a la expresión génica. Estos datos muestran que la señal constitutiva de γ-H2AX asociada a los telómeros se mantiene también en la profase meiótica. Además, el escalado de los rastros de señal indica que la señal γ-H2AX adyacente a los telómeros permanece prácticamente inalterada en el mutante spo11-Y135F, lo que concuerda con el hecho de que la formación de DSB meióticos es casi indetectable en estas regiones. En conjunto, estos datos demuestran que SNP-ChIP permite realizar comparaciones cuantitativas entre los experimentos ChIP-seq independientemente del antígeno y, por tanto, proporciona un método versátil para medir las asociaciones globales de la cromatina sin necesidad de etiquetas epitópicas.

Fig. 4

Análisis SNP-ChIP de una modificación de la proteína a Niveles de γ-H2AX para la serie de cepas de dosificación Red1 y un mutante spo11-Y135F en relación con el tipo salvaje producido por SNP-ChIP. b Apilamiento de fragmentos producido utilizando MACS2 con normalización de la profundidad de secuenciación SPMR (apilamiento de fragmentos por millón de lecturas) en un cromosoma de ejemplo después de la normalización spike-in. c Detalle de los datos en (b) mostrando un zoom en la región subtelomérica izquierda

.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.