La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Aplicaciones de Data Mining en ciencia y tecnología Bioinformática

Presentaciones similares


Presentación del tema: "Aplicaciones de Data Mining en ciencia y tecnología Bioinformática"— Transcripción de la presentación:

1 Aplicaciones de Data Mining en ciencia y tecnología Bioinformática
Estudios de expresión génica con microarrays Marcelo A. Soria Maestria en Data Mining. DC-FCEN

2 Expresión diferencial de genes frente a dos tratamientos
gen 3 gen 4 gen n Tratamiento 2 gen 1 gen 2 gen 3 gen 4 gen n Comparación tratamiento 1 vs. tratamiento 2 Marcelo A. Soria Maestria en Data Mining. DC-FCEN

3 Utilizando microarrays se puede analizar la expresión relativa de miles de genes simultáneamente
Una animación sobre experimentos con microarrays: Marcelo A. Soria Maestria en Data Mining. DC-FCEN

4 Puntos importantes (1/2)
Un microarray es un soporte sólido, por ejemplo, un vidrio de 8 x 2,5 cm. Sobre el soporte se diseña una grilla, con tantos números de celdas como genes se van a analizar, más duplicados y controles Sobre cada celda de la grilla se pegan moléculas de ADN complementarias del gen a analizar Marcelo A. Soria Maestria en Data Mining. DC-FCEN

5 Puntos importantes (2/2)
Se realizan los experimentos, se extrae ARNm y después de varios pasos químicos, se agrega el material procesado a los microarrays Se escanea el microarray iluminando con uno o dos láseres de diferentes colores, se procesan las imágenes Se extraen los datos de expresión de la imágen Marcelo A. Soria Maestria en Data Mining. DC-FCEN

6 Experimentos con microarrays. Esquema de trabajo
hipótesis diseño experimental experimento análisis de imágenes pre-procesamiento normalización estimación filtrado agrupamiento análisis enriquecimiento funcional análisis de vias metabólicas integración de los datos Marcelo A. Soria Maestria en Data Mining. DC-FCEN

7 procesamiento de imágenes
Los spots se distribuyen en grillas, cada grilla se corresponde con uno de los probes (o genes) a analizar. A veces las grillas no están bien alineadas entre sí. Puede haber curvaturas dentro de una grilla El espaciado entre los spots puede ser desigual un microarray escaneado Marcelo A. Soria Maestria en Data Mining. DC-FCEN

8 procesamiento de imágenes
Cualquiera sea el tipo de microarray que utilicemos, tenemos que convertir los pixels de la imagen escaneada del microarray en información de expresión escaneado (uno o dos canales)‏ manipulación del contraste estimación preliminar de los centros de los spots eliminar artefactos determinar la localización precisa del spot determinar la forma y tamaño del spot estimar el background Dependiendo del tipo de microarray y de la plataforma, esto proceso puede ser más o menos automatizado Marcelo A. Soria Maestria en Data Mining. DC-FCEN

9 Estrategia de un experimento con un microarray de cDNA
El análisis de expresión con un chip de Affymetrix Marcelo A. Soria Maestria en Data Mining. DC-FCEN

10 normalización Es una colección de métodos para tratar con los errores sistemáticos y los sesgos introducidos por la plataforma experimental utilizada Etapas Limpieza de los datos y transformación Normalización dentro del array (para arrays de 2 canales)‏ Normalización entre arrays Marcelo A. Soria Maestria en Data Mining. DC-FCEN

11 normalización 1. Limpieza de los datos y transformación
Remover spots marcados en el paso anterior Sustracción del background Aplicar logaritmos Marcelo A. Soria Maestria en Data Mining. DC-FCEN

12 normalización 2. Normalización dentro del array (para arrays de 2 canales)‏ Posibles problemas: Las marcas con Cy3 y Cy5 se incorporan diferencialmente Los fluorógenos pueden tener diferentes respuestas de emisión a diferentes abundancias Las emisiones pueden ser medidas diferencialmente a distintas intensidades Problemas de enfoque Marcelo A. Soria Maestria en Data Mining. DC-FCEN

13 normalización Soluciones (1/2): Regresión lineal de Cy5 contra Cy3:
Graficar los logaritmos de las intensidades Ajustar una recta de regresión Reemplazar los valores de Cy3 con los valores ajustados Marcelo A. Soria Maestria en Data Mining. DC-FCEN

14 Ajustar una recta de regresión
normalización Soluciones (2/2): Gráficos MA Graficar para cada spot en el eje x el promedio de los logaritmos de Cy3 y Cy5. Y en el eje y la diferencia entre los logaritmos de los dos canales. Ajustar una recta de regresión Recalcular la diferencia de logaritmos restando el valor ajustado a la diferencia cruda Regresión no-lineal de las diferencias de logaritmos (Regresión Loess)‏ Realizar un gráfico MA Aplicar la regresión Loess Marcelo A. Soria Maestria en Data Mining. DC-FCEN

15 normalización A veces es necesario corregir diferencias de intensidad que varían espacialmente sobre el microarray, en ese caso se pueden aplicar regresiones Loess bidimensionales La causa de esto son las diferencias entre bloques de spots Marcelo A. Soria Maestria en Data Mining. DC-FCEN

16 normalización 3. Normalización entre arrays
Antes de hacer comparaciones entre distintos microarrays tenemos que analizar y eliminar las diferencias entre arrays debidas, por ejemplo, a diferencias entre las reacciones de hibridación que ocurrieron en cada uno. Marcelo A. Soria Maestria en Data Mining. DC-FCEN

17 normalización Soluciones
Realizar un gráfico Box-Plot conjunto para todos los arrays del experimento, para ver diferencias en variabilidad y en valores medios. Asumiendo que las diferencias no tienen origen biológico se puede: Escalar los datos: restarle a cada valor de logaritmos (o log-ratio), la media de su microarrray. Centrarlos: restar la media y dividir por el desvío estándar Normalizar la distribución: 1) ordenar los datos por array de mayor a menor. 2) calcular una nueva distribución, el primer dato es el promedio de los más altos; el segundo, el promedio de los segundos más altos, y así sucesivamente.3) Reemplazar cada medida en cada array con el promedio de la distribución calculada en 3). Marcelo A. Soria Maestria en Data Mining. DC-FCEN


Descargar ppt "Aplicaciones de Data Mining en ciencia y tecnología Bioinformática"

Presentaciones similares


Anuncios Google