Clustering de Pixels basado en el Modelo El nivel de expresión de un gen es proporcional a las intensidades de los pixels de un spot. Los pixels de un.

Slides:



Advertisements
Presentaciones similares
Las distribuciones binomial y normal.
Advertisements

INTRODUCCION A LAS TELECOMUNICACIONES
Aplicaciones de Data Mining en ciencia y tecnología Bioinformática
Cluster.
Programación Básica con NQC Pedro F. Toledo – Patricio Castillo 18/08/2006.
} LISSET BÁRCENAS MONTERROZA
La prueba U DE MANN-WHITNEY
GEOESTADISTICA MULTIVARIADA
Muestreo para la inspección por atributos
INFERENCIA ESTADISTICA
2color.
Mario Bidegain (FC) – Alvaro Diaz (FI) – Marcelo Barreiro (FC)
Clustering (Agrupamiento)
Cap. 33 – Corriente Alterna
COMPARACIONES PAREADAS
Procesamiento digital de Imágenes
Análisis exploratorio de datos univariados
El valor del pixel (tono de gris) varia de una manera continua
Estadística aplicada al análisis financiero
DIVISIÓN DE POLINOMIOS 1
Medidas de expresión para microarrays de Affimetrix.
Introducción a las imágenes digitales
Estadística Administrativa II
ANALISIS DE DATOS CATEGORICOS
Análisis de series de tiempo Cuarta semana Abril Julio 2009.
Capítulo 5: El Transistor de Efecto Campo (FET)
Vectores Aleatorios 1 Distribución conjunta de un vector aleatorio
Cap. 18 Temperatura, Calor y La Primera Ley de la Termodinámica
Análisis de Conglomerados (Cluster Analysis)
Distribuciones derivadas del muestreo
Cátedra de Biomateriales Dentales
MÉTODO DE PIXELES DE BORDE
ESTIMACIÓN DE COEFICIENTES DE MÁXIMA VEROSIMILITUD
Unidad V: Estimación de
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
Marcas de agua en el dominio del espacio Realizado por: Alejandro Pazos Castillo José Antonio Mateos García Aplicación práctica orientada a la Esteganografía.
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
Elaboración de gráficas
El promedio como variable aleatoria: error estándar e intervalo de confianza para la media de la muestra Mario Briones L. MV, MSc 2005.
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Fracciones Una fracción, en general, es la expresión de una cantidad dividida por otra, y una fracción propia representa las partes que tomamos de un.
ELO3201 Análisis de Algoritmos (Cont.) Agustín J. González ELO320 1º sem 2004.
Tema 3: Filtros.
Filtros.
Eliminación de ruido y Tratamiento de partes alargadas en imágenes digitales.
LABORATORIO Sesión 3 COMPARACIÓN DE DOS POBLACIONES.
Aprendizaje no Supervisado: Clustering
Capítulo 1. Conceptos básicos de la Estadística
Analisis de datos en imagenes hiperespectrales: intro 1 Analisis de datos hiperespectrales: otra revisión Hyperespectral image data analysis, D. Landgrebe,
Tema 6: Morfología Segunda parte.
ELO3201 Análisis de Algoritmos (cont.) Agustín J. González ELO320 1º sem 2002.
UNIDAD 1.- EVALUACIÓN DE DATOS ANALITICOS
Donuts, Scratches and Blanks: Robust Model-Based Segmentation of Microarray Images Qunhua Li, Chris Fraley, Roger E. Bumgarner, Ka Yee Yeung, Adrian E.
MANTENIMIENTO PREVENTIVO
Próximo tutorial 4-1. Procesamiento de imágenes digitales.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Aproximaciones y Errores
Conceptos Preprensa 4.
Guadalupe Martínez Hernández.  La tarea de la Segmentación de imágenes es de : Encontrar un grupo de pixeles “juntos”.  En estadística este problema.
Procesamiento de imágenes digitales
METODOS DE BUSQUEDA EN C++ Oscar Michel Ruiz León
Funciones Continuidad de una función Tipos de discontinuidad
MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO (“mas”)
El objetivo de la segmentación es dividir (segmentar) y separar la información original para generar nuevas imágenes que representen las estructuras internas.
Clase N°11 Métodos de reducción de varianza
CAPACITACIÓN, INVESTIGACIÓN, ESTADÍSTICA Y MERCADEO
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Medidas de tendencia central
Suma de Intensidades.
Transcripción de la presentación:

Clustering de Pixels basado en el Modelo El nivel de expresión de un gen es proporcional a las intensidades de los pixels de un spot. Los pixels de un artefacto, por ejemplo un “scratch”, tendrán intensidades distintas a los del background o foreground. De esto se desprende naturalente la clasificacion de los pixeles segun sus intensidades

Clustering de Pixels basado en el Modelo En clustering basado en el modelo, los datos de intensidades se consideran como provenientes de una mezcla de densidades: A partir del histograma de intensidades de un spot, parece natural considerarlo como una mezcla de normales. La funcion de verosimilitud es para los datos:

Histograma de intensidades de un spot

Para un K fijo los valores de Σ i, µ i y p i, pueden estimarse usando el algoritmo E-M jerárquico de clustering basado en el modelo (Dasgupta y Raftery, 1998). El numero de K puede ser estimado usando el BIC (Bayes information criterion). Para combinar ambas señales, se suman. En la mayoría de los casos se espera que el número de grupos, K, sea a lo sumo 3. Por eso, el BIC se restringe a K menor o igual a 3. – K = 1, no hay spot, es un blanco. – K = 2, hay un spot y el background. – K = 3, hay un spot, un artefacto o agujero interno y background.

Extracción del Componente Conectado Espacialmente Los artefactos, por lo general, se encuentran en grupos pequeños inconexos. Por este motivo, establecer una tamaño límite de componentes conectados en un cluster permite identificar clusters formados por artefactos. Para dividir a los clusters en componentes conectados espacialmente, se utiliza el procedimiento de etiquetado de los 4 componentes vecinos conectados (4-neighbor connected component labeling procedure). Por defecto, sólo se conservan los componentes conectados con un tamaño mayor a los 100 pixels, que representa la sexta parte del tamaño típico de un spot. Los clusters más brillantes y más oscuros que pasen el tamaño límite se clasifican como foreground y background, respectivamente. Si sólo un cluster pasa el tamaño límite, se concluye que no hay spot y que esa ubicación está en blanco.

Estimación de la Intensidad La estimación de la intensidad del foreground en el canal Cy3 es el promedio de los pixels en el cluster foreground. Lo mismo ocurre para el canal foreground Cy5, donde los mismos pixels están en el cluster para ambos canales. Las intensidades del background para los dos canales se estiman de la misma manera. Cuando se identifican 3 clusters, el cluster intermedio también se descarta, pues generalmente consiste en pixels “sospechosos, como por ej., un agujero interno, un artefacto, o un borde difuso. La señal estimada es: Is = If – Ib, donde If e Ib son las intensidades medias del foreground y background, respectivamente. La señal verdad es siempre >0, pero ocasionalmente, la señal estimada puede ser < 0. En este caso se asume que la intensidad verdadera es pequeña pero positiva, y se setea Is como el 5to percentil de las señales del spot en el arreglo.