Trabajo del grupo ISG UPV-EHU en clasificación supervisada para DNA microarrays (mayo’00-junio’02) Proyecto Elvira II Albacete, Junio 2002.

Slides:



Advertisements
Presentaciones similares
Instituto Tecnológico de Saltillo Inteligencia Artificial
Advertisements

Jacqueline Chávez Cuzcano
DATA MINING MINERIA DE DATOS Gersom Costas.
Algoritmos de Minería Los métodos básicos.
BLAST.
EDSI Universidad del Cauca 2011
Journal Citation Reports
Aprendizaje Automatizado
K-NN: K vecinos más cercanos
TMiner Data Mining en Java
GeNie GeNie: entorno de desarrollo para la
¿Qué es el Cáncer? El cáncer es un sistema renegado de crecimiento que se origina dentro del biosistema de un paciente, más comúnmente conocido como el.
LA PROGESTERONA Y EL CARCINOMA DE MAMA
Licenciatura en Bioquímica José L. Oliver
Hacia la medicina personalizada
ALGORITMO GENÉTICO John Henry Holland (n. 02 de febrero 1929, Fort Wayne, Indiana, EE.UU.) ostenta los títulos de Profesor de Psicología y Profesor de.
Representación del Conocimiento
Aprendizaje Automatizado
REDES BAYESIANAS Y DECISIÓN ESTADÍSTICA
Prueba Suficiencia Investigadora Doctorando: Rosa Filgueira Vicente Tutor: David Expósito Singh 27 Febrero 2007.
Recursos en español en la Biblioteca de la Universidad Kean Recursos en español en la Biblioteca de la Universidad Kean Kean University Library Spanish-Language.
Análisis Discriminante
TECNICAS DE EVALUACIÓN DE ALGORITMOS DE APRENDIZAJE
Sesión 2: Métodos Probabilísticos Básicos
1 Eliminación de variables para diagramas de influencia con nodos super valor Manuel Luque Gallego Proyecto Elvira II San Sebastián de Mayo de 2004.
Programa de formación Criterios de evaluación de revistas vs. bases de datos Carlos Agudelo Instituto de Salud Pública Colombia Publindex (Colombia) y.
Aprendizaje Automático en Bioinformática
Perfiles de expresión génica y diagnóstico/pronóstico en cáncer
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
3. Funciones discriminantes para la f.d.p normal.
Aprendizaje Automatizado Ár boles de Clasificación.
Reconocimiento de Patrones
BIOINFORMÁTICA: INTERFAZ WEB PARA MOSTRAR LAS RELACIONES DE EXPRESIÓN ENTRE GRUPOS DE GENES Autor: Jose Luis Aylas Flores Direcció: Mario Huerta (IBB-UAB)
Control basado en redes neuronales
ELVIRA II -- Granada’03 TRABAJO REALIZADO POR EL GRUPO I.S.G. (UPV-EHU) Junio’02  Mayo’03.
Raquel Guardia Villalba
BIOINFORMÁTICA: INTERFAZ WEB PARA MOSTRAR QUE RELACIONES MANTIENEN LOS GENES AL EXPRESARSE. Alberto Medrano Nájera Tutores: Mario Huerta Jordi Gonzàlez.
TOPICOS DE ECONOMETRIA APLICADA Sistemas de Ecuaciones y Variables dependientes limitadas Estimación de Sistemas de Demanda con Corrección de Sesgo por.
Principio de la presentación © Prof. Dr. François E. Cellier Modelado Matemático de Sistemas Físicos Febrero 5, 2008 El Algoritmo de Tarjan para la Ordenación.
Intelligent Systems Group U.P.V. / E.H.U. APORTACIONES EN EL SOFTWARE ELVIRA: MAYO’03-MAYO’04 GRUPO ISG, UPV-EHU Donostia, 14-V-2004.
Presentation Created by Dr. Luis O. Jiménez Design & Validation of Classifiers Machine Learning Design & Validation of Classifiers.
Escalabilidad en los Algoritmos de Aprendizaje de Redes Bayesianas ISL – Dpto de Informática – UCLM - Albacete.
Bioinformática Predicción estructural y funcional Máster Biomedicina
BioInformática Una nueva ciencia Interdisciplinar Norberto Díaz Díaz Bioinformatics Group of Seville (BIGS) Dpto. de Lenguajes y Sistemas Informaticos.
Introducción al Biclustering
Presentación del Área de Teoría de la Computación en la UNAM Sergio Rajsbaum Instituto de Matemáticas, UNAM Enero 29, 2004.
Discriminant Analysis. Two classification problems Discrimination Cluster.
Departamento de Matemática Aplicada I Curso 2002/2003. Universidad de Sevilla Manuel Blanco Guisado David Martínez González Raúl Palomino Sánchez Procesamiento.
TRANSCRIPTOMICA & PROTEOMICA
Bioinformática Introducción. Bioinformática Definición intuitiva Conjunto de herramientas informáticas que sugieren soluciones a problemas biológicos.
Taller Europeo de la Red Eureka Investigación en Minería de Datos José C. Riquelme Universidad de Sevilla Granada, 7 y 8 de Julio.
INTELIGENCIA ARTIFICIAL. Redes Neuronales Artificiales Mecanismos de aprendizaje ◦ Entrada x ◦ Salida y ◦ Peso w ◦ Transferencia ~
UNIVERSIDAD SIMÓN BOLIVAR – GRUPO GID-045 MODELAJE MATEMATICO Y SIMULACION /06/2012 Grupo de Modelaje Matemático y Simulación Profesores integrantes:
GreenData © Tel Soporte para la implantación de ISI WEB OF KNOWLEDGE Formación de usuarios Parte III.
American Association for the Advancement of Science AAAS - American Association for the Advancement of Science – organización internacional dedicada a.
Aplicación JAVA implementando Arboles de Decisión
© Copyright Ebiointel,SL 2006 Recursos para el análisis de secuencias The Biocatalog.
Daniel Sánchez Santolaya Tutores: Mario Huerta(IBB) Jordi Gonzàlez(CVC)
ALGORITMO FLOYD WARSHALL
Técnicas de Minería de Datos Centro Universitario Valle de México Minería de Datos Dra. Maricela Quintana López Elaborado por:
Tópicos en Inteligencia Artificial I Universidad Católica San Pablo.
Tema 4. Repercusiones sociales de la genética. Es el resultado de aplicar los principios filosóficos de la ética a los hallazgos científicos relacionados.
Tecnología en Bioquímica y Biología Molecular.
CARACTERÍSTICAS ESPECIALES DE LA EXTRACCIÓN DE CONOCIMIENTO DE INFO. NO ESTRUCTURADA Objetivos ligeramente Especiales: Búsqueda de Información Relevante.
Repercusiones sociales de la genética El material genético no es fijo ni invariable: Repercusiones sociales de la genética.
Support Vector Machines.  Vocabulario básico: ◦ Repositorio de datos ◦ Atributos y Instancias ◦ Aprendizaje supervisado  Clasificación (Clase) ◦ Aprendizaje.
Fecha de descarga: 6/23/2016 Copyright © McGraw-Hill Education. Todos los derechos reservados. Desarrollo de estudios independientes de cultivos de un.
Conclusiones: En este trabajo se ha demostrado que se pueden aplicar los algoritmos OCH al ajuste de los parámetros de un modelo borroso mediante la discretización.
“Implementación de una técnica de bajo costo para la detección de mutaciones en el gen BRCA1 relacionadas con el desarrollo del cáncer de mamas” Dr. Alejandro.
i=2I.
Transcripción de la presentación:

Trabajo del grupo ISG UPV-EHU en clasificación supervisada para DNA microarrays (mayo’00-junio’02) Proyecto Elvira II Albacete, Junio 2002

DNA microarray Filas  genes; Columnas  casos, muestras, biopsias, ejemplos, ‘cell-lines’...

¿Selección de genes en DNA microarray ‘supervisados’? Area ‘pequeña’ dentro de la Bioinformática. Dimensionalidad altísima (> 1,000). Problemas supervisados: existe la variables clase. Literatura: Brazma & Vilo’00, CAMDA’00-01, Golub’99, Beibel’00... En CAMDA  se cita la ‘selección de variables’ (Feature Subset Selection = FSS) como un ‘topic’. Coincidencias: pocos genes... ¿soprendente? No tanto... Y buen porcentaje de bien clasificados. Técnicas de clasificación supervisada utilizadas: SVM, Discriminant Analysis,..., K-NN, Naive-Bayes, Arboles de decision, Reglas de decisión (IF-THEN). Explicatividad & comprensibilidad: árboles, reglas.

Varios ejemplos de DNA microarrays DOMINIOCLASEGENES Colon Biopsia: ‘tumor’ vs. ‘normal’ 2,000 Leukemia Tipos leucemia: AML, ALL 7,129 NCI-60 9 tipos de tumores 1,376 Alizadeh’00 2 tipos de linfomas: ‘center B- like’, ‘activates B-like’ 2,984 Chen’02 Hepato celular carcinoma vs. Ausencia de tumor en hígado 17,400 Garber’01 Subtipos de cáncer de pulmón 24,000

Nuestras líneas de trabajo Algoritmo de búsqueda: búsqueda secuencial, algoritmos EDAs. Función de evaluación: wrapper más que filter  son posibles los tiempos de cómputo  búsqueda en el ‘areas’ de pocos genes. Algoritmos de clasificación: K-NN, Naive-Bayes, árboles de clasificación, reglas IF-THEN... Software: propio y MLC++ (Stanford – SGI). Nuestro ‘Talón de Aquiles’: Interpretación ‘biológica’ de los resultados (modelos clasificatorios, genes escogidos, porcentajes de error...). ‘Formación’ & ‘creación’ de las matrices de datos desde SMD.

Trabajos desarrollados R. Blanco, P. Larrañaga, I. Inza, B. Sierra (2001). “Selection of highly accurate genes for cancer classification by estimation of distribution algorithms”. Workshop of Bayesian Models in Medicine (AIME). I. Inza, B. Sierra, R. Blanco, P. Larrañaga (2002). “Gene selection by sequential search wrapper approaches in microarray cancer class prediction”. Journal of Intelligent and Fuzzy Systems.

Otras líneas aparte de la selección de genes Algoritmo K-NN: pesado de atributos, búsqueda de los pesos óptimos. 3 estados de relevancia en genes: underexpressed, baseline, overexpressed. Redes Genéticas: Dimensionalidades ingentes  ¿Red Bayesiana? Red Bayesiana “con simplificaciones”: número máximo de padres... Aproximaciones por bootstrap. CAUSALIDAD  en vez de “atacarlo” directamente, se plantea estudiar las propiedades de las relaciones: Relaciones de padre hijo o “esposos” “fuertes”. Gen que “media” la relación directa entre otros dos: CI(X,Y|Z) Activar / Inhibir: influencia directa de uno de los padres al mantener los valores de los demás “fijos”. Detección de “subredes funcionales”.

Referencias de interés Congresos: CAMDA: Critical Assesment of Microarray Data Analysis ISMB: International Symposium on Molecular Biology Revista: “Bioinformatics” Lugares web: Stanford Genomic Resources  Stanford Microarray Database Hebrew University (N. Friedman, D. Pe’er, I. Nachman...) Tel Aviv University (R. Shamir) Human Genome Working Draft: