Escola Tècnica Superior d’Enginyeria Realizado por : José Fernández Márquez Director : Jordi González Sabaté (CVC-UAB) Codirector 1 : Mario Huerta (IBB-UAB)

Slides:



Advertisements
Presentaciones similares
Agrupamiento de relaciones no lineales entre expresiones de genes
Advertisements

ACIDE A C onfigurable I ntegrated D evelopment E nvironment (Un entorno integrado de desarrollo configurable)
Trabajo del grupo ISG UPV-EHU en clasificación supervisada para DNA microarrays (mayo’00-junio’02) Proyecto Elvira II Albacete, Junio 2002.
Búsqueda de Ancestros Comunes Para Genomas de Diferentes Especies
BIOINFORMÁTICA: INTERFAZ WEB PARA MOSTRAR LAS RELACIONES DE EXPRESIÓN ENTRE GRUPOS DE GENES Autor: Jose Luis Aylas Flores Direcció: Mario Huerta (IBB-UAB)
Raquel Guardia Villalba
BIOINFORMÁTICA: INTERFAZ WEB PARA MOSTRAR QUE RELACIONES MANTIENEN LOS GENES AL EXPRESARSE. Alberto Medrano Nájera Tutores: Mario Huerta Jordi Gonzàlez.
Daniel Sánchez Santolaya Tutores: Mario Huerta(IBB) Jordi Gonzàlez(CVC)
Consejería de Vivienda y Ordenación del Territorio Instituto de Cartografía de Andalucía LA INFORMACIÓN GEOGRÁFICA AL ALCANCE DE LOS CIUDADANOS.
IMPLEMENTACIÓN Andrés Pérez López Marzo 2012 Andrés Pérez López Marzo 2012 Development of a SuperCollider3 Class Library for Algorithmic Composition by.
GERENCIA DE TECNOLOGÍA DE LA INFORMACIÓN Julio 2010 INSTITUTO NACIONAL DE TIERRAS SISTEMA FÉNIX / OMAKON.
DISEÑO DE UN SISTEMA DE AUTOARCHIVO Y GESTION DE ARCHIVOS DIGITALES PARA FAUBA DIGITAL: Trabajo colaborativo en una biblioteca universitaria pública Vanesa.
Ofelia Cervantes Redes Dinámicas 1. Ofelia Cervantes Redes dinámicas en Gephi REDES DINÁMICAS: se van construyendo y visualizando en tiempo real Pasos.
Mejora de un modelo de extrapolación de mapa de compresor Autor: Raúl Arco Hierves Director: Roberto Navarro García Director experimental: Daniel Tarí.
Evolución de los MOOC en el ámbito investigador mediante técnicas de análisis de contenido D. G. Reina, S. L. Toral, M. R. Martínez-Torres, F. Barrero.
Proyecto Fin de Carrera Ingeniería en Informática Sistema de Resolución de la Ambigüedad Semántica Basada en el Conocimiento Alumno: D. Álvaro Acebedo.
Novedades Análisis de Redes gvSIG 1.9 Software Colaborativo.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
ALFRESCO.
Introducción al mundo de las comunicaciones
REFERENCIAS BIBLIOGRAFICAS
INGENIERÍA DE INFORMACIÓN Y APLICACIONES
2680 Bioinformática Búsqueda de genes en el servidor local usando información Biomédica de Bases de Datos Remotas. Director: Jordi Gonzàlez (CVC) Mario.
Licenciatura en Contaduría Tema: Regresión y correlación
BASE DE DATOS.
Ram Delta Systems We bring you a better future… Co-Med On Line
Ram Delta Systems We bring you a better future… Co-Med On Line
Ram Delta Systems We bring you a better future… Co-Med On Line
Un Enfoque de Clustering basado en PSO Asistido
PROYECTO FINAL DE CARRERA Ingeniería Aeronáutica DESARROLLO DE OPTIMIZADOR DE FORMA 2D BASADO EN CÓDIGO DE ELEMENTOS FINITOS CON MALLADOS CARTESIANOS.
RiskyProject Presentado por: Andres Clavijo, Camilo Forero, Jhon Chacón y Brayan Valero.
Autor: Araya P., Ruz G., Palomino H.
SISTEMA DE DICTAMINACIÓN DE ESTRUCTURAS ORGÁNICAS
escuela de administración estadistica ii
TALLER SOBRE CLASIFICACIONES INTERNACIONALES
BASES DE DATOS.
DOCUMENTO FUNCIONAL Versión 1.0 GIM ANDROID 2014
DOCUMENTO FUNCIONAL Versión 1.0 GIM ANDROID 2015
Ecosistema abierto para la representación espacial de sistemas de información IDESAN, caso de uso aplicado a la gestión sanitaria en la Conselleria de.
Resumen: Análisis de requerimientos
15° Simposio Internacional de Tesis y Disertaciones
Guía de liderazgo X Jornadas de Buenas Prácticas y Gestión del Conocimiento B O L E T Í N D E L B I B L I O T E C A R I O Carmen.
APLICACIÓN DE NUEVAS TECNOLOGÍAS EN LA CONSERVACIÓN Y ANÁLISIS DEL PATRIMONIO CULTURAL Herramientas para la Investigación.
Diseño y propuesta de implementación de una intranet como herramienta para la gestión de información en la Oficina Central de CUPET.
INSTITUTO SUPERIOR TECNOLÓGICO “17 DE JULIO” DETERMINACIÓN GRAVIMÉTRICA INTEGRANTES: RUEDA GABRIELA GÓMEZ KATHERINE BENAVIDES SANTIAGO.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las.
Métodos estadísticos en Bioinformática
Nuevas Características de SQL Server 2016
Hexa-Gateway ¿Qué es? ¿Para qué sirve?
Curso: fundamentos de redes Profesor: Miguel farfan Sesion: 03
Pasos para el registro a MENDELEY a través del CONRICYT
Universidad Alonso de Ojeda Facultad de Ingeniería
ResearcherID Biblioteca Universitaria.
PROYECTO DE GRADUACIÓN
Es el proceso de subdividir los entregables y el trabajo del proyecto en componentes más pequeños y más fáciles de manejar Se puede dar una visión estructurada.
SGeMS Stanford Geostatistical Earth Modeling Software Funciones básicas.
Aula de Oncología Médica en Control del Dolor
SERVICIOS DE ALMACENAMIENTO EN LA NUBE DE QUE SE TRATA El Almacenamiento en la Nube consiste en guardar archivos en un lugar de Internet. Esos lugares.
Tamaño de muestra.
Disertantes: Ing. Amb. Victor Duarte Ing. Amb. Rodrigo Quintana
PROYECTO DE GRADUACIÓN
TRABAJO DE TITULACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE MAGÍSTER EN GERENCIA DE SISTEMAS TEMA: “DISEÑO DE UNA GUÍA CORPORATIVA PARA IMPLEMENTAR APLICACIONES.
Ing. Patricia Acosta, MSc. Blog: EXCEL.
Métodos globales para la evaluación de las condiciones del trabajo. Mónica Andrea Chacón Casas Programa de seguridad y salud en el trabajo Universidad.
¿Que es? •Es una Herramienta tecnológica, visual y geográfica que permite a la ciudadanía fortalecer la toma de decisiones, detonar la inversión e impulsar.
PROYECTO DE GRADUACIÓN
ESTRUCTURA DE LO SISTEMAS OPERATIVOS Presentado por: Jennifer.
Biopsia Líquida Térmica (BLT):
Búsqueda Básica La búsqueda rápida de Ovid
Transcripción de la presentación:

Escola Tècnica Superior d’Enginyeria Realizado por : José Fernández Márquez Director : Jordi González Sabaté (CVC-UAB) Codirector 1 : Mario Huerta (IBB-UAB) Codirector 2 : Juan Antonio Cedano (IBB-UAB)

Escola Tècnica Superior d’Enginyeria 2 PRESENTACIÓN ESTADO DEL ARTE OBJETIVOS IMPLEMENTACIÓN CONCLUSIONES ÍNDICE

Escola Tècnica Superior d’Enginyeria 3 PRESENTACIÓN Instituto de Biotecnología y Biomedicina (IBB) - En el IBB se desarrollan principalmente investigaciones de tipo biológico - El trabajo se desarrolló en el IBB bajo la tutela de Mario Huerta y con la colaboración de Juan Antonio Cedano - El trabajo realizado se enmarca en una linea de investigación dirigida por Mario Huerta y Juan Antonio Cedano que estudia el efecto del estrés en las células humanas, cómo el estrés puede generar células cancerígenas.

Escola Tècnica Superior d’Enginyeria 4 ESTADO DEL ARTE Tecnología de microarrays Métodos de agrupación Índices de Integridad Intervalos de confianza PCOPGene

Escola Tècnica Superior d’Enginyeria 5 Célula NormalCélula Cáncer Célula Normal Célula Cáncer Tecnología de microarrays COLOREA R GENES CHIP MICROARRAY SCA N Gen sobre expresado en célula cancerígena Gen sobre expresado en célula normal Gen sobre expresado en ambos tipos de células ESTADO DEL ARTE

Escola Tècnica Superior d’Enginyeria 6 Tecnología de microarrays ESTADO DEL ARTE

Escola Tècnica Superior d’Enginyeria 7 ESTADO DEL ARTE Métodos de Agrupación más utilizados en el análisis de microarrays Escalado matriz de datos: - Multi Dimensional Scaling (MDS) - Principal Components (PC) Métodos agrupación : Jerarquicos: - Hierarchical Clustering (HC) De particionamiento: - K-Means - Self-organizing Maps (SOM) - Self-organizing Tree Algorithms (SOTA) - Partitioning Around Medoids (PAM)

Escola Tècnica Superior d’Enginyeria 8 ESTADO DEL ARTE Índices de integridad Hartigan Calinsky-Harabasz Dunn Silhouette Width Connectivity

Escola Tècnica Superior d’Enginyeria 9 ESTADO DEL ARTE Búsqueda de Genes Marcadores para una Distribución de Clusters Concreta Distribución normal (distribución T d Students) Intervalo de confianza

Escola Tècnica Superior d’Enginyeria 10 ESTADO DEL ARTE PCOPGene:: Microarray analysis tool - Aplicación web desarrollada por el IBB ( - Desarrollada para el análisis de microarrays que a su vez facilita el análisis del conjunto de las dependencias de expresión entre genes - Permite estudiar la relación de expresión entre genes bajo distintas condiciones muestrales, clasificar estas condiciones y estudiar sus efectos en diferentes relaciones

Escola Tècnica Superior d’Enginyeria 11 OBJETIVOS - Implementación algoritmos agrupación de las condiciones muestrales - Integrar agrupación en el preproceso existente - Integrar resultados agrupación en la interfaz web PCOPGene ( ) y añadir nuevas funcionalidadeshttp:://revolutionresearch.uab.es - Implementar algoritmo búsqueda de genes marcadores - Integrar implementación y resultados en el interfaz web PCOPGene ( )

Escola Tècnica Superior d’Enginyeria 12 IMPLEMENTACIÓN Agrupación de condiciones muestrales Herramientas de desarrollo: - R-Statistics (R) - PERL - C Modelo de implementación: C PERL Intérprete R Tratamiento previo: Corrección de “celdas vacías” en la microarray de entrada Implementación de los métodos de agrupación: MDS + (K-MEANS, SOM, SOTA, PAM, HC) PC + (K-MEANS, SOM, SOTA, PAM, HC) SOM, SOTA, PAM, HC Cálculo de la integridad de las distribuciones de clústers: Dunn, Silhouette y Hartigan (*descartado*)... llamada a perl... llamada a perl... intérprete R... intérprete R... agrupación... agrupación...

Escola Tècnica Superior d’Enginyeria 13 IMPLEMENTACIÓN Agrupación de condiciones muestrales Agrupaciones calculadas para cada algoritmo (número de clústers) : 4,5,6,7,8,9,10,11,12,13,14,15,16 Tratamiento de las condiciones muestrales outlayers*: Agrupaciones sin muestras outlayers, fusión de clústers Agrupaciones con muestras outlayers Para cada uno de los algoritmos se escogen las mejores agrupaciones según los índices Dunn y Silhouette (solo agrupaciones de 4 a 9 clústers) Tratamiento final para todas las agrupaciones: -Normalizar identificadores de los clústers. *Outlayer: muestras sin clúster asignado o muestra que pertenece a un grupo con pocas muestras (5% en este caso)

Escola Tècnica Superior d’Enginyeria 14 IMPLEMENTACIÓN Agrupación de condiciones muestrales Tratamiento para las mejores agrupaciones: - Eliminación outlayers - Si la mejor agrupación tiene 9 clúster se elimina el clúster que contenga menos muestras. -Ordenación, agrupación y normalización de los ficheros de clústers: · Proceso independiente de la agrupación de muestras · Clustering de las mejores agrupaciones agrupándolas por similitud y ordenadas por disimilitud (HC) · Normalización interna de cada grupo de ficheros de clústers a partir del fichero guía de cada grupo de ficheros.

Escola Tècnica Superior d’Enginyeria 15 IMPLEMENTACIÓN Agrupación de condiciones muestrales Plantilla guía 1->1 2->4 3->2 4->3

Escola Tècnica Superior d’Enginyeria 16 IMPLEMENTACIÓN Agrupación de condiciones muestrales Gestión de resultados de la agrupación: Todos los resultados se guardan en ficheros en el servidor.servidor Los directorios más destacados son: - Rclustering_Samples : se guardan todos los resultados de las agrupaciones - Rclustering_Samples/Best: se guardan solo las mejores agrupaciones accesibles al usuario a través del aplicativo webaplicativo web -Rclustering_Samples/Datos_Originales: objetos generados durante el proceso de agrupación que se guardan para futuros análisis

Escola Tècnica Superior d’Enginyeria 17 IMPLEMENTACIÓN Agrupación de condiciones muestrales Ejemplo de agrupación de las condiciones muestrales :

Escola Tècnica Superior d’Enginyeria 18 IMPLEMENTACIÓN Integración de la agrupación en el preproceso El preproceso es un conjunto de subprocesos que se ejecutan automáticamente al cargar una microarray en el sistema. Solo se ejecuta una vez por microarray. En este preproceso se añade el subproceso que realiza la agrupación de las condiciones muestrales de la microarray. Debido a que el tiempo de ejecución es muy elevado se implementa una versión que solo realiza el proceso de agrupación Diagrama de flujo: Inicio (Preproceso, C) IN: Microarra y … Clustering muestras (Perl) : - Tratamiento outlayers - Cálculo de integridades - Obtención de las mejores agrupaciones, etc.. Clustering y normalizado mejores agrupaciones(Perl)... FIN

Escola Tècnica Superior d’Enginyeria 19 IMPLEMENTACIÓN Interfaz web: Integrar los resultados de las agrupaciones en el aplicativo webaplicativo web Herramienta de desarrollo: PHP Funcionalidades agregadas a la aplicación :aplicación - Listado de las mejores agrupaciones ordenadas por similitud - Actualización de la agrupación actual por la agrupación seleccionada por el usuario - Descarga de la agrupación precalculada seleccionada por el usuario - Gestor del histórico del usuario: · Guardar la agrupación actual con el nombre fijado por el usuario · Descargar la agrupación del histórico seleccionada · Actualizar la agrupación actual con la agrupación del histórico seleccionada · Eliminar uno o todas las agrupaciones del histórico · Normalizado histórico (clustering HC del histórico)

Escola Tècnica Superior d’Enginyeria 20 INTERFAZ WEB Interfaz web: Integrar los resultados de la agrupación en el aplicativo CLÚSTER 3 CLÚSTER 2 CLÚSTER 1

Escola Tècnica Superior d’Enginyeria 21 IMPLEMENTACIÓN Búsqueda de los genes marcadores Herramientas de desarrollo: - C Fundamentos teóricos: - Distribución T d Student - Intervalos de confianza Resultados: - Fichero con el identificador de los genes(genes marcadores) que cumplan las condiciones exigidas por el usuario para la agrupación actual y con la distancia total de los clúster validados de cada gen marcador

Escola Tècnica Superior d’Enginyeria 22 IMPLEMENTACIÓN Búsqueda de los genes marcadores Diagrama de flujo: Inicio búsqueda Microarray Condiciones Búsqueda Clustering Actual Nivel de confianza Gen =1 FIN Crear Intervalos para cada clúster de muestras del Gen Validar Condiciones Condiciones Ok? SI NO Guardar Gen y distancia Gen > Total Genes SI NO Gen=Gen+1

Escola Tècnica Superior d’Enginyeria 23 IMPLEMENTACIÓN Búsqueda de los genes marcadores para una distribución de clusters concreta Nivel de confianza : 99.7% Kte : 2.968

Escola Tècnica Superior d’Enginyeria 24 INTERFAZ WEB Interfaz web: Integrar la búsqueda de genes marcadores en el aplicativo web Herramientas de desarrollo: PHP Funcionalidades agregadas en la aplicación:aplicación - Búsqueda de genes marcadores usando intervalos de confianza - Listado de los genes marcadores ordenados por la distancia de mayor a menor

Escola Tècnica Superior d’Enginyeria 25 CONCLUSIONES Los objetivos se marcados se han cumplido con creces incluso se han desarrollado nuevas funcionalidades La consecución de los objetivos resulta una herramienta especialmenteherramienta útil y práctica para los investigadores : -Útil: · Análisis de los distintos estados celulares. · Encontrar genes marcadores responsables de estos estados celulares. -Práctica: ·Agrupaciones de condiciones muestrales pre calculadas ·Manipulación y almacenaje de estas agrupaciones en un histórico personal. ·Búsqueda automática de genes marcadores

Escola Tècnica Superior d’Enginyeria 26 CONCLUSIONES A nivel teórico una de las principales conclusiones que pueden extraerse es sobre los actuales índices de integridad: - No son nada precisos para encontrar una única agrupación como la óptima. - Ayudan a discriminar agrupaciones de entre todas las calculadas. Aspectos positivos del desarrollo del proyecto : - Aplicar conceptos teóricos, matemáticos y estadísticos al mundo.real - Participar en un proyecto conjunto dedicado a la investigación de los genes como responsables de enfermedades como el cáncer

Escola Tècnica Superior d’Enginyeria 27 BIBLIOGRAFÍA : Web server for on line microarray analysis supported by theWeb server for on line microarray analysis supported by the Institute of Biotechnology and Biomedicine of the Autonomous University of Barcelona (IBB-UAB)Institute of Biotechnology and Biomedicine of the Autonomous University of Barcelona (IBB-UAB). Huerta M, Cedano J, Querol E. (2008) Analysis of nonlinear relations between expression profiles by the principal curves of oriented-points approachof oriented-points approach, J Bioinform Comput Biol. 6: Cedano J, Huerta M, Querol E. (2008) NCR-PCOPGene: An Exploratory Tool for Analysis of Sample-Classes Effect on Gene-Expression RelationshipsRelationships, Adv Bioinformatics. 2008: Epub 2008 Dec 10. Huerta M, Cedano J, Peña D, Rodriguez A, Querol E. (2009) PCOPGene-Net: holistic characterisation of cellular states from microarray data base on continuous and non-continuos analysis og gene-expression relationships BMC Bioinformatics May 9;10:138. Delicado, P.(2001) Another look at principal curves and surfaces. Journal of Multivariate Analysis, 77, Delicado, P. and Huerta, M. (2003): 'Principal Curves of Oriented Points: Theoretical and computational improvements'.Principal Curves of Oriented Points: Theoretical and computational improvements'. Computational Statistics 18, Cedano J, Huerta M, Estrada I, Ballllosera F, Conchillo O, Delicado P, Querol E. (2007) A web server for automatic analysis and extraction of relevant biological knowledge. Comput BiolA web server for automatic analysis and extraction of relevant biological knowledge. Med. 37:

Escola Tècnica Superior d’Enginyeria 28 GRACIAS POR SU ATENCIÓN AGRADECIMIENTOS A mi padre JOSÉ A mi madre FILO A mis HERMANOS Al resto de mi familia A Mario Huerta y Juan Antonio Cedano Etc... Gracias a todos por vuestra paciencia y atención