Infraestructura para integración de sistemas multi-similitud Ismael Sanz.

Slides:



Advertisements
Presentaciones similares
Talleres Fuentes de Información Sugerencias de las facilitadoras pedagógicas DCDE 9 de septiembre de 2005.
Advertisements

Una experiencia particular de implementación del Método Glifing en grupo aula Joaquim Trenchs.
Expresión de proteínas y mRNA Lic. María Mercedes Tiscornia Cátedra de Biología Molecular y Genética
1. Diversas herramientas de software libre para diseño. -Ingenio tu sitio -Compromisos de trabajos -El software y su licencia -Aspectos analizados 2.
¿ Cómo articular la formación de pregrado, posgrado y especialidades médicas para responder a las necesidades de salud? Dra. Sara Cortés Bargalló Asociación.
Entrega final de proyecto Software para la gestión de inscripciones en cursos Universidad Nacional de Colombia Maestría en Ingeniería de Sistemas y Computación.
SOFTWARE EDUCATIVO JUAN JAVIER RODRIGUEZ ACOSTA. KEIDER ROENES RÍOS. INTRODUCCION AL SOFTWARE
Electroforesis en gel. Identificación de clones portadores de un gen de interés -Rastrear todas las colonias con plásmidos recombinantes (Ej. Colonias.
Buscar y Gestionar Información con Nuevas Tecnologías
Análisis y Especificación de Requisitos
TESIS DE GRADO DESARROLLO DEL SISTEMA WEB PARA LA ADMINISTRACIÓN DE LAS ACTIVIDADES ACADÉMICAS DE ALUMNOS, PROFESORES Y RESPONSABLES DE LOS DEPARTAMENTOS.
DECISION CLOUD: SISTEMA DE GESTIÓN DE SERVICIO AL CLIENTE E INTEGRACIÓN DE APLICACIONES, BASADO EN LA ARQUITECTURA ORIENTADA A MICROSERVICIOS, PARA DECISIÓN.
Metodología de la Investigación Cualitativa
Entornos virtuales de formación y entornos personales de aprendizaje
Técnicas de aprendizaje
METODOLOGÍA PARA LA ENSEÑANZA DE LA HISTORIA
Conferencia # 3 Ingeniería de Software II
Mariela Questa-Torterolo UAB
Seminario de Informática en Salud
Tema 4: Ingeniería del Software
INTRODUCCION A LA TEORIA DE DECISIONES JUAN ANTONIO DEL VALLE F.
Aspectos Generales Todos los proyectos deben subir este documento como parte de la presentación, en la plataforma de postulación de proyectos. La presentación.
Fundamentos de negocios y comercio electrónico.
Proceso de Desarrollo de SW
BASE DE DATOS NOMBRE: Natali Jovana García Toro. GARDO:7.3
Uso de información estadística con valor agregado
BIOTECNOLOGÍA 2008 Clase 1 Prof. Oriana Salazar
Profesor: José Luis Gonzalez
TRABAJO BASE DE DATOS CARLOS MARTINEZ 7º3
ENFOQUES DE CONSERVACIÓN
Teoría de Esquemas.
Revisión Sistemática y Meta-análisis
Construyendo soluciones Web con SIU-Toba
MODULO II PLAN DE FORMACIÓN DEL PROFESORADO Aula 2.0:
Ingeniería de Software
Fundamentos del computador
Ildefonso Cases, Víctor de Lorenzo.
Feb.15, 2001 Feb.16, 2001.
Las herramientas Case Julian madrigal.
APLICACIONES Y USO DE LAS TICS ¿Para qué cosas es bueno usar Tics?
Introducción al diseño del software
Herramientas tecnológicas
Gestión de Riesgos y Control Interno: Función Actuarial Experiencia Peruana.
Diseño en Alice En este módulo estudiaremos los elementos del diseño en Alice: Escenarios Storyboards Textuales Visuales Definiciones.
Diseños evaluativos de intervención media (cuasi-experimentos)
APRENDIZAJE BASADO EN PROYECTOS
Proceso de Desarrollo de SW
Objetivos de alta precisión. Consideraciones especiales
El sistema de Calidad de GFI/AST
Introducción a la biología
El espacio conceptual para la investigación de la Promoción y la Gestión Cultural CAPÍTULO 4 Las áreas temáticas son el centro de la propuesta de un posible.
Tema 1: La Química Biológica 2017
Aplicación de PSP (Personal Software Process)
Desarrollo de sitios web
Ayudando al control y seguimiento de la diabetes
MODELAMIENTO DE BASES DE DATOS
Actividad 1 Módulo 2. Inteligencia Competitiva y Tecnológica
Requisitos Ing. Maribel Valenzuela Beltrán 1.
Capitulo VI ,Ingeniería en Comunicación Social y Promoción Cultural
Instituto Tecnológico Superior de la Región Sierra
Métodos Cuantitativos
Lingüística computacional
Metodologías de Desarrollo Web
ING. Franklin Castellano, Esp.
AUTOR: SALGADO ESCOBAR STALIN SEBASTIAN DIRECTOR: ING. JOSE SANCHO
Tecnologías y capacidades en Industria 4.0
SESIÓN ABIERTA PRESENTACIÓN “RECURSOS DIGITALES PARA LA IMPLEMENTACIÓN DE METODOLOGÍAS ACTIVAS EN LA DOCENCIA” Rafael Seiz Ortiz UNiversitat Politècnica.
CONSTRUCCION DE BANCO DE REACTIVOS
Canvas de diseño Challenge Based Learning
UNIDAD 3 PLANIFICACION 1er. momento: Planificación estratégica: momentos. Ciclo de un proyecto 2do. momento: Ejercicio práctico de Diagnóstico participativo,
Transcripción de la presentación:

Infraestructura para integración de sistemas multi-similitud Ismael Sanz

Contexto Data- centric XML Document- centric XML

Contexto XQuery IR

Motivación Adopción de XML por nuevas comunidades – Bioinformática, patrimonio cultural, ontologías, GIS, … No hay una estructura regular explotable Tampoco predomina la información textual Complejidad más alta que en los escenarios típicos

Motivación Falta de soporte para la heterogeneidad estructural Falta de tolerancia para la complejidad estructural

Motivación: el caso bioinformático Julia M. Gohlke and Christopher J. Portier:The Forest for the Trees: A Systems Approach to Human Health Research. Environmental Health Perspectives 115(9), September 2007

Niveles de granularidad

“Dogma central”

Secuencias Nucleótidos (ADN) – >AB |acc=AB000263|descr=Homo sapiens mRNA for prepro cortistatin like peptide, complete cds.|len=368 ACAAGATGCCATTGTCCCCCGGCCTCCTGCTGCTGCTGCTCTCCGGGGCCACGGCCACCGCTGCCCTGCC CCTGGAGGGTGGCCCCACCGGCCGAGACAGCGAGCATATGCAGGAAGCGGCAGGAATAAGGAAAAGCAGC CTCCTGACTTTCCTCGCTTGGTGGTTTGAGTGGACCTCCCAGGCCAGTGCCGGGCCCCTCATAGGAGAGG AAGCTCGGGAGGTGGCCAGGCGGCAGGAAGGCGCACCCCCCCAGCAATCCGCGCGCCGGGACAGAATGCC CTGCAGGAACTTCTTCTGGAAGACCTTCTCCTCCTGCAAATAAAACCTCACCCATGAATGCTCACGCAAG TTTAATTACAGACCTGAA Péptidos (proteinas) – >gi| |gb|AAD | cytochrome b [Elephas maximus maximus] LCLYTHIGRNIYYGSYLYSETWNTGIMLLLITMATAFMGYVLPWGQMSFWGATVITNLFSAIPYIGTNLV EWIWGGFSVDKATLNRFFAFHFILPFTMVALAGVHLTFLHETGSNNPLGLTSDSDKIPFHPYYTIKDFLG LLILILLLLLLALLSPDMLGDPDNHMPADPLNTPLHIKPEWYFLFAYAILRSVPNKLGGVLALFLSIVIL GLMPFLHTSKHRSMMLRPLSQALFWTLTMDLLTLTWIGSQPVEYPYTIIGQMASILYFSIILAFLPIAGX IENYElephas maximus maximus

Rutas metabólicas

Recursos “Database Issue” de Nucleic Acids Research 1170 bases de datos – Nucleotide Sequence Databasesucleotide Sequence Databases – RNA sequence databases RNA sequence databases – Protein sequence databases Protein sequence databases – Structure Databases Structure Databases – Genomics Databases (non-vertebrate) Genomics Databases (non-vertebrate) – Metabolic and Signaling Pathways Metabolic and Signaling Pathways – Human and other Vertebrate Genomes Human and other Vertebrate Genomes – Human Genes and Diseases Human Genes and Diseases – Microarray Data and other Gene Expression Databases Microarray Data and other Gene Expression Databases – Proteomics Resources Proteomics Resources – Other Molecular Biology Databases Other Molecular Biology Databases – Organelle databases Organelle databases – Plant databases Plant databases – Immunological databases Immunological databases

Acceso vía web Entrez EMBOSS EMBL-EBI Distributed Annotation System WS/REST

Tareas típicas

Interoperabilidad

Ontologías Tim Berners-Lee

Workflow Taverna

Ejemplo “Encontrar proteínas del ratón de laboratorio cuya secuencia es similar a la de la topoisomerasa humana”

Motivación: el caso bioinformático La información está disponible en XML Requiere búsqueda aproximada y múltiples funciones de similitud Muchas colecciones, cada una con su propio formato Solución actual: hacer una aplicación ad-hoc – Generalmente usando algún framework en Java – Quizás usando Web Services – Completamente ad-hoc Problema de integración de la información

Sistemas multi-similitud Origen en BD multimedia Soporte de múltiples funciones de similitud Diseñados expresamente para gestionar infomación

Datos inherentemente complejos – XPath y XQuery no pueden Sin soporte de consultas aproximadas – XPath y XQuery tampoco pueden Sin soporte para multi-similitud Sin técnicas de análisis y diseño ¿Por qué es tan difícil?

Objetivos Crear en técnicas de análisis y diseño para sistemas multi-similitud Implementar extensiones multi-similitud para XPath y XQuery Validar mediante un caso práctico en el dominio de la Bioinformática I n f r a e s t r u c t u r a p a r a i n t e g r a c i ó n d e s i s t e m a s m u l t i - s i m i l i t u d s o b r e X M L.

Tareas 1.Modelado de requisitos para integración de información biológica 2.Especificación de sistemas de integración de información biológica 3.Implementación de extensiones de XQuery para manejo de información compleja 4.Implementación de un caso de estudio realista

Marco general: MDA

Requisitos Objetivos: – Una taxonomía de tareas apropiada – Un modelo general de las características modelables de las medidas que deben participar en un sistema multi-similitud. – Modelos preliminares de dominio para aplicaciones bioinformáticas. Resultado – Perfil i*

Trabajo preliminar

Esbozo de metodología

Especificación Opciones de diseño: – DSL – Perfil de UML Características: – Capacidad de incorporar conceptos y relaciones del dominio biomédico. – Primitivas de modelado para fuentes de datos biomédicas. – Primitivas de modelado para medidas de similitud propias del dominio biomédico.

XQuery? Objetivo: Implementación de primitivas sobre un SGBD real. Extensión de XQuery Selección del SGBD XML adecuado para la implementación. Implementación de las funciones necesarias

Trabajo preliminar

Preguntas ¿Tiene sentido de usar XML/XQuery? ¿El caso bioinformático es realmente específico? ¿Cómo integrar resultados aproximados? ¿DSL o UML? ¿El enfoque metodológico es correcto?