Aplicaciones de Data Mining en ciencia y tecnología Ontologias. 1

Slides:



Advertisements
Presentaciones similares
Publicación de las colecciones en CD ROM
Advertisements

U.M.L A/Gx. Diego Gutiérrez Application Analysis and Design.
El Portfolio Europeo de las Lenguas
Arquitecturas de administración de redes y sus submodelos
FACHADA COMPOSITOR MEMENTO
Aplicaciones (informática)
TERMINOLOGÍA EN ESPAÑOL
Aplicaciones de Data Mining en ciencia y tecnología Ontologias. 2
CRISP-DM (
Aplicaciones de Data Mining en ciencia y tecnología Bioinformática
CONFIDENCIALIDAD Cómo Proteger la Información Personal:
Introducción a las Tecnologías Informáticas Oscar Bedoya
La web semántica y su impacto en la recuperación de información
Aplicación de MDA a la Ingeniería del Conocimiento
Ontologías y Bases de Datos
Ontologías en Biología Bioinformática 2004 Fernán Agüero.
Dra. Rocío C. Romero Zaliz
Codificación.
Lenguajes de Ontologías Gustavo Núñez, Alvaro Rodriguez, Oscar Sena.
Understanding SOA Design Patterns
INTERFAZ DE ACCES DISEÑO DE BASE DE DATOS
Evaluación de Productos
MAESTRIA EN INGENIERÍA DE SOFTWARE
DIAGRAMA DE COMPONENTES INTEGRANTES Córdova Vásquez Giovanny Escobar Alvares Calixto Gomez Quinteros Adelaida Pinto Flores Yarmila.
Sindy Carolina Asprilla
Unified Modeling Language (Lenguaje de Modelamiento unificado)
Representación de Requerimientos
PLANEACION DE UNA ESTRUCTURA ORGANIZACIONAL
Desarrollo de un sistema de clasificación de recursos electrónicos en el ámbito de la lógica matemática” Autor: Antonio Sarasa Cabezuelo Directora: María.
SISTEMAS DE INFORMACIÓN 2 SISTEMAS DE INFORMACIÓN 2.
“CAPACITACIÓN DE ALUMNOS Y DOCENTES EN INVESTIGACIÓN BIBLIOGRÁFICA: LA EXPERIENCIA DE LA BIBLIOTECA CENTRAL DE LA FACULTAD DE AGRONOMÍA DE LA UBA EN EL.
Definición De Datos Lenguaje de definición de datos
Web Semántica M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
Arquitectura de la Información Prof. Adelaide Bianchini – Dpto. de Computación y Tecnología de la Información, Universidad Simón Bolívar. Febrero 2006.
Ingeniería de Software
DESCRIPTORES EN CIENCIAS DE LA SALUD
Ailyn Lopez pitty Leda Sequeira picado Kevin barquero irola
Gene Ontology: GO Prof. Dr. José L. Oliverhttp://bioinfo2.ugr.es/oliver.
Ailyn Lopez pitty Leda Sequeira picado Kevin barquero irola
Identificación de Atributos de Calidad en Requerimientos Tesis de Grado de Francisco Bertoni y Sebastián Villanueva Dirigida por la Dra. Claudia Marcos.
UML 2.0 Integrantes: Diana Carolina Valencia M. Jhon Fernando Lopez T. Carlos Alberto Castillo.
BioInformática Una nueva ciencia Interdisciplinar Norberto Díaz Díaz Bioinformatics Group of Seville (BIGS) Dpto. de Lenguajes y Sistemas Informaticos.
Tesauros y descriptores en Ciencias de la Salud MeSH/DeCS
GESTION DE LA CONFIGURACION DEL SOFTWARE (GCS/SCM)
LUIS FELIPE BADILLO ISLAS HÉCTOR BECERRA ONTIVEROS MARÍA DEL CARMEN VILLANUEVA REYES RECURSOS METODOLÓGICOS DE LOS ALUMNOS DE POSTGRADO EL CASO DE LA MAESTRÍA.
EQUIPO:#3 GRUPO:304 NOMBRES: Lizbeth Nava Barón y Erick Ali Mejía.
SOFTWARE EDUCATIVO Ziane manel Selahi nasredinne Ouandjeli amina Sebih zina Segundo curso LMD grupo 4 Ziane manel Selahi nasredinne Ouandjeli amina Sebih.
Patrones de diseño Grupo 1 Haeberli, Julián Lara, Guisell
Ingeniería de Requerimientos
Integrantes: Dennys Quintero José Ortega Simón Fagundez Caracas 09 de Febrero de 2015.
PROCESOS DE DESARROLLO DE SOFTWARE
TEMA: DISEÑO DE LA SOLUCION INTREGRANTES DE EQUIPO: ERIKA CRUZ MARTINEZ RODOLFO LOPEZ ANOTA LUIS ARMANDO LIÑA QUECHA JOSE FRANCISCO MEZO VARELA LUIS ENRIQUE.
Desarrollo de lógica algorítmica.
Unified Modeling Language (Lenguaje de Modelamiento unificado)
Análisis de resultados de la matriz FODA
G ESTIÓN DE LA C ONFIGURACIÓN DEL S OFTWARE G ESTIÓN DE LA C ONFIGURACIÓN DEL S OFTWARE Daniel Eduardo Almeciga Angie Katterine Cruz O. Diego Fernando.
TIPOS DE DATOS ABSTRACTOS
3. Paradigmas de la ingeniería de software.
Gruping Presentación del equipo Tarea Proceso: Etapas
La Programación Orientado a Objetos
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
MODELAMIENTO VISUAL Y UML
Repositorios de recursos digitales educativos
Aplicación web de tipo Ambiente Educativo Virtual, un sistema de gestión de cursos, de distribución libre, que ayuda a los educadores a crear comunidades.
Presentación De UML Lenguaje estándar para escribir planos de software Se usa para visualizar, especificar, construir y documentar los artefactos de un.
Modelado UML Diagrama de Clases
Requerimientos del software
UBA-FCEyN FIUBA-FAUBA INTA EEA Corrientes CICVyA – INTA Castelar Profesionales Analytics Cono Sur Claves y Secretos de una Tesis exitosa en Analytics La.
 MicroMundos  El MicroMundos es un programa informático utilizado para la automatización y dispositivos de control robótico.  Fue desarrollado y.
Transcripción de la presentación:

Aplicaciones de Data Mining en ciencia y tecnología Ontologias. 1 Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

Organización del conocimiento en ontologías Una ontología es una representación formal de un conjunto de conceptos y de las relaciones entre ellos Una ontología debe contar con un vocabulario controlado que se usa para modelar el dominio del conocimiento Los conceptos en una ontología normalmente se organizan en forma jerárquica Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

Organización del conocimiento en ontologías Un ejemplo, la Gene Ontology (GO) u Ontología Génica Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

Ontología Génica La GO está formada en realidad por tres ontologías, que describen tres aspectos biológicos diferentes: Componente celular Función molecular Proceso biológico Dentro de cada una de ellas, se establecen relaciones entre conceptos de diferentes tipos, por ejemplo: is_a part_of Los términos tienen un descripción y un código asignado: GO:0005623 cell Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

Anatomía de un término GO Este término GO esta asignado a 1913 genes 1 2 3 4 Accession: es el código que se le asigna al término Ontology: ontología a la que pertence el término Definition: una definición en lenguaje natural Community: GO es un recurso en cambio permanente Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

El grafo de la ontología GO Los términos de la ontología pueden tener más de un padre La ubicación de un término en el grafo y sus relaciones constituyen una definición (controlada) Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

Las relaciones dentro de la ontología GO Dos de las relaciones más importantes de la ontología GO son: is_a El término hijo pertenece completamente al tipo del padre, pero se lo puede discriminar de otros términos hermanos. part_of El término hijo es un constituyente del padre. En combinación con otros hijos conforman el padre. Otras ontologías pueden definir otras relaciones, y propiedades específicas de las relaciones (simetría, antisimetría, reflexividad, etc) Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

Un gen con anotaciones GO El término GO:0001764, neuron migration, está asignado, entre otros al gen abi-1 del gusano C. elegans. El gen abi-1 tiene en total 19 términos GO asignados ¿Quién hace las asignaciones de términos GO? ¿Qué son los códigos de evidencia? Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

Para distinguir estos casos, se crearon los códigos de evidencia: Las anotaciones GO las puede realizar un curador utilizando la bibliografía publicada, un software, un científico a partir de datos experimentales. Para distinguir estos casos, se crearon los códigos de evidencia: Experimental Evidence Codes EXP: Inferred from Experiment IDA: Inferred from Direct Assay IPI: Inferred from Physical Interaction IMP: Inferred from Mutant Phenotype IGI: Inferred from Genetic Interaction IEP: Inferred from Expression Pattern Computational Analysis Evidence Codes ISS: Inferred from Sequence or Structural Similarity ISO: Inferred from Sequence Orthology ISA: Inferred from Sequence Alignment ISM: Inferred from Sequence Model IGC: Inferred from Genomic Context RCA: inferred from Reviewed Computational Analysis Author Statement Evidence Codes TAS: Traceable Author Statement NAS: Non-traceable Author Statement Curator Statement Evidence Codes IC: Inferred by Curator ND: No biological Data available Automatically-assigned Evidence Codes IEA: Inferred from Electronic Annotation El proceso de asignación de términos ontológicos se puede automatizar !! Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

¿Para qué sirve una ontología?. 1 GO:00001111 GEN A GO:00002222 GEN B GEN C GO:00003333 GEN D GO:00004444 Genes con funciones coordinadas Asignaciones calificadas por códigos de evidencia Términos ontológicos relacionados entre sí Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

¿Para qué sirve una ontología?. 2 Los resultados de un análisis de agrupamientos se pueden describir a partir de las anotaciones ontológicas de las instancias agrupadas (metadata). El análisis ontológico es relativamente insensible a cambios en la anotación: dos instancias con anotaciones cercanas en el grafo se reconocerán como instancias similares, aún cuando las anotaciones no sean idénticas. La extracción de conocimiento se transforma en un proceso más fácilmente tratable por una computadora. Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

Herramientas para construir ontologías Una de las más usadas y de código abierto es Protégé (http://protege.stanford.edu/) Actualmente hay dos versiones disponibles, 3.4 y 4.0. La diferencia entre ellas es el tipo de metodología de modelado que soportan (frames y/o OWL) Más información: http://protegewiki.stanford.edu/index.php/Protege4Migration Para quien se inicia, usar una herramienta basada en frames puede ser más fácil. OWL es un estándar más nuevo y en crecimiento. Las versiones 3.4 y 4.0 ofrecen distinto grado de soporte del modelo OWL. Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN

Herramientas para construir ontologías En la carpeta del curso en el ftp de la maestría pueden encontrar un tutorial en español para Protégé-frames y uno en inglés para Protégé-OWL (cuidado, tiene algunos errores). Los dos documentos están en el sitio oficial de Protégé. Ahí también pueden encontrar más documentación y ejemplos. Marcelo A. Soria (soria@agro.uba.ar) Maestria en Data Mining. DC-FCEN