Proyecto SIFIA Sistema de Inteligencia basado en Fuentes de Información Abierta.

Slides:



Advertisements
Presentaciones similares
Bitácora electrónica(blog) con requisitos de acceso e interactividad PARCIAL 3 Q I.
Advertisements

Es una estructura de soporte para la comunidad educativa que busca hacer más integral la experiencia educativa con TIC. Es una plataforma de distribución.
DE LOCAL A GLOBAL: SISTEMA DE INFORMACIÓN DE COLECCIONES CIENTÍFICAS DEL MUSEO NACIONAL DE CIENCIAS NATURALES - SICoC - DE LOCAL A GLOBAL: SISTEMA DE INFORMACIÓN.
Comunicación en los Negocios Electrónicos. ¿Qué es una Intranet? Red de área local (LAN), que utiliza tecnología basada en Web, con protocolos abiertos.
OpenOffice.org (frecuentemente escrito OOo para abreviar) es una suite ofimática libre (código abierto y distribución gratuita) que incluye herramientas.
Departamento de Lenguajes y Sistemas Informáticos escuela técnica superior de ingeniería informática Extendiendo NDT para la catalogación de Requisitos.
1. Diversas herramientas de software libre para diseño. -Ingenio tu sitio -Compromisos de trabajos -El software y su licencia -Aspectos analizados 2.
Lenguajes de programación Web Juan Felipe Muñoz Fernández.
Clasificación del Software Prof. Laura Cardozo. Software Se denomina software, programática, equipamiento lógico o soporte lógico a todos los componentes.
Un modelo de Gestión Automatizada de Dispositivos IP mediante Software Libre Un Modelo de Gestión Automatizada de Dispositivos IP mediante Software Libre.
SOFTWA RE APLICATIVO Y DE DESARROLLO. Software aplicativo Software de Aplicación es todo programa informático diseñado para facilitar al usuario la realización.
Distribución en SO Libre para personas con movilidad reducida. Rompiendo barreras.
Introducción al Framework 3.0. Introducción Junto con Windows Vista se liberará al mercado una serie de tecnologías para desarrolladores de software que.
1 LENGUAJES DE PROGRAMACIÓN. Son aplicaciones específicas diseñadas para crear otras aplicaciones o programas. Son programas para crear programas. 2.
PROGRAMA DE CAPACITACIÓN CONTINUA PERSONAL NO DOCENTE UTN
Portales colaborativos
Software Registrar las participaciones, tareas, examenes de una manera más sencilla para el profesor, a través de un bolígrafo electrónica que detecte.
Conceptos a Base de Datos
Rafael Asprilla Universidad de Panamá ,
LOS DIFERENTES LENGUAJES DE PROGRAMACION PARA LA WEB
Conectividad de Bases de Datos
SOCIEDAD DE LA INFORMACION
Profesor: José Luis Gonzalez
Profesor: José Luis Gonzalez
TÍTULO DEL PROYECTO Plataformas Computacionales de Entrenamiento, Experimentación, Gestión y Mitigación de Ataques a la Ciberseguridad.
Preparatoria La Salle del Pedregal
TECNOLOGIA Y SU RELACION CON OTRAS AREAS DE CONOCIMIENTO
Introducción a Visual Studio .NET
Tema 6. Conceptos básicos de programación Clase 1
ATLAS CIBERNÉTICO DEL ESTADO DE MÉXICO
Informática Preparatoria
Máster en negocio, diseño y tecnología
Sistema Nacional de Información Ambiental (SINIA)
MENU SOFWARE Y HADWARE DISPOSITIVOS DE SALIDA DISPOSITIVOS DE ENTRADA
Es un programa Sistema de gestión de base de datos relacional creado y modificado por Microsoft para uso personal de pequeñas organizaciones. Es un componente.
¿Qué es un sistema operativo?
Implantación de una IDE en una gran corporación
CONOCIMIENTOS PREVIOS TELEMÁTICA
CUESTIONARIO INFORMATICO
Las herramientas Case Julian madrigal.
NUEVAS TECNOLOGIAS DE INFORMACION Y COMUNICACIÓN.
Tecnologías de Información y Comunicación I
Tecnologías de la información y la comunicación
Desencadenadores.
Los sistemas distribuidos y su middleware asociado deben proporcionar soluciones generales para lograr la protección de características indeseables a las.
Convergencia Tecnológica!!
Diferencias programador vs Ingeniero de software
Protocolos Protocolos de red.
CONCEPTOS BÁSICOS DE COMPUTACIÓN E HISTORIA
El espacio conceptual para la investigación de la Promoción y la Gestión Cultural CAPÍTULO 4 Las áreas temáticas son el centro de la propuesta de un posible.
CURSO PROGRAMACIÓN BÁSICA SEMANA 2
Aplicación de PSP (Personal Software Process)
Introducción a los algoritmos
Proyecto: Investigación sobre aplicaciones google.
NUEVAS TECNOLOGIAS DE INFORMACION Y COMUNICACIÓN.
SISTEMAS OPERATIVOS.
Instituto Tecnológico Superior de la Región Sierra
Sistema de Búsqueda de Respuestas
Impresión para hoteles y más...
Lingüística computacional
Electiva Tecnológica Herramientas Libres
, 1er Concurso de Innovación en Eficiencia Energética aplicado a Minería (CIEEaM)
DETECTOR PREDICTIVO DE CONEXIONES FRAUDULENTAS
¿PARA QUIENES ESTA ENFOCADO ESTE DIPLOMADO?
Statistical Data and Metadata Exchange - SDMX
Beneficios de Capacitación Tecnológica
Tecnologías y capacidades en Industria 4.0
¿Qué es Internet?.
ESTRUCTURA DE UNA PC.
LA INTERNET Clase 1.
Transcripción de la presentación:

Proyecto SIFIA Sistema de Inteligencia basado en Fuentes de Información Abierta

Proyecto SIFIA Índice y Proyectos Satélite

Proyecto SIFIA Beneficios del Software Libre ● Cada vez más demandado por la sociedad. ● Distribución a escala masiva. ● Aumenta la demanda de soporte. ● Se cobra por los servicios asociados, y no por la distribución del producto...

Proyecto SIFIA Introducción SIFIA: Inteligencia Proceso de obtener, evaluar y contrastar información. Tipos de Inteligencia: –Militar –Empresarial/Competitiva –Policial, política... Inteligencia Basada en Fuentes de Información Abiertas: basada en aquellas fuentes públicamente disponibles.

Proyecto SIFIA Introducción SIFIA: Ciclo de Inteligencia

Proyecto SIFIA Ejemplo de aplicación: Vigilancia Tecnológica

Proyecto SIFIA Introducción SIFIA: Necesidad de SIFIA Productos Similares: –Pentaho Open BI Suite: Conjunto de herramientas opensource y privativas. Solo hace minería de datos, no de textos. –Microsoft BI Suite: Office + SQL Server. Solo proporciona una interfaz de consulta.

Proyecto SIFIA Introducción SIFIA: Arquitectura de SIFIA

Proyecto SIFIA Introducción SIFIA: Información Adicional Desarrollado principalmente en Python. Más información en:

YAPP, Yet Another Paralell Python

YAPPDefinición “YAPP es un framework minimalista de programación distribuida asíncrona desarrollado en Python”

YAPPVentajas Simple. Compacto. Escrito en Python. Despliegue automático.

YAPPArquitectura

YAPP Nuevos elementos de proceso

JetTag, recuperación de información y etiquetado de la World Wide Web

JetTag Necesidades del proyecto SIFIA El proyecto SIFIA pretende que la Web sea una de sus fuentes principales de conocimiento. ¿Cómo extraer información útil de la Web?

JetTag Proyecto Satélite de SIFIA JetTag nace como proyecto satélite dentro de SIFIA.

“JetTag es una herramienta de uso general que facilita la tarea de extraer información de la Web” ¿Qué procedimientos utiliza para extraer información de una fuente tan diversa?... JetTagDefinición

La extracción de datos debe permitirnos obviar cierta información no necesaria para algunas consultas: La Web como fuente de información La naturaleza de la Web: información que no aporta conocimiento

Aprovechando la estructura de algunas webs para extraer la mayor cantidad de información posible: La Web como fuente de información La naturaleza de la Web: aprovechando la estructura

Y aplicar a estos datos una serie de etiquetas: La Web como fuente de información Etiquetando la información

La Web como fuente de información Resultado Final Dando como resultado una salida de datos totalmente estructurada: XML, JSON, CSV.

La Web como fuente de información JetTagConf: ficheros de configuración Y un fichero de configuración que nos permite repetir la consulta posteriormente: ¿Probamos JetTag?...

ClassOn, Software libre de clasificación y etiquetado automático

El ser humano lo clasifica todo: ● Open Directory Project (Dmoz). ● Directorios de nuestro ordenador. ● Categorías de los sistemas americano y europeo de patentes. ClassOn Clasificación y Etiquetado Automático

El texto es la principal vía de comunicación en Internet. Las estadísticas revelan que un 95% de la información de la Red es desestructurada. A día de hoy sólo esta clasificado un 10% de la información que circula nuestras redes. (Fuente: Estudio de IDC, patrocinado por EMC ClassOn Clasificación y Etiquetado Automático

Algoritmos clásicos: Redes bayesianas (Filtros antispam). k-ésimo vecino más cercano. Máquinas de vectores de soporte. ClassOn Clasificación y Etiquetado Automático

Problema: Extraer sobre qué tipo de patentes puede referirse un texto. Muchas categorías con muchos ejemplos de cada una. Las máquinas de vectores de soporte se adaptan a este problema. ClassOn Clasificación y Etiquetado Automático

Minería de Datos. Minería de Conceptos. Extracción de conceptos de un texto. Saber sobre qué temas trata, de qué habla. ClassOn Clasificación y Etiquetado Automático

La Wikipedia: Un enorme repositorio de conceptos. Un texto por concepto, no tratamos con categorías. Relacionar un texto con los textos que son similares de la Wikipedia. ClassOn Algoritmo ClassOn

Ontopya, almacén de conocimientos

“SIFIA necesita un sistema de almacenamiento escalable y que trabaje con modelos de conocimiento.” Ontopya ¿Por qué surge Ontopya?

Integración de los siguientes elementos: Base de datos relacional‏. ORM (Object-relation mapping)‏. Interfaz Web de administración. Aplicación de modelado UML. Ontopya Solución Propuesta

OntopyaArquitectura

2 * SubclassOf hasRelations Diagramas Clases UML OWL-Lite OntopyaMetamodelo

OntopyaUniversoClase propiedad Subclase Clase ** Cualquier modelo de datos que cumpla: Herencia de clases simple Relaciones muchos a muchos Relaciones nombradas

OntopyaFases Definición dinámica ontología Creación automática modelo de datos Gestión datos mediante ORM

parent * MODELO * METAMODELO * Ontopya Definición dinámica de ontologías

METAMODELO API UML WEB OWL Ontopya Definición dinámica de ontologías

API Ontopya Definición de ontologías desde API

WEB Ontopya Definición de ontologías desde Web

UML Ontopya Definición de ontologías desde UML

OWL Ontopya Definición de ontologías desde OWL

Ontopya Creación automática de modelos de datos MODELO METAMODELO

MODELO BASE DE DATOS Ontopya Creación automática de modelos de datos

Gestión de objetos a través del ORM de Django: API Ontopya Gestión de datos mediante el ORM

MODELO CLASES METAMODELO OWL WEB UML API MODELO E/R Ontopya Para finalizar...

Gracias Preguntas y Sugerencias