CLARIN, una infraestructura para la investigación en Humanidades y Ciencias Sociales que garantizará: La infraestructura garantatizará la escalabilidad.

Slides:



Advertisements
Presentaciones similares
Publicaciones científicas apoyadas con tecnologías de información Jorge Walters Gastelu Marzo de 2004 Santiago, Chile.
Advertisements

Herramientas informáticas
Introducción a la Nueva Interfaz de ISI Web of Knowledge Novedades y características, febrero de 2008
PROVISIÓN DE SERVICIOS WEB DINÁMICOS ASOCIADOS A VIDEO BASADOS EN DISPOSITIVOS MÓVILES Autor: Juan Carlos Álvarez Martín Tutor: Francisco Javier Finat.
Cognos Data Integration
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
Gestión del conocimiento en intranets corporativas:
1 Red.es impulsando la Educación 1. Contexto 2. Objetivos 3. Actuaciones 3.1. Infraestructuras 3.2. Contenidos 3.3. Aplicaciones 3.4. Formación de docentes.
Recursos de información para la docencia y la investigación (2012) Sesión 6: Repositorios Complutenses: Archivo Institucional y Complumedia.
Gestión descentralizada de un portal cooperativo para la difusión de contenidos digitales Dra. Dominique Babini Consejo Latinoamericano de Ciencias Sociales.
Herramientas para la Investigación
Seminario Internacional sobre
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Sistemas Operativos Distribuidos Plataforma Cliente/Servidor
La web semántica y su impacto en la recuperación de información
EndNote X2.
Tecnología de Información Proyecto Intranet Corporativa Noviembre 2003.
Patricia Muñoz Palma Directora Programa de Información Científica
IDES - 20 de Noviembre Gestión descentralizada de un portal cooperativo para la difusión de contenidos digitales Dra. Dominique Babini Consejo Latinoamericano.
- Jaramillo Sánchez Diego Sebastián
El desafío de organizar la información
FUENTES DE INFORMACIÓN
Software de Gestión Documental Document Management Software
© Manuel ColladoHerramientas software-1 Herramientas software Clasificación. Integración de herramientas.
Universidades participantes del proyecto
INTERFAZ DE ACCES DISEÑO DE BASE DE DATOS
WOK para investigadores: Researcher ID Mayo 2010.
Eurostat Unit A6 – Statistical cooperation SDMX Seminar Seminario para contribuir a la modernización de la transmisión de datos y metadatos estadísticos.
Autor: Antonio Sarasa Cabezuelo Directora: María Antonia Huertas.
UNIDAD I Conceptos Básicos.
Segundo semestre PLAN DE ESTUDIOS 2011
Tutorial EDS: Servicio de Búsqueda Para Usuarios Corporativos support.ebsco.com.
Diseño de una Base de datos
Bases de Datos II OLAP Online Analytical Processing
CONCEPTOS DE NUEVOS SISTEMAS 1. Un sistema de manejo de información 1. Un sistema de manejo de información Desde la perspectiva del usuario final todas.
Arquitectura de una aplicación
Accesibilidad Emmanuelle Gutiérrez y R. Coordinadora del en las Redes.
DATA WAREHOUSE Equipo 9.
/ Teléfono : Web : Build Solutions IT.
Definición de Etiquetas Semánticas Dentro de la Tesis Digital para Realizar Búsquedas de Información Pertinente Dra. Rocío Abascal-Mena DC-2006, México.
El Periotrónico: XML en un periódico electrónico a la carta Vicente Luque Centeno Área de Ingeniería Telemática Universidad Carlos III de Madrid I Seminario.
Dime con quién andas: Las Bases de Datos Bibliográficas como Herramientas de Medición Jane M. Russell Barnard Instituto de Investigaciones Bibliotecológicas.
Computación en la Nube UASF.
Interoperabilidad, Estrategia en la atención al paciente crónico
Servidores Conceptos Generales.
Herramientas de uso libre para el manejo de los datos
Presentación a la CRUE-TIC, en la sesión estratégica Repositorios y federación de identidades 22 de octubre de 2010, Jaén.
REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD NACIONAL EXPERIMENTAL SIMÓN RODRÍGUEZ COORDINACIÓN DE DESARROLLO PROFESORAL NÚCLEO BOLÍVAR FACILITADOR:
Presenta: Lic. Gloria Concepción Tenorio Sepúlveda. Asesor Tutor: Mtro. Fernando Gustavo Lozano Martínez. Asesor Titular: Dra. María Soledad Ramírez Montoya.
PAGINAS WEB.
5.- Aplicaciones software Procesador de textos Hoja de cálculo Bases de datos Programas de estadística Informática Aplicada al Trabajo Social. Universidad.

MICROSOFT POWER POINT 2010.
Tecnologías para el Aprendizaje
Web Semántica La Web Semántica es la nueva generación de la Web, que intenta realizar un filtrado automático preciso de la información. Para ello, es necesario.
1 Clase 3 Registro de resultados Tecnología de la Comunicación I.
Información cualitativa sobre el uso de los objetos de aprendizaje Núria Ferran y Julià Minguillón Universitat Oberta de Catalunya II Simposio Pluridisciplinar.
Modelo OSI Surgimiento del Modelo OSI ¿Que es el Modelo OSI?
Búsqueda de Información en Internet
SHUTTENBORG ACCESS CONOCE LOS PROGRAMAS. Cortés Gamboa Lizzeth
GUIA para la adscripción de centros o grupos de trabajo promotores y registro de experiencias en la Red de Experiencias de Educación para la Salud en la.
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
EXTRANET E INTRANET.
PROGRAMA NUESTRAS CIUDADES SISTEMA DE INFORMACION PARA LA GESTION URBANA TERRITORIAL.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
BPMN COMO HERRAMIENTA DE MODELADO DE NEGOCIO PARA LA CREACIÓN DE MODELOS CONCEPTUALES Integrantes Horenstein, Nicolás Gómez, Federico IDJEI 52.
Repositorios de recursos digitales educativos
Tutorial EBSCO Discovery Service Para Usuarios Corporativos support.ebsco.com.
DLM Transact SQL Sesión I Introducción al SQL Server Uso de las herramientas de consultas del Transact SQL.
Construir un sistema de información en Internet e-conecta + zahén.
Transcripción de la presentación:

CLARIN, una infraestructura para la investigación en Humanidades y Ciencias Sociales que garantizará: La infraestructura garantatizará la escalabilidad facilitando el crecimiento de la red La persistencia y durabilidad de los recursos son clave para el futuro Los recursos y servicios se basarán en tecnologías como la Web Semántica para superar las diferencias de formato, estructura y terminología actualmente existentes CLARIN garantizará la integración de recursos y servicios mediante la tecnología Grid formando un dominio virtual integrado integrated: the resource and service centres are connected via Grid technology and form a virtually integrated domain interoperable: the resources and services will be based on Semantic Web technologies to overcome format, structure and terminological differences stable: the resources and services are offered with a high availability persistent: the resources and services are planned to be accessible for many years so that researchers can rely on them accessible: the resources and services are accessible via the web; different access methods and training possibilities are offered tailored to the needs of the communities making use of them extendable: the infrastructure is open so that new resources and services can be added easily Fácil accesibilidad vía web atendiendo a las necesidades de cada comunidad Garantizará la estabilidad de los recursos

Localización Data Managing Difusión Análisis CLARIN proveerá infraestructura para todas las fases del proceso de investigación acceso y extracción de la información, ‘Knowledge Discovery’, ... Localización gestión de la información y contenidos, depuración, meta-información, data-sharing, gestión del workflow, ... Data Managing publicación e indexación de resultados, visibilidad, reusabilidad, Web Semántica, ... Difusión explotación de datos, herramientas de análisis, “análisis distribuido”,... Análisis

LOCALIZACIÓN de la INFORMACIÓN LOCALIZACION LOCALIZACIÓN de la INFORMACIÓN Dificultad en localizar y acceder a la información y recursos en un escenario donde éstos crecen de manera espectacular y de modo distribuido Escenario: montones de información distribuida. Dificultad en localizar y acceder a la información y recursos

CLARIN facilitará la localización y acceso a los recursos (tanto de la web visible como de la web invisible), sobre la base de una red de centros capaces de ofrecer repositorios y servicios persistentes y estables registrando los recursos para facilitar su localización. LOCALIZACION

Una vez localizados los recursos, su acceso es complejo y redundante ... Obtenemos resultados en diferentes formatos y criterios de ordenación... formulario búsqueda navegación login Tenim localitzats els proveidors 2) Per a cada prveidor tenim: login, navegació, formulari, etc ... 3) Los resultados de cada consulta se nos presentan en diferentes formatos y criterios de orden ....

CLARIN actuará como interfaz única, simplificando tanto la autentificación de usuarios como el acceso a los datos..... ACCESO CLARIN guardará registro de consultas y sesiones para poder reproducirlas,... CLARIN permitirá personalizar los resultados......

Una vez obtenidos los datos y recursos, CLARIN facilitará el acceso a herramientas de gestión y organización GESTION de DATOS clasificación almacenamiento búsquedas visualizaciones meta-información MARCADORES.............. data-sharing anotación indexación

ANALISIS Nos encontramos ante un escenario en el cual tenemos (i) gran cantidad de datos heterogéneos y dispersos. (ii) gran variedad de recursos computacionales distribuidos que nos ofrecen infinidad de posibilidades de análisis y procesos. ANALISIS CLARIN afrontará el reto de la heterogeneidad de datos, plataformas, aplicaciones y recursos computacionales dispersos. La tecnología (Grid, servicios web,...) nos permite definir un nuevo escenario en el que el investigador tenga (i) fácil acceso a datos, (ii) herramientas de análisis y (iii) suficiente capacidad de procesamiento

ANALISIS clasificación visualización anotación automática estadísticas ontologías clasificación visualización estadísticas análisis cualitativos data-mining resumen automático anotación automática análisis cuantitativos query expansion etiquetadores analizadores búsquedas named entity recognition extracción informacion reconocimiento voz diccionarios segmentadores conversión formato

DIFUSION CLARIN dará acceso a servicios que facilitarán la difusión de los resultados de la investigación. Para ello dará soporte a la integración de recursos y resultados en la infraestructura. El objetivo es garantizar la interoperabilidad y reusabilidad de los recursos generados, asegurar que los esfuerzos invertidos no caen en saco roto dotando al sistema de repositorios estables y persistentes. aumentar la visibilidad y el impacto estratégico de la investigación así como favorecer sinergias y un mayor retorno de las investigaciones UDDI, Web Semántica, open terminology, APIS, repositorios RDF, editores de metadatos, OWL, herramientas para añadir conocimiento a recursos existentes, integración de recursos en dominios, ISO, estándares, ...

CLARIN, un paso hacia las e-HUMANIDADES La nuevas tecnologías no sólo nos permiten hacer lo que siempre hemos hecho de manera más eficiente, sino que nos abren nuevas posibilidades hasta ahora inimaginables. Podemos realizar nuevos tipos de experimentos y operaciones que generan nuevos tipos de datos. Tenemos ante nosotros el reto de ser capaces de usar, explotar y compartir esos datos. La ‘investigación distribuida’ sólo es posible bajo estándares que garanticen la interoperabilidad entre sistemas heterogéneos de modo que puedan intercambiar procesos y datos. Un escenario así favorece sinergias y permite aprovechar y maximizar los resultados de la investigación así como garantizar la reusabilidad de los recursos generados. El investigador en humanidades debería poder acceder a los datos de estudio de manera fácil (estén dónde estén) y disponer de suficiente capacidad de procesamiento para realizar los análisis y operaciones que desee.

ESCENARIO e-HUMANIDADES (lingüística) Escenario I en el que un investigador en lingüística accede a diferentes corpus, utiliza otro servidor para desformatear los textos, los envía a un etiquetador morfosintáctico (que a su vez consulta un léxico) y, finalmente, utiliza herramientas estadísticas localizadas en otro servicio web para obtener los cálculos deseados. Todo ello desde su propio ordenador y con una única interfaz.

(comunicación- sociolingüística) corpus diccionario desformateador ESCENARIO e-HUMANIDADES (comunicación- sociolingüística) Escenario II en el que un investigador en sociolingüístico o comunicación accede a diferentes corpus, utiliza otro servidor para desformatear los textos, y, finalmente los envía a un nuevo servidor que, consultando servicios externos (diccionarios y corpus de referencia) extrae indicadores de lengua. Estos indicadores permitirán al investigador tener datos sobre el uso de la lengua en el corpus de estudio. Todo ello desde su propio ordenador y con una única interfaz.

ESCANARIO e-HUMANIDADES (archivística) tagger ESCANARIO e-HUMANIDADES (archivística) Desformateador segmentador Extracción palabras clave reconocedor nombres propios léxico gazeteer Escenario III en el que un experto en archivística utiliza CLARIN para obtener metadatos documentales de los e-textos que se encarga de archivar e indexar. Para ello, los textos son segmentados y etiquetados antes de ser enviados a un servicio de extracción de palabras clave y a un reconocedor de nombres propios. A su vez, este servicio, utiliza diferentes recursos (gazeteer, léxico).

(filología - literatura) ESCENARIO e-HUMANIDADES (filología - literatura) Analizador cuantitativo léxico Desformateador / segmentador analisis campos semanticos análisis puntuación léxico tesaurus ontología Escenario IV en el que un investigador en literatura utiliza CLARIN para obtener análisis cuantitativos de las obras literarias que investiga. Para ello los textos, son enviados a diferentes servicios que (i) proporcionan información estadística sobre el léxico utilizado, (ii) analizan los campos semánticos cubiertos por los textos, (iii) cuantifican el uso de los signos de puntuación, ... Estos indicadores permiten al investigador obtener datos sobre el uso de la lengua y estilo en el corpus de estudio.