La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Global Biodiversity Information Facility Mayo 2007 - Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa-

Presentaciones similares


Presentación del tema: "Global Biodiversity Information Facility Mayo 2007 - Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa-"— Transcripción de la presentación:

1 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- GLOBAL BIODIVERSITY INFORMATION FACILITY GBIF Proveedores de datos Estándares y Protocolos de Intercambio

2 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Contenidos l GBIF l qué es l trabajo y principios l proveedores actuales l cómo se proporcionan datos l protocolos + estándares utilizados l paquetes software disponibles l Formatos de intercambio para especímenes y observaciones l Estándar Darwin Core 2: versiones 1.2 y 1.4 l Estándar ABCD l DiGIR l Protocolo l DiGIR provider software l Caso Práctico I. Instalación de DiGIR provider l UDDI l Plataforma UDDI l UDDI en GBIF l Registro y Actualización l Caso práctico II. Registro y Navegación en el UDDI de GBIF l Portales de GBIF l Caso práctico III. Navegación en los portales de búsqueda de GBIF l TAPIR: l Protocolo l TapirLink software l Caso práctico IV. Instalación TapirLink, manejo y migración desde DiGIR

3 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- l GBIF es una iniciativa internacional que se propone hacer accesible a través de Internet de forma gratuita toda la información disponible sobre los organismos vivos conocidos a nivel mundial l Concebida a instancias de la OCDE ( Organización para la Coorperación y el Desarrollo Eeconómico ) l 1996, MegaScience Forum Working Group- encargado de lanzar iniciativas científicas de interés fundamental pero que por su escala no eran abordables por país alguno. l En este foro surge el concepto de GBIF con la idea de aplicar la informática como mecanismo para facilitar y administrar información proveniente de la naturaleza l Los miembros son estados, economías y organizaciones internacionales l Los estados miembros se comprometen a establecer uno ó más nodos a través de los que compartir su información sobre biodiversidad contribuyendo además económicamente a la inciativa INFRAESTRUCTURA MUNDIAL DE INFORMACIÓN EN BIODIVERSIDAD GBIF

4 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- TRABAJO Y PRINCIPIOS DE GBIF l Trabaja para construir la principal red de bases de datos sobre biodiversidad, herramienta fundamental en el desarrollo científico de los países y que contribuirá a una mejor protección y uso de la biodiversidad en el planeta l Principios: l Los proveedores de datos tienen el control sobre los mismos, sus bases de datos tienen entidad por sí mismas y se reconocen los derechos de propiedad intelectual l Promueve una arquitectura no centralizada, y el uso de software de código abierto l Esta red se construye a partir de fuentes hetereogéneas relativas a datos primarios: l Especimenes, Observaciones y Nombres

5 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Incorporación de datos a GBIF: estándares, protocolos y servicios Unidad de Coordinación GBIF.ES, 2007 La arquitectura de GBIF Esta charla se centra en esta franja

6 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Proveedores de Datos l Actualmente: l 201 Proveedores de datos l 1086 Colecciones l Más de 125 millones de registros de especimenes/observaciones.

7 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- ¿Como se proporcionan los datos a GBIF? l A través de un modelo en el que los proveedores puedan: l Controlar y gestionar el acceso a los datos l Proporcionar los metadatos tanto de las instituciones como de las colecciones l Uso de paquetes software desarrollados ó recomendados por gbif.org l Registro en el UDDI l Fuente de datos previamente avalada por el nodo l l [Servicio de Alojamiento de la Unidad de Coordinación GBIF.es]

8 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Estándares y protocolos en biodiversidad Existe una gran cantidad de información sobre biodiversidad a nivel mundial ( Número esperado de especies: 10 millones. 1.7 millones han sido descritas y nombradas. Número total de especímenes en las colecciones del mundo de 1-3 mil millones.) Accesibilidad + Compartición + Integración (S.O y B.D) + Evitar la duplicación de esfuerzos Para hacer posible el intercambio de información sobre biodiversidad (interoperabilidad) l Formatos de intercambio de información (definición de datos comunes) + l Protocolos que permitan la comunicación y el transporte de esos formatos [TDWG:Foro de debate para proyectos de datos biológicos, desarrollando y promoviendo el uso de estándares para facilitar el intercambio de datos, y evitar la duplicidad de esfuerzos]

9 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Paquetes de Software GBIF recomienda el uso de diversos paquetes de software (provider package) compuestos por: -Un formato de intercambio de datos común (estándar) -Un protocolo que sea capaz de reconocer y manejar dicho formato a través de internet DiGIR protocol (http://www.digir.net/)http://www.digir.net/ + Darwin Core ( BioCASE protocol ( + ABCD (http://www.bgbm.org/TDWG/CODATA/default.htm) [TAPIR protocol (http://www.tdwg.org/activities/tapir/)]

10 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Versiones soportadas Las combinaciones de protocolos + formatos de intercambio Formato de IntercambioProtocolo Darwin Core 1.2DiGIR Darwin Core 1.4DiGIR MaNIS (original)DiGIR MaNIS 1.21DiGIR Darwin Core 1.2 plus OBIS extension DiGIR ABCD 1.20BioCASe ABCD 1.48BioCASe ABCD 2.05BioCASe ABCD 2.06BioCASe

11 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Paquetes de Software l DiGIR Provider (php) l Desarrollado a partir del data provider de digir.sourceforge.net y modificado para que sea capaz de trabajar con el registro UDDI l Soportado por el Secretariado Internacional de GBIF (workshops, helpdesk) l GBIF Data Repository Tool l Herramienta para Nodos que permite crear y gestionar un servicio de alojamiento (almacena datos subidos en formato documento, como hojas excel,documentos de Word, etc) l DiGIR,Python, Zope y MySQL l Soportado por el Secretariado Internacional de GBIF Disponibles desde: GBIF tools downloads: (http://www.gbif.org/serv/gbif-tools)http://www.gbif.org/serv/gbif-tools l BioCASE - BioCASE wrapper 2.0 (http://www.biocase.org/provider/)http://www.biocase.org/provider/ l TAPIR - PyWrapper v3 (http://trac.pywrapper.org/pywrapper/)http://trac.pywrapper.org/pywrapper/ l TAPIR-TapirLink

12 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Darwin Core 2 (DwC) l Estándar diseñado para facilitar el intercambio de información de datos primarios de biodiversidad a través de internet l Características: l Para datos de colecciones y datos observacionales l Representa un mínimo común denominador en la la información a compartir. l Información en espacio y tiempo: El qué, el cuando y el dónde. (+extensiones 1.4) l Simplicidad: l minimizando las barreras entre los proveedores de datos l maximizando la disponibilidad para los usuarios l Para intercambio, no para modelado de datos l Historia: l Inicios: The Species Analyst - Universidad de Kansas.The Species Analyst l En 2002 MaNIS - de la Universidad de Berkeley. 1ª red distribuida basada en DiGIR + Darwin Core (MANIS version)MaNIS l Desde TDWG. Última versión -Draft (adaptación nueva arquitectura TDWG). Task Group:Darwin Core (DwC)

13 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Darwin Core 2 (DwC) l Estadísticas de uso a nivel mundial (fuente: para DiGIR)http://bigdig.ecoforge.net/ Número de proveedores:210 Número de fuentes (resources):1225 Número de registros: l Versiones: [ El documento que define el estándar es un XML Schema (*.xsd) ] l DwC 1.2 schema Primera versión (usada en GBIF) DwC 1.2 schema l DwC 1.21 schema revisión (usada en GBIF, MaNIS, HerpNet, OrNIS, y FishNet2) DwC 1.21 schemaGBIFMaNISHerpNet OrNISFishNet2 l DwC 1.3 schema Presentado en el TDWG Meeting 2004 (no utilizada) DwC 1.3 schema l DwC 1.4 schema Borrador bajo discusión (no para uso) DwC 1.4 schema l OBIS Basada en DwC 1.2 (usada en GBIF, Ocean Biogeographic Information System) OBISGBIFOcean Biogeographic Information System

14 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Darwin Core 1.2 l XML Schema: l Contiene 48 elementos no jerarquizados de los cuales 5 campos son obligatorios l Proveedores que utilizan esta versión a nivel mundial (fuente: /darwin2.xsdhttp://digir.sourceforge.net/schema/conceptual/darwin/2003/ 1.0/darwin2.xsd + xsd l Estructurados en: l Identificación:ScientificName, Kingdom, Phylum, Class, Order, Family, Genus, Species, Subspecies, ScientificNameAuthor, IdentifiedBy, YearIdentified, MonthIdentified, DayIdentified, TypeStatus. l Preparación y Conservación:InstitutionCode, CollectionCode, CatalogNumber, BasisOfRecord, Sex, PreparationType, IndividualCount. l Recolección y Notas:Collector, CollectorNumber, FieldNumber, Notes,PreviousCatalogNumber l El cuándo:YearCollected, MonthCollected, DayCollected, JulianDay, TimeOfDay. El dónde: ContinentOcean, Country, StateProvince, County, Locality, Longitude,Latitude, CoordinatePrecision, BoundingBox, MinimumElevation, MaximumElevation, MinimumDepth, MaximumDepth

15 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Darwin Core Documento traducido al español: DateLastModified *InstitutionCode *CollectionCode *CatalogNumber * ScientificName *BasisOfRecordKingdomPhylum ClassOrderFamilyGenus SpeciesSubspeciesScientificNameAuthorIdentifiedBy YearIdentifiedMonthIdentifiedDayIdentifiedTypeStatus CollectorNumberFieldNumberCollectorYearCollected MonthCollectedDayCollectedJulianDayTimeOfDay ContinentOceanCountryStateProvinceCounty LocalityLongitudeLatitudeCoordinatePrecision BoundingBoxMinimumElevationMaximumElevationMinimumDepth MaximumDepthSexPreparationTypeIndividualCount PreviousCatalogNumberRelationshipTypeRelatedCatalogItemNotes

16 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Campos de Darwin Core 1.2 l DateLastModified: La fecha y hora de la ultima modificación del registro según norma ISO 8601 en UTC(GMT). Ejemplo: "5 de Noviembre 5, 1994, 8:15:30, Madrid (GMT+1:00)" sería " T7:15:30Z" l InstitutionCode: Un código que identifica la institución o centro a la que la colección pertenece. No existe ningún registro global para la asignación de los códigos; utiliza el código que es estándar dentro de tu disciplina. l CollectionCode: Un valor alfanumérico único que identifica la colección dentro de la institución. l CatalogNumber: Un texto alfanumérico único que identifica un registro individual dentro de una colección. Se recomienda que este valor proporcione una clave por la que el espécimen en cuestión puede ser identificado. Si el espécimen tiene varios elementos como por ejemplo varios tipos de preparación, este valor debería identificar la componente individual del espécimen. l ScientificName: nombre completo de menor rango especificado en la identificación del organismo. l BasisOfRecord: Una descripción que indica si el registro representa una observación (O), un organismo vivo (L), un espécimen testigo (S), germoplasma/semilla (G) etc. l Kingdom: El nombre del reino al que pertenece el organismo. l Phylum: El nombre de la división al que pertenece el organismo. l Class: El nombre de la clase al que pertenece el organismo. l Order: El nombre del orden al que pertenece el organismo. l Family: El nombre de la familia al que pertenece el organismo. l Genus: El nombre del género al que pertenece el organismo. l Species: El nombre de la especie al que pertenece el organismo. l Subspecies: El nombre de la subespecie al que pertenece el organismo. l ScientificNameAuthor: El autor o autores del nombre científico. Se debe ajustar a las convenciones de la disciplina taxonómica correspondiente.

17 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Campos de Darwin Core 1.2 l IdentifiedBy: El/los nombre/s de la/s persona/s que asignaron el nombre científico, actualmente aceptado, al objeto catalogado. l YearIdentified: El año de la identificación, con cuatro dígitos, p. ejemplo 1906, 2002 etc. l MonthIdentified: El mes de la identificación, con dos dígitos [01..12]. l DayIdentified: El día del mes de la identificación, con dos dígitos [01..31]. l TypeStatus: Indica la designación más reciente del ejemplar como tipo nomenclatural. l CollectorNumber: Un número identificador (en formato texto) aplicado al ejemplar en el momento de la recolección. Establece enlaces entre diferentes partes/preparaciones de un único espécimen y entre notas de campo y el espécimen. l FieldNumber: Un número identificador (en formato texto) aplicado en el momento de la recolección a un conjunto de material que se ha generado durante una única recolección. l Collector: El/los nombre/s del/los recolector/es responsable/s de la recolección o que hizo la observación. l YearCollected: El año durante el que el ejemplar ha sido recolectado en el campo, siempre con cuatro dígitos, p.ej l MonthCollected: El mes del calendario durante el que el ejemplar ha sido recolectado en el campo, siempre con dos dígitos, [01…12]. l DayCollected: El día del mes durante el que el ejemplar ha sido recolectado en el campo, siempre con dos dígitos, [01…31]. l JulianDay: El día ordinario del año (o sea, el número de días pasados desde el día 31 de Diciembre del año anterior, el 1 de Enero es JulianDay 1) en que el ejemplar ha sido recolectado. Puede ser calculado mediante los campos YearCollected, MonthCollected, y DayCollected.

18 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Campos de Darwin Core 1.2 l TimeOfDay: La hora en que el ejemplar ha sido recolectado, expresado como hora decimal desde medianoche, hora local (p.ej.: 12.0 y 13.5). l ContinentOcean: El nombre completo del continente u océano donde el ejemplar ha sido recolectado. l Country: El país o la unidad política mayor donde el espécimen ha sido recolectado, expresado según la norma ISO con código de dos letras, p.ej. España = ES. l StateProvince: El nombre completo de la provincia del que el ejemplar ha sido recolectado. l County: El nombre completo del municipio del que el ejemplar ha sido recolectado. l Locality: Descripción de la localidad de recolección. l Longitude: La longitud de la localización donde el ejemplar ha sido coleccionado, expresado en grados decimales. l Latitude: La latitud de la localización donde el ejemplar ha sido coleccionado, expresado en grados decimales. l CoordinatePrecision: Una estima de cómo de cerca ha sido especificada la localidad de recolección; expresada en la distancia en metros que corresponde al radio alrededor de la localidad. Utiliza NULL si el error es desconocido, si no se puede estimar o si no aplica. l BoundingBox: Proporciona un mecanismo para ejecutar búsquedas utilizando un cerco. Un cerco normalmente no está presente en la base de datos, pero se puede generar a partir de los campos Latitude y Longitude. (este dato NO es devuelta en las búsquedas) l MinimumElevation: La distancia mínima en metros por encima (positivo) o por debajo (negativo) del nivel del mar en que se encuentra la localidad de recolección. l MaximumElevation: La distancia máxima en metros por encima (positivo) o por debajo (negativo) del nivel del mar en que se encuentra la localidad de recolección.

19 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Campos de Darwin Core 1.2 l MinimumDepth: La distancia mínima en metros por debajo de la superficie del agua donde la recolección ha sido realizada; todo el material recolectado tiene al menos esta profundidad. Positivo por debajo de la superficie, negativo por encima (p. ejemplo: recolecciones por encima del nivel del mar en zonas de marea). l MaximumDepth: La distancia máxima en metros por debajo de la superficie del agua donde la recolección ha sido realizada; todo el material recolectado tiene al menos esta profundidad. Positivo por debajo de la superficie, negativo por encima (p.ejemplo: recolecciones por encima del nivel del mar en zonas de marea). l Sex: Código que representa el sexo del organismo (propuesto: M=macho, F=hembra, H=hermafrodita, I=sin determinar (examinado pero no pudo ser determinado), U=desconocido (no examinado), T=transicional (entre sexos, útil para hermafroditas secuénciales) l PreparationType: Una lista de métodos de preparación y conservación del ejemplar (piel, cráneo, esqueleto, animal entero (ETHO), preparación microscópica, etc.). Se refiere a un único registro de colección. l IndividualCount: El número de individuos presentes en un lote o contenedor a que el número de catalogo se refiere. No es una estima de la abundancia o densidad en la localidad de recolección. l PreviousCatalogNumber: Lista de códigos de colección asignados previamente al ejemplar. Tiene que ser compuesto por el código del centro y del código de la colección, aunque quizás ya no existan. l RelationshipType: Un nombre o código que identifica el tipo de relación entre el registro de la colección y el registro de la colección referenciada. Valores que puede tener: "parasite of", "epiphyte on", "progeny of", etc. En futuras versiones del esquema este atributo podría ser interesante. l RelatedCatalogItem: El identificador completo del registro con el cual está relacionado (una referncia a otro espécimen); Compuesto por: Institution Code, Collection Code y Catalogue Number del registro con el que se relaciona (los tres elementos separados por un espacio). l Notes: Cualquier anotación que se desee realizar sobre el registro (espécimen u observación).

20 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Darwin Core 1.4 l Estado:Draft. Se encuentra bajo desarrollo para adaptarse a la nueva arquitectura del TDWG l Formado por un núcleo central de elementos y una serie de extensiones con información adicional: l de una disciplina en concreto l simplemente información extra l Independiente del protocolo DiGIR l Incluye GlobalUniqueIdentifier l XML Schema: Core: Extensión curatorial: Extensión geoespacial: Extensión Paleontológica

21 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Darwin Core 1.4 l Core: l Elementos a nivel de registro: GlobalUniqueIdentifierGlobalUniqueIdentifier, DateLastModified, BasisOfRecord, InstitutionCode, CollectionCode, CatalogNumber, InformationWithheld, RemarksDateLastModifiedBasisOfRecord InstitutionCodeCollectionCodeCatalogNumberInformationWithheld Remarks l Elementos taxonómicos: ScientificNameScientificName, HigherTaxon, Kingdom, Phylum, Class, Order, Family, Genus, SpecificEpithet, InfraspecificRank, InfraSpecificEpithet, AuthorYearOfScientificName, NomenclaturalCodeHigherTaxonKingdomPhylumClassOrderFamily GenusSpecificEpithetInfraspecificRankInfraSpecificEpithet AuthorYearOfScientificNameNomenclaturalCode l Elementos de Identificación : IdentificationQualifer l Elementos referentes a la localidad y localización: HigherGeographyHigherGeography, Continent, WaterBody, IslandGroup, Island, Country, StateProvince, County, Locality, MinimumElevationInMeters, MaximumElevationInMeters, MinimumDepthInMeters, MaximumDepthInMetersContinentWaterBodyIslandGroupIslandCountry StateProvinceCountyLocalityMinimumElevationInMeters MaximumElevationInMetersMinimumDepthInMeters MaximumDepthInMeters l Elementos referentes al evento de recolección : CollectingMethodCollectingMethod, ValidDistributionFlag, EarliestDateCollected, LatestDateCollected, DayOfYear, CollectorValidDistributionFlagEarliestDateCollected LatestDateCollectedDayOfYearCollector l Elementos biológicos: SexSex, LifeStage, AttributesLifeStageAttributes l Elementos de referencia: ImageURLImageURL, RelatedInformationRelatedInformation

22 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Darwin Core 1.4 l Extension Curacional: l Elementos a nivel de registro: CatalogNumberNumericCatalogNumberNumeric, IdentifiedBy, DateIdentified, CollectorNumber, FieldNumber, FieldNotes, VerbatimCollectingDate, VerbatimElevation, VerbatimDepth, Preparations, TypeStatus, GenBankNumber, OtherCatalogNumbers, RelatedCatalogedItems, Disposition, IndividualCountIdentifiedByDateIdentifiedCollectorNumber FieldNumberFieldNotesVerbatimCollectingDateVerbatimElevation VerbatimDepthPreparationsTypeStatusGenBankNumber OtherCatalogNumbersRelatedCatalogedItemsDisposition IndividualCount l Extensión Geoespacial: l Elementos Geoespaciales: DecimalLatitudeDecimalLatitude, DecimalLongitude, GeodeticDatum, CoordinateUncertaintyInMeters, PointRadiusSpatialFit, VerbatimCoordinates, VerbatimLatitude, VerbatimLongitude, VerbatimCoordinateSystem, GeoreferenceProtocol, GeoreferenceSources, GeoreferenceVerificationStatus, GeoreferenceRemarks, FootprintWKT, FootprintSpatialFitDecimalLongitudeGeodeticDatum CoordinateUncertaintyInMetersPointRadiusSpatialFit VerbatimCoordinatesVerbatimLatitudeVerbatimLongitude VerbatimCoordinateSystemGeoreferenceProtocolGeoreferenceSources GeoreferenceVerificationStatusGeoreferenceRemarksFootprintWKT FootprintSpatialFit l Extensión Paleontológica: l Elementos Paleontológicos: EarliestEonOrLowestEonothem, LatestEonOrHighestEonothem, EarliestEraOrLowestErathem, LatestEraOrHighestErathem, EarliestPeriodOrLowestSystem, LatestPeriodOrHighestSystem, EarliestEpochOrLowestSeries, LatestEpochOrHighestSeries, EarliestAgeOrLowestStage, LatestAgeOrHighestStage, LowestBiostratigraphicZone, HighestBiostratigraphicZone, LithostratigraphicTerms, Group, Formation, Member, Bed

23 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- ABCD (Access to Biological Collections Data ) l ABCD Access to Biological Collections Data (2.0.6a) l Para datos de colecciones biológicas (especímenes y observaciones) l Proporciona definiciones semánticas l Estructura jerárquica (alta estructuración con gran número de elementos. Pretende cubrir un máximo de detalle) l Trabaja con extensiones l Posibilidad de trabajo con diferentes niveles de detalle (atomización/fusión) l Incluye GUIDs l Indica en que idioma está la información contenida l Permite la repetición de registros (por ejemplo revisiones) l Compatibilidad con Darwin Core (versiones 1.2 y 1.4), HISPID (Herbarium Information Standards and Protocols for Interchange of Data ), etc. l

24 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Compatibilidad DwC-ABCD l Darwin Core (DwC) y ABCD son estándares complementarios l Dwc es una estructura plana representa el mínimo común denominador l ABCD. Para máximo detalle de los registros; está estructurado de forma jerárquica y soporta la repetición de elementos l Para asegurar la interoperabilidad la traducción entre ambos estándares debe de estar asegurada. l Los elementos de DwC han sido mapeados a ABCD l URL del mapeo: wCAndExtensions.htm wCAndExtensions.htm

25 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- DiGIR: Distributed Generic Information Retrieval l Es un protocolo cliente/Servidor para recopilar datos desde fuentes distribuidas. l Usa HTTP como protocolo de transporte y XML para la codificación de los mensajes entre cliente y servidor. l Tres tipos de mensajes: l Metadata: Obtiene los metadatos de los proveedores y de las fuentes de datos servidas. l Search: Encuentra registros de especimenes y observaciones que cumplen un criterio de búsqueda, por ejemplo: el nombre de una especie y/o un rectángulo que define un área de la superficie de la tierra y/o … l Inventory: Obtiene el conjunto de valores asociados a un concepto. Por ejemplo: Especies. l Proporciona un único punto de acceso a varias fuentes distribuidas de información l Trabaja con el estándar de intercambio Darwin Core2 (para especimenes y observaciones), estableciendo la correspondencia entre las bases de datos de las colecciones y este formato.

26 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- DiGIR Provider: ¿Como Trabaja? Servidor DiGIR Servidor Fuente de datos Metadatos del Provider Metadatos de las fuentes HTTP XML mensaje de metadatos mensaje de buqueda/inventario Fuente de datos Fuente de datos Fuente de datos Fuente de datos

27 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- DiGIR Provider: ¿Dónde se integra? l Proveedor (DiGIR): recibe peticiones del portal y las procesa devolviendo los registros almacenados en las bases de datos que cumplan la petición de búsqueda realizada por el portal. l Portal: Este es el punto de entrada para los usuarios y/o aplicaciones. El portal remitirá las peticiones a los correspondientes proveedores de forma totalmente transparente al usuario presentando la información en un formato común. l Registro: Provee las páginas amarillas de los proveedores existentes

28 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- DiGIR y Darwin Core2 l Request: T18:30:19+02: search bioshare.com true

29 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- DiGIR y Darwin Core2 l Response $Revision: 1.10 $ :33: T225000Z bioshare.com pyy 4 Diarsia mendica T220000Z bioshare.com pyy 6 Lycia lapponaria T220000Z bioshare.com pyy 7 Plutella maculipennis false (obtenida según:) l/darwin/brief/2003/1.0/darwin2brief.xsd

30 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Paquete GBIF DiGIR Provider l Incluye: l El software del DiGIR Provider. l Servidor Web Apache2 l Y librerías de PHP. l Solo se necesita tener conocimientos básicos del sistema operativo. l Disponibles para: ( _package ) _package l Linux (RedHat 7.3, 8, 9) l MS Windows (2000, XP) l Permite registrar nuestro proveedor de datos de forma automática en el Servidor UDDI de GBIF (GBIF UDDI Registry: )

31 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Paquete GBIF DiGIR Provider l Bases de datos soportadas: l MySQL, PostgreSQL l MS SQL Server, MS Access (solo en el pquete de DiGIR para MS Windows) l Oracle 8i/9i l Conexión a los datos Hay dos alternativas a la hora de conectar el software a la tabla/s con los datos a mostrar: 1. Mapeando en la Base de Datos (rápidas consultas con índices, disponible en Biotella). Mediante una vista, consulta, … 2. Mapeando directamente desde DiGIR Provider (no es necesario del trabajo de la base de datos)

32 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Paquete GBIF DiGIR Provider l Herramientas de test: l Metadata: nomhttp:// nombreservidor:puerto /digir/test/eg_metadata.php /digir/test/eg_metadata.php l Inventory: nombreservidor:puerto /digir/test/eg_inventory.p hp nom /digir/test/eg_inventory.p hp l Search: nombreservidor:puerto /digir/test/eg_search.php nombreservidor:puerto /digir/test/eg_search.php l Caso práctico I.Instalación DiGIR provider (I.DiGIR_Provider.pdf)

33 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Monitorización DiGIR providers- The Big Dig l The "Big Dig" es un proyecto de ecoforge.net desarrollado en 2006 por el Natural History Museum and Biodiversity Research Center of the University of Kansas l Servicio que genera de manera automática informes del estado y las características de los DiGIR providers l Status:Una vez al día l Schema: Una vez a la semana l Evalua el estado de las instalaciones de los DiGIR provider l Examina registros y reporta las características del software instalado l Status, versión, número de colecciones, número de registros, schema, tiempo de respuesta, encoding l Ayuda a los administradores ante posibles problemas l

34 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- UDDI (Universal Description Discovery & Integration ) l Registro público diseñado para almacenar de forma estructurada información sobre empresas y los servicios web que éstas ofrecen l Es accedido por mensajes SOAP y da paso a documentos WSDL l Tiene métodos para publicar y encontrar información de negocios y especificaciones de sus servicios. l Los 4 principales tipos de datos: l businessEntity: representa la información básica del negocio. Por ejemplo, información de contacto, clasificación, descripciones, etc. l businessService: describe un servicio proporcionado por el negocio. l bindingTemplate: contiene la URL de su punto de acceso y una referencia a uno o más tModel l tModel: descripción abstracta de una especificación o comportamiento particular el cual forma el Servicio Web. businessEntity tModel businessService bindingTemplate businessService bindingTemplate tModel

35 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- UDDI de GBIF l Registro automático: herramienta de registro on-line [recomendado]. l El proveedor será registrado y el GBIF Helpdesk informará al gestor del Nodo del dominio seleccionado Registro automático en el GBIF UDDI

36 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Registro y Actualizaciób en el UDDI de GBIF l Utilización de los valores de los elementos definidos como metadatos del proveedor (más alguna información extra). l Business Entity l business name: {el del de la institución} l description: {la localización (URL) que apunta al de la institution } l Business Service l service name: {El común del proveedor} (tu.nombre.servidor) l description: {Un de la información del } l Binding Template l access point: l description: Punto de acceso del { } l Actualización de la información guardada en el registro: l Caso práctico II: Registro y navegación en UDDI de GBIF (II.UDDI_GBIF.pdf)

37 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- Portales de Búsqueda l Portales de búsqueda de GBIF: l Portal de la Unidad de Coordinación de GBIF Espana: (DiGIR portal) l Portal de GBIF l Nueva generación de portales: l Caso práctico III. Navegación por los portales de búsqueda de GBIF (Ver III.Navegacion_Portal.pdf)

38 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- TAPIR (TDWG Access Protocol for Information Retrieval ) l TAPIR es un protocolo para acceso a datos estructurados provenientes de bases de datos distribuidas de estructura lógica y física diferentes l TAPIR combina las características de los protocolos BioCASe y DiGIR y amplía las posibilidades de comunicación entre aplicaciones cliente y proveedores de datos a través de Internet l Su potencialidad permite la interoperabilidad no solo entre especimenes u observaciones si no que se puede utilizar en otros dominios (geológico, ecológico, clima, secuenciación genética, geoespacial, etc.) l Implementaciones: l wrapper applications : l PyWrapper (v3) primera implementación del TAPIR provider l TapirLink (0.3.1) l La primera red en implementar TAPIR: Plant Genetic Resources Community – CGIAR (Grupo Consultivo para la Investigación Agrícola Internacional ) – Generation Challenge Programme l Autores: l Markus Döring, Renato De Giovanni

39 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- TAPIR (TDWG Access Protocol for Information Retrieval ) l Características: l Trabaja con GUIDs l TAPIR Request/Response l requests pueden ser hechas en: l documentos XML l Key-Value Pairs (KVP) l responses siempre codificadas en XML l Operaciones posibles: l ping l metadata l capabilities (servicios) l inventory l search l No trabaja con un esquema en concreto l Especificaciones y autores: cation_ html cation_ html l Esquema:

40 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- TAPIR transporte l Transporte: http get/post l Puntos de acceso: urls pueden ser descubiertos por UDDI l Request (encoding): l KVP (get/post method) (Obligatorio para todas las implementaciones) l XML (opcional) l HTTP POST body l HTTP POST/GET 'request' parameter l Responses: l En XML l HTTP Content-Type= "text/xml l Compuesto por header section + resultado (estructurado según el output model) + sección de diagnóstico (opcional)

41 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- TAPIR l Conceptual Binding l Conceptual Schemas (capa de abstración de datos) l Formatos: XML Schema, RDF Schema, etc l DarwinCore, ABCD,… l Concepts (definidos externamente) l Concept Name Servers l Output Models l Para operaciones de búsqueda l Definen qué tipo de contenido + estructura l Documentos que definen respuestas posibles de nuestro provider l En XML, basadas en XML Schema l Los nodos del esquema han de estar mapeados con conceptos de uno ó más conceptual schemas l Dos tipos de configuración (capabilities) l Knownoutputmodels (los creados ó reconocidos por nosotros) l Anyoutputmodels necesarios l CNS l Query Templates l A la definición de contenido +estructura añade filtros parametrizables predefinidos para search e inventory l CNS

42 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- TAPIR l Search request: Ejemplo de request en una operación tipo serarch con XML –el outputModel en este caso está definido in-line

43 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- TAPIR l Search response:

44 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- TapirLink l TapirLink es un software de implementación del protocolo TAPIR desarrollado en PHP TapirLink l Una instalación de TapirLink > n fuentes de datosTapirLink l Cada fuente de datos 1 punto de acceso (interacciones) l Cada fuente de datos puede ser mapeada con uno ó más esquemas conceptuales basados en el patrón de la nueva versión (1.4) de DwC l Home: l Download: ckage_id= ckage_id= l Developers: RenatoDeGiovanni, DaveVieglais, CraigWieczorek, KevinRichardsRenatoDeGiovanniDaveVieglais KevinRichards

45 Global Biodiversity Information Facility Mayo Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa- TapirLink l Características: l Soporta todas las operaciones del protocolo: metadata, capabilities, inventory, search y ping l request encodings: KVP and XML l Inventory: conceptos mapeados l Search: output models conceptos mapeados l Response structures: basicSchemaLanguage l Logs request l Filtros "Equals" and "like" pueden ser sensitivos a may/min l Interface web para configuración. Incluye: l Importación de configuración de DiGIR l Registro automático enel UDDI l Cliente (test) l LSID authority resolver l Limitaciones: l Sirve instancias de la misma clase, no de diferentes (n especímenes a su vez con múltiples identificaciones, imágenes) l Caso práctico IV. Instalación TapirLink, manejo y migración desde DiGIR (IV.TapirLink.pdf)


Descargar ppt "Global Biodiversity Information Facility Mayo 2007 - Estándares y Protocolos de Intercambio - Unidad de Coordinación- GBIF.es - Silvia Lusa-"

Presentaciones similares


Anuncios Google