Bases de Datos Avanzadas

Slides:



Advertisements
Presentaciones similares
Base de Datos Distribuidas FUNDAMENTOS DE BASES DE DATOS DISTRIBUIDAS
Advertisements

BASES DE DATOS DISTRIBUIDAS M.C.C. María Guadalupe Villanueva Carrasco INGENIERIA EN SISTEMAS COMPUTACIONALES.
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE HIDALGO Instituto de Ciencias Económico Administrativas.
INTEGRANTES EVARISTO MINA ARROYO JULIO CESAR CUERO JOHN EDWIN URBANO MAFLA.
 Arquitectura  Ventajas y desventajas  Ejemplos.
Terminal Services Alumno : Juan Noa Saccatoma. ¿Qué es? Es un componente del Sistema Operativo que básicamente me permite dos cosas: Instalar aplicaciones.
CONCEPTOS BÁSICOS DE REDES. ALUMNO: LUIS MANUEL GARCÍA ESPINOZA MAESTRO: CRISTÓBAL CRUZ MATERIA: INFORMÁTICA GRADO Y GRUPO: 3°C.
CONCEPTOS BÁSICOS DE REDES. ALUMNO: LUIS MANUEL GARCÍA ESPINOZA MAESTRO: CRISTÓBAL CRUZ MATERIA: INFORMÁTICA GRADO Y GRUPO: 3°C.
Conferencia # 3 Ingeniería de Software II
Estructuras de interconexión de un computador
BASE DE DATOS INTRODUCCION.
U.T. 11: Introducción A Las Bases De Datos
Sistemas Distribuidos
Introducción a los Sistemas Computacionales
Sistemas Distribuidos
CIENCIA TECNOLOGÍA Y SOCIEDADES
Introducción a los protocolos de enrutamiento dinámico
INSTITUCION EDUCATIVA SAN ISIDRO DE CHICHIMENE
Construcción de una red de área local
MODELO CLIENTE -SERVIDOR
Fundamentos de negocios y comercio electrónico.
REDES DE COMPUTADORAS SEGÚN TOPOLOGÍA
Los sistemas de información en las empresas y los demás sistemas.
REDES DE COMPUTADORAS SEGÚN TOPOLOGIA.
INTRODUCCIÓN Elmasri: Pág
Conectividad de Bases de Datos
Sistema Distribuido para entidad bancaria
Sistema de Bases de Datos
Software de aplicación de escritorio y web
Colegio de estudios científicos y tecnológicos del estado de Michoacán, plantel 16 huandacareo *Aero ADMIN* -Guillermo Reyes Ortiz -David.
DATA WAREHOUSE Y ALMACENAMIENTO
Definición de redes de computadoras
SISTEMAS DISTRIBUÍDOS
Modelo de 3 capas. Qué es la arquitectura de una aplicación? La arquitectura se refiere a la forma en la que es diseñada tanto física como lógicamente.
Universidad manuela beltran - virtual
Definición de un Sistema Distribuido
Bases de Datos Daniel Rojas UTN.
Nombre: Adrián de la Torre López
Sesión INTERNET Lic. ElÍas RIVERA DÁVILA.
Herramienta tareas ¿Que es internet? ¿Cómo funciona internet?
CIENCIA TECNOLOGÍA Y SOCIEDADES
BASE DE DATOS FRANCISCO BOLÍVAR GAVILANES LAINES.
Escritorios Virtuales
Sistemas de Supervisión, Control y Adquisición de Data (SCADA).
Holi boli Bai.
Bases de DATOS Alumno: Villaseñor Suárez José Alberto Grupo: 2CM10
Protocolos Protocolos de red.
CONCEPTOS BÁSICOS DE COMPUTACIÓN E HISTORIA
REDES.
Instituto Tecnológico Superior de la Región Sierra
Jornadas de Puertas Abiertas en: Facultad de Informática
PROYECTO INFORMÁTICO ¿QUÉ ES UN PROYECTO INFORMÁTICO?
MODELAMIENTO DE BASES DE DATOS
MIDDLEWARE Y PROGRAMACION WEB DISTRIBUIDA. ¿ QUE ES MIDDLEWARE?
INSTITUTO TECNOLÓGICO SUPERIOR DE ACAYUCAN
Instituto Tecnológico Superior de la Región Sierra
INSITUTO TECNOLOGICO SUPERIOR DE ACAYUCAN
Generaciones de Bases de Datos
Archivos - Bases de datos
Sistema Gestor de Bases de Datos (SGDB)
Bases de Datos Distribuidas Ing. Fernando Ortiz Ahumada
Introducción a las bases de datos (I)
ESTRUCTURA DE SISTEMAS OPERATIVOS Carbajal Rojas karla.
Arquitectura de una aplicación
SQL1 7/9 Baloian Acceso a Bases de Datos
BASES DE DATOS DISTRIBUIDAS ING. ROSA GRACIELA CASTRO CARRERA.
1 TEMA 10. SISTEMAS OPERATIVOS DISTRIBUIDOS Introducción Hardware Software Aspectos de diseño.
Ha llegado el momento de dar una mirada al interior de los Sistemas Operativos. En las siguientes secciones examinaremos cuatro estructuras distintas.
Cliente Servidor Petición Respuesta Aplicaciones Cliente-Servidor.
ING. NANCY BASILIO MARCELO ADMINISTRACIÓN REDES DE COMPUTADORAS.
Transcripción de la presentación:

Bases de Datos Avanzadas Conf 1. Introducción a las Bases de Datos Distribuidas.

Introducción a la Asignatura Temas de la Asignatura (42 h clases) Base de Datos Distribuidas. Base de Datos de Objetos. Data Warehouse Sistema de Evaluación: Seminario: semana 6 Trabajos de Control: semana 6 y 11 Tarea Final Entrega: semana 8 Defensa: semana 14

TEMA 1 BASE DE DATOS DISTRIBUIDAS

Incorporar a los SGBD capacidades para trabajar con una BDD BASE DE DATOS DISTRIBUIDA BASE DE DATOS CENTRALIZADA Acceso concurrente Demoras en la respuesta Las empresas tienen distribuida la información de forma lógica y física Incorporar a los SGBD capacidades para trabajar con una BDD Definir un método de diseño para fragmentar, asignar y replicar los datos

Conferencia1 Introducción a las BDD Contenido: Surgimiento de las Bases de Datos Distribuidas (BDD). Definición de BDD. Objetivos de los SBDD. Ventajas y Desventajas de las BDD. Arquitectura de los SBDD.

Objetivos: Describir las características de los Sistemas de Bases de datos Distribuidos, así como sus ventajas y desventajas. Explicar la arquitectura de un Sistema de Base de Datos Distribuido.

Bibliografía: “Introducción a los Sistemas de Bases de Datos”. 3ra parte. C. J. Date. Editorial Félix Varela. 2003. 7ma edición. Capítulo 20 páginas 651-693. “Fundamentals of Database Systems”. Third Edition. Ramez Elmasry and Shamkant B. Navathe.  

Surgimiento de las BDD: Base de Datos Centralizada Propiciado por: desarrollo de las redes de computadoras desarrollo de los microprocesadores con aumento de sus capacidades la expansión territorial de las empresas

Surgimiento de las BDD Empresa Compuesta por muchas dependencias. Distantes unas de otras. Con necesidades informativas fundamentalmente asociadas a datos locales. Condiciones ideales para el diseño de un Sistema basado en una BDD

“Un SBDD consiste en una colección de sitios, conectados por medio de algún medio de comunicación, en el cual: Cada sitio es un SBD completo por derecho propio (BD reales, usuarios locales, SGBD local, ...) Los sitios han acordado trabajar juntos, de manera que un usuario puede acceder a los datos de cualquier lugar como si los datos estuvieran guardados en el propio sitio del usuario.”

Definición de BDD Varios nodos conectados por canales de comunicación. Cada nodo puede procesar programas y almacenar datos. Todos los nodos no tienen que poseer igual configuración. Los nodos son equivalentes y deciden si procesan una tarea. El sistema es transparente para los usuarios.

. . La Habana Las Villas UC UC BD BD Líneas de comunicación Terminales

BDD en una Red de Área Local: CENTRO DE CÓMPUTO INDUSTRIAL 1 INFORMATICA 3 BD 1 PC 1 LAN CUJAE BD 3 PC 3 BD 2 PC 2 ARQUITECTURA 2

Principio Esencial de las BDD ANTE UN USUARIO, UN SISTEMA DISTRIBUIDO DEBE LUCIR EXACTAMENTE IGUAL QUE UN SISTEMA NO DISTRIBUIDO.

BDD: Colección de datos sobre una red, que pertenecen, lógicamente, a una misma BD. La información está almacenada físicamente en diferentes sitios. En cada sitio, la parte correspondiente de la información es una base de datos en sí misma. Las BDs locales tienen sus propios: usuarios locales, SGBD, SW para administración de transacciones y administrador local de comunicación de datos

Objetivos de los SBDD Autonomía Local Las operaciones en un sitio se controlan en ese sitio. Los datos pertenecen a alguna base de datos local que se encarga de su seguridad, integridad y almacenamiento.

Objetivos de los SBDD: No dependencia de un sitio central No debe existir un servicio atendido en un sitio central. El sitio central podría ser un “cuello de botella”. El sistema podría ser “vulnerable”: si el sitio central falla, todo el sistema falla.

Objetivos de los SBDD: Operación continua Un sitio individual continúa funcionando aún cuando ocurran fallas en otro lugar. Replicar facilita esto. Mayor confiabilidad Mayor disponibilidad

Objetivos de los SBDD: Independencia de la ubicación Los usuarios no necesitan conocer dónde están ubicados físicamente los datos. Simplifica los programas de los usuarios. Permite redistribuir los datos.

Objetivos de los SBDD: Independencia de fragmentación Para los usuarios, lógicamente, es como si no existieran fragmentos. Fragmentación Distribución de relaciones por nodo (Proyección). Distribución de ocurrencias por nodo (Selección). Fragmentación mixta.

Objetivos de los SBDD: Independencia de fragmentación Simplifica los programas de los usuarios. Permite redistribuir los fragmentos. Los datos pueden almacenarse donde se utilizan con mayor frecuencia (Desempeño). Posibilita reconstruir las relaciones originales.

Objetivos de los SBDD: Independencia de replicación Para los usuarios, lógicamente, es como si los datos no estuvieran replicados. Replicación De todos los datos (Total). De parte de los datos (Parcial). Sin duplicar datos (Cero Redundancia).

Objetivos de los SBDD: Independencia de replicación Redundancia controlada. Garantizar la propagación de la actualización. Algunos productos comerciales no la garantizan plenamente.

Objetivos de los SBDD: Procesamiento de consultas distribuidas Costo de la transmisión de datos por la red (número y volumen de mensajes). La optimización es crucial: mover la menor cantidad de datos por la red.

Objetivos de los SBDD: Gestión de transacciones distribuidas Los mecanismos de control de concurrencia y de recuperación deben prevenir bloqueos mortales, cuellos de botella y otras fallas que se acentúan en un SBDD. Independencia de hardware Posibilidad de ejecutar el mismo o diferentes SGBD en diferentes plataformas de hardware, dando una imagen de sistema único.

Objetivos de los SBDD: Independencia del Sistema Operativo Posibilidad de ejecutar el mismo o diferentes SGBD en diferentes plataformas de Sistema Operativo, dando una imagen de sistema único. Independencia del Red Posibilidad de soportar una variedad de redes de comunicación distintas dando una imagen de sistema único.

Objetivos de los SBDD: Independencia del SGBD Posibilita que existan diferentes SGBD, pero que soporten una misma interfaz que estandarice la visibilidad de los datos y las consultas en un sistema distribuido. Compartir los datos entre los nodos Almacenar los datos en los lugares de uso más frecuentes Controlar el crecimiento

Ventajas de las BDD: Uso compartido de datos de todos los nodos. Mayor fiabilidad y disponibilidad de datos. Agilización del procesamiento de consultas. Una BDD refleja mejor la estructura de empresas dispersas.

Desventajas de las BDD: Mayor complejidad para garantizar coordinación entre localidades. Costo del desarrollo de software. Mayor posibilidad de errores. Mayor tiempo extra de procesamiento.

Desventajas de las BDD: Posibilidad de empeorar el rendimiento. Muchas actualizaciones concurrentes. Sobre datos duplicados. Que estén muy distribuidos.

Desventajas de las BDD: Procesamiento difícil de controlar. Computadoras en áreas de trabajo de los usuarios. Acceso físico ocasionalmente no controlado. La recuperación es mas difícil de sincronizar.

Arquitectura ANSI de una BD Centralizada . . . NIVEL EXTERNO (vistas de usuarios individuales) NIVEL LÓGICO GLOBAL (vista general) NIVEL INTERNO (vista de almacenamiento)

Arquitectura ANSI de una BDD Capa de usuario (aplicaciones, pantallas de entrada de datos, reportes) Capa conceptual (modelo del negocio subyacente) Capa física (modelo físico, estructura de la BD)

Arquitectura ANSI de una BDD Fragmentar el esquema global para construir las BD locales. Cada BD local representa el modelo ANSI/SPARC para BD centralizadas. Extender el esquema global con información sobre la localización.

Ejemplo BDD EMPLEADO CALIFICADOR DE CARGO ENO ENOMBRE TITULO E1 Juan Rodríguez Ingeniero Eléctrico E2 Miguel Sánchez Analista de Sistemas E3 Armando Lagareta Ingeniero Mecánico E4 Beatriz Molleja Programador E5 Jorge Castañeda E6 Luis Chávez E7 Roberto Dávila E8 Julia Jiménez CALIFICADOR DE CARGO TITULO SALARIO Ingeniero Eléctrico 40000 Analista de Sistemas 34000 Ingeniero Mecánico 27000 Programador 24000

Ejemplo BDD PUESTO DE TRABAJO LUGAR DE TRABAJO JNO JNOMBRE LUGAR J1 Instrumentation Matanzas J2 Desarrollo de bases de datos La Habana J3 CAD/CAM Cienfuegos J4 Mantenimiento J5 ENO JNO PUESTO DUR E1 J1 Administrador 12 E2 Analista 24 J2 6 E3 J3 Consultor 10 J4 Ingeniero 48 E4 Programador 18 E5 E6 E7 36 J5 23 E8 40

LA HABANA La Habana lugar de trabajo La Habana empleados La Habana puestos de trabajo RED DE COMUNICACIONES MATANZAS CIENFUEGOS Matanzas lugar de trabajo Matanzas empleados Matanzas puestos de trabajo Calificador de cargos Cienfuegos lugar de trabajo Matanzas empleados Matanzas puestos de trabajo La Habana empleados

Problemas de los Sistemas Distribuidos 1 Dependen de la calidad y vulnerabilidad de las redes de comunicación por lo que se debe reducir su uso. 2 Información distribuida incrementa vulnerabilidad por lo que hay que incrementar mecanismo de seguridad en los sitios y protegerlos frente a accesos remotos.

Problemas de los Sistemas Distribuidos 3 Puede ser peor el rendimiento: muchas actualizaciones concurrentes, sobre datos duplicados, que estén muy distribuidos. 4 El procesamiento de la BD es difícil de controlar porque las computadores están en áreas de trabajo de los usuarios, el acceso físico a veces es no controlado y la recuperación es más difícil de sincronizar.

Problemas de los Sistemas Distribuidos 5 Mayor complejidad para garantizar coordinación entre las localidades, lo que incrementa el costo de desarrollo del software, aumenta la posibilidad de errores y se requiere mayor tiempo extra de procesamiento. Procesamiento de consultas. Administración del catálogo. Propagación de actualización. 6 Necesidad de mecanismos avanzados para: Control de recuperación. Control de concurrencia.

Arquitectura Cliente-Servidor “La arquitectura cliente-servidor se define como una forma de sistemas distribuidos donde el SW se divide en tareas del cliente y tareas del servidor. El cliente envía solicitudes a un servidor según un protocolo de comunicación y el servidor responde a estas peticiones. Puede existir un servidor centralizado o varios servidores distribuidos. Los clientes y servidores pueden ubicarse en diferentes nodos de la red con independencia de HW, SO y ubicación física”.

Arquitectura Cliente-Servidor UN SISTEMA CLIENTE-SEVIDOR PUEDE SER VISTO COMO UN SISTEMA DISTRIBUIDO EN EL CUAL TODAS LAS SOLICITUDES SE ORIGINAN EN UN SITIO Y TODO EL PROCESAMIENTO EN OTRO.

Arquitectura Cliente-Servidor ¿Problema de los sistemas distribuidos? DISTRIBUCIÓN DE LA INFORMACIÓN ¿Problema de los sistemas cliente-servidor? DEFINICIÓN DE CAPAS INDEPENDIZAR LOS COMPONENTES DEL CONTEXTO GLOBAL TANTO COMO SEA POSIBLE Y QUE CADA CAPA CONSTITUYA UN ELEMENTO DE AGRUPACIÓN DE TODOS LOS COMPONENTES QUE TIENEN UNA FUNCIONALIDAD COMÚN. PRINCIPIO QUE RIGE LA DEFINICIÓN DE CAPAS

Conclusiones Un sistema de base de datos distribuida se compone de un conjunto de localizaciones o sitios conectados entre sí mediante algún tipo de red de comunicación, en el cual: Cada sitio es una BD en sí mismo. Los sitios han convenido en trabajar juntos (si es necesario con el fin de que un usuario de cualquier sitio pueda obtener acceso a los datos de cualquier punto de la red, tal como si los datos estuvieran almacenados en el propio sitio del usuario. Aunque los datos están distribuidos en fragmentos que pueden estar almacenados en uno o unos pocos sitios, estos comparten un esquema global común que es el punto de partida del proceso de fragmentación.

Percepción del usuario FRAGMENTACIÓN HORIZONTAL Percepción del usuario Estudiante Nombre CI Año académico Facultad Pedro Pérez 78110347944 5 Industrial Rebeca Rdguez 85122493486 1 Química María López 80012379533 4 Rubén García 83080135135 2 Facultad de Industrial (Fragmentación horizontal) Estudiante Nombre CI Año académico Facultad Pedro Pérez 78110347944 5 Industrial María López 80012379533 4 Rubén García 83080135135 2

Percepción del usuario FRAGMENTACIÓN VERTICAL Percepción del usuario Estudiante Nombre CI Año académico Facultad Pedro Pérez 78110347944 5 Industrial Rebeca Rdguez 85122493486 1 Química María López 80012379533 4 Rubén García 83080135135 2 Comedor (Fragmentación vertical) Estudiante Nombre CI Pedro Pérez 78110347944 Rebeca Rdguez 85122493486 María López 80012379533 Rubén García 83080135135