La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

TEORIA Y DISEÑO DE BASE DE DATOS ING. GIAN PIERRE SOLORZANO REVILLA DBA.

Presentaciones similares


Presentación del tema: "TEORIA Y DISEÑO DE BASE DE DATOS ING. GIAN PIERRE SOLORZANO REVILLA DBA."— Transcripción de la presentación:

1 TEORIA Y DISEÑO DE BASE DE DATOS ING. GIAN PIERRE SOLORZANO REVILLA DBA

2 TEMARIO-SEMANA 1 SISTEMAS DE INFORMACION-DEFINICION Y CARACTERISTICAS BASE DE DATOS-DEFINICION VENTAJAS Y DESVENTAJAS TIPO DE BASE DE DATOS NIVELES ABSTRACCION BD

3 CONCEPTO-SISTEMAS CONJUNTO DE PARTES O ELEMENTOS ORGANIZADAS Y RELACIONADAS QUE INTERACTUAN ENTRE SI PARA LOGRAR UN OBJETIVO. LOS SISTEMAS RECIBEN (ENTRADA) DATOS, ENERGIA O MATERIA DEL AMBIENTE Y PROVEEN (SALIDA) INFORMACION,ENERGIA O MATERIA

4 SISTEMAS DE INFORMACION UN SISTEMAS DE INFORMACION DEFINIDO TECNICAMENTE ES UN CONJUNTO DE COMPONENTES INTERRELACIONADOS QUE RECOPILAN, PROCESAN, ALMACENA Y DISTRIBUYE INFORMACION PARA SOPORTAR LA TOMA DE DESICIONES Y EL CONTROL EN LA ORGANIZACION UN SISTEMA DE INFORMACION DEFINIDO DESDE LA PERSPECTIVA DEL NEGOCIO BUSCA INTEGRAR INFORMACION BRINDANDO SOLUCIONES ORGANIZACIONAL Y ADMINISTRATIVAMENTE BASADADOS EN TI, ADAPTANDOSE A LOS CAMBIOS DEL AMBIENTE

5 ELEMENTOS Y CARACTERISTICAS DATOS EQUIPO (HW) PROGRAMAS (SW) PERSONAL RETROALIMENTACION MEDIO-AMBIENTE TODO SISTEMA CONTIENE OTRO SISTEMA Y/O SUBSISTEMAS

6 SISTEMAS DE INFORMACION PROCESOS-CICLO ENTRADA PROCESAMIENTO CLASIFICACIÓN CALCULO SALIDA AMBIENTE SISTEMA DE INFORMACION Retroalimentación Clientes ¨Proveedores Instancias reguladoras Competidores Inversionistas

7 PROCESOS Y USO DE LA INFORMACION EN UNA ORGANIZACION

8 TIPO DE SISTEMAS

9 FORMA TRADICIONAL DE RESOLVER PROBLEMAS DE MANEJO DE INFORMACION aplicacion1 aplicacion2 aplicacion3 PARA CADA NUEVA APLICACION SE CREA UN NUEVO ARCHIVO.UN SISTEMA GRANDE TIENE CIENTOS DE ARCHIVOS PLANOS A B C A B C A BC

10 ARCHIVOS PLANOS NO HAY RELACION ENTRE LOS ARCHIVOS ALTO RIESGOS DE INCONSISTENCIA DE DATOS CAMBIAR LA ESTRUCTURA DE UN ARCHIVO IMPLICA CAMBIOS EN LOS PROGRAMAS

11 PROBLEMAS CON LOS SISTEMAS DE ARCHIVOS TRADICIONALES 1.ALTO NIVEL DE REDUNDANCIA: El mismo dato se almacena en muchos lugares, lo que ocasiona que este dato puede tener diferentes valores en diferentes lugares. 2.Un sistema que maneja archivos tradicionales es INFLEXIBLE. 3.Las consultas de información que requieren que los datos se agrupen en diferentes formas no pueden ser respondidas rápidamente. 4.Es muy costoso hacer cambios a sistemas que manejan archivos tradicionales. Un cambio trivial provoca una reacción en cadena de otros cambios.

12 ANTE LOS PROBLEMAS TRADICIONALES APARECE UNA MEJOR SOLUCION: EL USO DE BASE DE DATOS BD UNA BASE DE DATOS ES UNA COLECCION COMPARTIDA DE DATOS INTERRELACIONADOS DISEÑADOS PARA CUMPLIR CON LAS NECESIDADES DE MUCHOS TIPOS DE USUARIOS FINALES

13 BASE DE DATOS-DIAGRAMA

14 TIPOS DE BD BASE DE DATOS JERARQUICO: Es aquella donde los datos se presentan en niveles múltiples representado con raíz y sus ramificaciones

15 TIPOS DE BD BASE DE DATOS DE RED: Es aquella que permite la conexión de sus nodos en forma multidireccional, por lo que cada nodo puede tener varios dueños a la vez

16 TIPOS DE BD BASE DE DATOS RELACIONAL: En informática, tipo de base de datos o sistema de administración de bases de datos, que almacena información en tablas (filas y columnas de datos) y realiza búsquedas utilizando los datos de columnas especificadas de una tabla para encontrar datos adicionales en otra tabla. En una base de datos relacional, las filas representan registros (conjuntos de datos acerca de elementos separados) y las columnas representan campos (atributos particulares de un registro).

17 NIVELES DE ABSTRACCION DB ARQUITECTURA DE NIVELES DEL SGBD: UTILIZADA PARA LA PROTECCIÓN DE LA INDEPENDENCIA DE DATOS DE LAS POSIBLES ABSTRACCIONES DE DATOS. TRES NIVELES DE ABSTRACCIÓN: NIVEL LÓGICO: DEFINICIÓN DE LAS ESTRUCTURAS DE DATOS QUE CONSTITUYEN LA BASE DE DATOS. NIVEL FÍSICO. SE ELIGE UNA IMPLEMENTACIÓN PARA CADA UNA DE LAS ESTRUCTURAS DEFINIDAS EN EL ESQUEMA LÓGICO. NIVEL EXTERNO: SE DEFINEN VISTAS PARCIALES DE LA BASE DE DATOS PARA DISTINTOS GRUPOS DE USUARIOS. EL SGBD DEBE ASEGURAR QUE LOS CAMBIOS REALIZADOS EN CUALQUIERA DE LOS NIVELES NO AFECTE A LOS NIVELES SUPERIORES

18 NIVELES ABSTRACCION

19 VENTAJAS-DESVENTAJAS DE UNA BASE DE DATOS VENTAJAS REDUCE LA REDUNDANCIA DE LA INFORMACION PERMITE COMPARTIR LA INFORMACION FACILITA EL DESARROLLO DE APLICACIONES REDUCE LOS COSTOS DE MANTENIMIENTO PERMITE DAR UNA RESPUESTAS RAPIDA A LOS NUEVOS REQUERIMIENTOS DE INFORMACION FACILITA LA APLICACION DE ESTANDARES DESVENTAJAS ES DIFICIL ENCONTRAR UN SISTEMA MANEJADOR DE BASE DE DATOS QUE CUMPLA CON TODOS LOS OBJETIVOS LOS SISTEMAS DE BASE DE DATOS ACTUALMENTE CONSUMEN MAS RECURSOS COMPUTACIONALES QUE LOS SISTEMAS TRADICIONALES DE ARCHIVO HAY UNA FALTA DE PERSONAL CAPACITADO PARA APLICAR CORRECTAMENTE LA FILOSOFIA DE BASE DE DATOS

20 TERMINO SEMANA 1

21 TEMARIO-SEMANA SGBD-CONCEPTO Y FUNCIONES,INTERFAZ ENTRE USUARIO Y LA BD LENGUAJE DE LOS SGBD-ESTANDARIZACION DE LA ARQUITECTURA DE LOS SGBD SGBD-CONCEPTO DE INDEPENDENCIA FISICA/LOGICA ESTRUCTURA GENERAL DE UN SGBD EL DBA Ò ADMINISTRADOR DE BASE DE DATOS

22 SISTEMA DE GESTION DE BASE DE DATOS SGBD ES UN CONJUNTO DE PROGRAMAS PROCEDIMIENTOS Y LENGUAJES,ETC. QUE SUMINISTRA,TANTO A LOS USUARIOS NO INFORMATICOS COMO LOS ANALISTAS PROGRAMADORES O AL ADMINISTRADOR,LOS MEDIOS PARA DESCRIBIR,RECUPERAR Y MANIPULAR LOS DATOS ALMACENADOS EN LA BASE MANTENIENDO SU INTEGRIDAD CONFIDENCIALIDAD Y SEGURIDAD

23 OBJETIVOS GENERALES QUE PERSIGUEN TODO SISTEMA DE BD LOGRAR QUE EL DESARROLLO Y EL MANTENIMIENTO DE APLICACIONES DENTRO DE LA ORGANIZACIÓN SEA : o FACIL o FLEXIBLE o EFICIENTE o ORGANIZAR LOS DATOS DE TAL MANERA QUE SU EXPLOTACION SEA : o OPORTUNA o CONFIABLE o EFICIENTE o ESTRATEGICO

24 El SGBD COMO INTERFAZ BASE DE DATOS -Elaboración de Planes S -Objetivos Generales G TACTICO -Control de Gestión B - Objetivos Específicos OPERATIVO - Tareas Adm. D ESTRATEGICO

25 Independencia Física/Lógica en tres niveles NIVEL USUARIONIVEL EMPRESA NIVEL MAQUINA X1 X2 EE1 ECEI EEn Independencia físicaIndependencia lógica

26 ARQUITECTURA DE M.D.B. AP. 1 AP. 2 AP. 3 AP. 4 AP. 5 AP. 6 MODELO EXT. 1EXT. 2EXT. 3 (SUB-ESQUEMA) MODELO CONCEPTUAL (ESQUEMA) Modelo Interno

27

28 LA ADMINISTRACION DE DATOS Buscando aprovechar y explotar adecuadamente el uso sistema manejador de bases de datos, se define una función específica denominada, ADMINISTRACION DE DATOS (DBA)

29 OBJETO DE LA DBA MANEJAR LOS DATOS COMO UN RECURSO CORPORATIVO DE LA MISMA MANERA QUE LA EMPRESA MANEJA SUS DEMAS RECURSOS TALES COMO EL RECURSO FINANCIERO POR EJEMPLO

30 CRITERIOS ORGANIZACIONALES DEL DBA RESUELVA TODOS LOS REQUERIMIENTOS E INQUIETUDES DE LOS USUARIOS Y DE LA ADMINISTRACION SIRVA DE INTERFACE ENTRE LOS USUARIOS Y EL PERSONAL DE SISTEMAS EN LOS PROYECTOS QUE UTILICEN BASES DE DATOS ACTUE COMO MEDIADOR ENTRE LA ALTA DIRECCION, LOS USUARIOS Y EL DEPARTAMENTO DE SISTEMAS TRADUZCA LOS PLANES DE LA EMPRESA EN PLANES DE RECURSOS DE INFORMACION

31 DE LA B.D. INTERFACES DEL ADMINISTRADOR DIRECCION USUARIOS OPERADORES PROVEEDORES ANALISTAS Y PROGRAMADORES PERSONAL DE INFORMACION

32 BASES DE DATOS DBO TAREAS DE UN OPERADOR DE INSTALAR Y CREAR BASES DE DATOS CONTROL DE ACCESO IMPLEMENTAR ESTRUCTURAS (F y L) DE LAS APLICACIONES MANTENIMIENTO DE LA SEGURIDAD DE ACCESO DE LOS DATOS CARGADO DE DATOS EXTERNOS MANTENIMIENTO DE BACKUPS AFINAMIENTO BÁSICO

33 PROBLEMAS PRINCIPALES EN LA GESTIÓN DE PROYECTOS DE B.D Deficiente planeación Insuficiente Integración del usuario final Falta de definición de requerimientos Procedimientos anticuados del usuario Falta de disciplina para el desarrollo de sistemas La resistencia a compartir datos Falta de estándares en los datos

34 TERMINO SEMANA 2-3-4

35 TEMARIO SEMANA 5-6 INTRODUCCION-MODELOS DE DATOS MODELO RELACIONAL NORMALIZACION

36 Concepto de Modelo de Datos Conjunto de conceptos, reglas y convenciones bien definidos que nos permiten aplicar una serie de abstracciones a fin de describir y manipular los datos de un cierto mundo real que deseamos almacenar en la base de datos.

37 Diferencia entre Modelo y Esquema Modelo de Datos Mundo Real Esquema

38 Modelo de Datos EXTERNO * (Punto de vista de cada usuario en particular) GLOBAL * (Punto de vista del conjunto de usuarios -empresa-) INTERNO * (Punto de vista de la máquina) Lógicos Físicos MODELO DE DATOS

39 Clasificación de los MD Globales CONCEPTUALES -Enfocados a describir el mundo real con independencia de la máquina- MD GLOBALES CONVENCIONALES O LÓGICOS Jerárquico Codasyl Relacional Objeto Relacional - Implementados en SGBD-

40 BD Física MUNDO REAL Objetos y asociaciones con sus propiedades y reglas Valores MODELO CONCEPTUAL MODELO CONCEPTUAL Esquema conceptual Estruturapercibida (no formalizada) DISEÑO LÓGICO SGBD Esquema de base de datos MODELO DE BD DISEÑO FÍSICO MODELO INTERNO Esquema interno BASE DE DATOS FÍSICA Transformación del Mundo real a la

41 El Modelo Relacional R.E. Levein y M.E. Maronpor el año de Eddgar F. Codden Junio de 1970 publica el artículo A Relational Model of Data for Large Shared Data banks. Uno de los primeros prototipos fue el Peterlee Relational TestVehicle desarrollado por el centro Científico de Peterlee. El segundo prototipo se le llamó XRM ( Extended Relational Memory) y fue de IBM. En 1978 se desarrollo el Q.B.E., QueryBy Example. El prototipo base y más completo fue el famoso Sistema R, desarrollado por IBM (1980) y luego muchos más. Codd decidió establecer una referencia de 12 reglas para señalar cuando un SGBD cumple con el modelo relacional o no. |

42 Definición del Modelo relacional COLUMNAS codEstud nombre ciclo espec 100 Ana 3 Contabilidad TABLA FILAS 150 Alex 3 Sistemas estudiante ( relación) 250 Inés 1 Contabilidad 350 Max 2 Sistemas Ciclo = 1 al 10 ( DOMINIO ) Representa a la BD como una colección de relaciones, donde cada relación es una tabla.

43 Definición de relación Una relación r ( R ) es un conjunto de n-tuplas en un instante dado : Cada n-tupla( o fila ) t i es una lista de n valores v i : espec codEstud nombre ciclo 100 Ana 3 Contabilidad 150 Alex 3 Sistemas 250 Inés 1 Contabilidad 350 Max 2 Sistemas t 2 t 3 t 4 Una relación r del esquema de relación : R( A 1, A 2,..., A n ) es denotado por : r ( R ) ( filas ) r = { t 1, t 2,..., t n } t = { v 1, v 2,..., v n } relación t 1 Es una instancia de un esquema de relación

44 Comparación de Terminología RELACIÓN TABLA FICHERO REGISTRO CAMPO N DE CAMPOS N DE REGISTROS FILA COLUMNA N DE COLUMNAS N DE FILAS TUPLA ATRIBUTO GRADO CARDINALIDA D

45 Restricciones del Modelo Para normalización Son las que se pueden especificar en un esquema de base de datos relacional. Estas restricciones se enumeran a continuación : De Dominio De Clave De Integridad de entidades De Integridad Referencial De Dependencias de los datos ( funcionales Y multivaluadas)

46 Restricciones de Dominio Los valores que forman el dominio de los atributos deben ser atómicos. Las formas de especificar los dominios pueden ser, por rangos de valores, datos enumerados o por tipos de datos entre los que se incluyen enteros, reales, caracteres, cadenas de longitud fija y cadenas de longitud variable, además de otros tipos especiales como son fecha, dinero, etc

47 Restricciones de Clave SUPER CLAVE Las restricciones de clave exigen que todas las tuplas de una relación deben ser distintas. De un esquema de relación Es cualquier conjunto de atributos, para los cuales sea imposible que dos tuplasdiferentes, tengan los mismos valores ( propiedad de unicidad ). Sin embargo en una superclave pueden haber atributos redundantes. Por ejemplo, veamos el esquema de relación : ESTUDIANTE ( codigo, nombre, direc, sexo, fechNac )

48 Restricciones de Clave Analizando el esquema de relación : conjuntos de atributos ESTUDIANTE ( codigo, nombre, direc, sexo, fechNac) Son superclaves :{ codigo, nombre, sexo} { codigo, nombre } { nombre, fechNac, sexo} { nombre, fechNac } { codigo}, etc { nombre } { nombre, sexo } No son superclaves :

49 Restricciones de Clave De un esquema de relación CLAVE Es una superclave mínima, es decir una super clave a la cual no podemos quitarle atributos sin que deje de ser una superclave ( pérdida de unicidad ). Por ejemplo, en el esquema de relación anterior, ESTUDIANTE ( codigo, nombre, direc, sexo, fechNac) Analizemoslas siguientes superclaves : No es clave { codigo, nombre, sexo } { codigo, nombre }No es clave { nombre, fechNac, sexo }No es clave { nombre, fechNac}Es una clave { codigo } Es una clave

50 Restricciones de Clave CLAVE CANDIDATA Es toda clave que se puede encontrar en un esquema de relación. Por ejemplo, en el esquema de relación anterior, ESTUDIANTE ( codigo, nombre, direc, sexo, fechNac ) Son claves candidatas : { nombre, fechNac } { codigo}

51 Restricciones de Clave CLAVE PRIMARIA Es la clave candidata que se elige por que sus valores sirven para identificar inequívocamente a las tuplasde la relación. Por ejemplo, en el esquema de relación anterior, ESTUDIANTE ( codigo, nombre, direc, sexo, fechNac ) Especificando clave primaria

52 Restricción de Integridad de Entidad NOTA : las restricciones de clave y de integridad de entidades se especifican sobre relaciones individuales. Una clave primaria nunca puede tener el valor NULO. Esto se debe a que el valor de la clave primaria sirve para identificar las tuplas individuales en una relación

53 Valor Nulo Se aplica cuando el valor de algún atributo dentro de una tupla en particular sea desconocido o no corresponda. Por ejemplo cuando en una encuesta una persona no quiso decir su fecha de nacimiento o cuando no todas las personas tienen teléfono.

54 Referencial Clave FORANEAClave PRIMARIA Restricción de Integridad Se especifica entre dos relaciones y sirve para mantener la consistencia entre tuplasde las dos relaciones. Dicho de otro modo, establece que una tupla en una relación que haga referencia a una segunda relación, deberá referirse a una tupla existente en la segunda relación. Por ejemploanalizemoslos esquemas de relaciones empleado y departamento. EMPLEADO( codEm, nom, fechNac, direc, sexo, suel, codSuper, nDep ) DEPARTAMENTO( numDep, nombre, codJefe, fechIniJefe)

55 Referencial ForeignKey ( FK ) Clave FORANEA Restricción de Integridad Una clave foránea FK es un atributo de una relación R1 asociado a otra relación R2, donde aparece replicada como clave primaria de R2.

56 Referencial Ta bl a E m pl e a d o Co d -E m p N o m -E m p Co d -De p to. 3 columnas 5 filas 200 D u ra n d P o rtillo S e m e re n e 4 70 R o ja s R o d rig u e z 1 0 C o d-D e pto. N o m -D p to. 2 C onta bi lida d 10 R e cu r s o s 4 P r oduc c ión 6Ventas Ta bl a -D e pa r ta m e n to Restricción de Integridad PK 2 columnas 4 filas FK PK

57 Grafo Relacional Una forma sencilla de representar el esquema relacional es el denominado grafo relacional. Es un grafo compuesto de un conjunto de nodos multiparticionados, donde cada nodo representa un esquema de relacion, es decir, una tabla de la BD. Para cada esquema de relacion ha de aparecer, como minimo, su nombre y sus atributos, indicando su clave alternativas y las claves ajenas

58

59 Las doce reglas de Codd Regla de Información Toda la información se presenta mediante tablas y sólo mediante tablas Regla de acceso garantizado: Se accede sólo por nombre de columna y valor de llave candidata Manejo sistemático de valores nulos Se debe disponer de una representación de valores desconocidos y no aplicables diferente de los valores normales Catálogo activo en línea basado en el modelo relacional Debe estar a disposición de los usuarios con el mismo lenguaje de consulta que la base de datos. Sublenguaje de datos completo: Sintaxis lineal Utilización interactiva y mediante lenguajes de programación Definición de datos, manipulación completa de datos, Restricciones de seguridad, integridad y manejo de transacciones

60 Las doce reglas de Codd Actualización de vistas Se deben poder actualizar todas las vistas que en teoría se puedan actualizar Inserción, modificación y borrado de alto nivel: Se debe modificar, insertar y borrar todo un conjunto de tuplas a la vez Independencia física de los datos El acceso lógico a los datos debe mantenerse incluso cuando cambien los métodos de acceso o la forma de alamcenamiento. Independencia lógica de los datos Los programas de aplicación no deben verse afectados por cambios realizados en las tablas que estén permitidos. Independencia de integridad La integridad no forma parte de los programas de aplicación sino del esquema conceptual

61 Las doce reglas de Codd Independencia a ladistribución Debe existir un sublenguajede datos que pueda soportar bases de datos distribuidas sin alterar lso programas de aplicación cuando se distribuyan los datos por primera vez óse redistribuyan estos posteriormente. No subversión Si el sistema ofrece una interfaz de acceso a bajo nivel, dichoacceso no se podráusar para salvar restricciones de integridad o seguridad

62 Dinámica del Modelo Relacional Modelo relacional EstáticaDinámica El modelo relacional, como todo modelo de datos lleva asociado a su parte estática, una dinámica que permite la transformación entre estados de las bases de datos. Estructura Lenguajes de definición Lenguajes de manipulación Restricciones Inserción Borrado Modificación Consulta

63 Relacionales En toda consulta a una BDR genera como resultado una relación Lenguajes de Manipulación Existen dos mecanismos formales para especificar: Algebra relacional: El resultado es la aplicación sucesiva de operaciones a las relaciones de la base. Calculo relacional El resultado es el conjunto de constantes que hacen cierta una determinada formula de consulta. Historia: Se define el Algebra Relacional como lenguaje de consulta y diseño en 1970 (Codd) Se define una versión del Calculo Relacional en También se establece la equivalencia entre el Cálculo y el Algebra relacional

64 Algebra relacional Es un lenguaje de consultas procedimental(instrucciones para realizar secuencia de operaciones: que y como) Realiza operaciones de uno o dos relaciones de entrada que generan una nueva relación como resultado Operaciones fundamentales Unitarias Selección Proyección Renombre Binarias Producto cartesiano Unión Diferencia

65 Selección y Proyección Supongamos la tabla: Prestamo= (nombre_sucursal, monto, dirección) Selección: selecciona tuplas que satisfacen un predicado dado. Operador: Préstamos otorgados por la sucursal La Molina. Préstamos otorgados por la sucursal La Molina y con monto superior a $ Proyección: devuelve la relación argumento con columnas omitidas. Operador: Nombres de sucursal que figuran en Préstamo, cuyo monto sea superior a $

66 CRITERIOS SELECCION SELECCION1 :OPERADOR A (A1,A2), NIVEL DE CONSULTA. SELECCION2 :OPERADOR B, NIVEL DE CONSULTA. PROYECCION: TODOS LOS INVOLUCRADOS EN LA CONSULTA,CONSIDERANDO LOS OMITIDOS POR CONSULTA. NOMBRESUCURSALMONTODIRECCION CARLOSCHICLAYO$550BALTA GIANLIMA$7,500.00PLAZA SAN MARTIN-132 JOSESAN-ISIDRO$5,000.00BEGONIAS-168 PEDROCHICLAYO$4,500.00LEONARDO- ORTIZ OSCARMOLINA$1,780.00FONTANA-135 JUANMOLINA$3,500.00CASUARINAS- 890

67 NOMBRESUCURSALMONTODIRECCION OSCAR (A1)MOLINA$1,780.00FONTANA-135 JUAN (A1)MOLINA$3,500.00CASUARINA-890 JUAN (A2)MOLINA$3,500.00CASUARINA-890 CONSULTA DE SELECCION CRITERIO OPERADOR A (A1,A2)

68 NOMBRESUCURSALMONTODIRECCION GIANLIMA$7,500.00PLAZA SAN MARTIN-132 JOSESAN-ISIDRO$5,000.00BEGONIAS-168 PEDROCHICLAYO$4,500.00LEONARDO ORTIZ JUANMOLINA$3,500.00CASUARINAS- 890 CONSULTA DE SELECCION CRITERIO OPERADOR B

69 La proyección de una relación sobre un subconjunto de sus atributos es una relación definida sobre ellos, eliminando las tuplas duplicadas que hubieran podido resultar. Se denota mediante la letra. lista_de_atributos (nombre_de_relacion) Ejemplo: Para la tabla AUTOR, la proyección de nacionalidad e institución. Nacionalidad, Institucion (AUTOR) NacionalidadInstitucion EspañaO.N.U. EE.UU.O.M.S. EspañaI.N.I. EspañaI.N.E. FranciaN.A.S.A. PROYECCIONES

70 Producto Cartesiano Producto Cartesiano: (una relación se define como un subconjunto de un producto cartesiano de un conjunto de dominios) Conectados por entidades. de acuerdo a la definición matemática de la operación. x El Operador x Tabla Cliente = (nombre, nombre_cte, DNI, dirección, telefonos) Tabla Operario (banquero) = (nombre_operario,nombre_cte,nombre_sucursal,DNI, telefonos) Cada cliente con sus datos personales X, Los datos del cliente y del banquero Y. LA RELACION SE DA MEDIANTE EL OPERADOR (X,Y)

71 Para saber el número de elementos del producto cartesiano nos fijaremos en el diagrama de árbol

72 Algebra relacional x Producto x y a b c ax a y x b b c cy Operadores fundamentales del Selección Proyección - Diferencia - Unión

73 Calculo relacional Tipos de calculo relacional De Atributos De Dominios

74 Calculo relacional Cálculo Relacional de Tuplas: No procedural, describe información deseada sin dar un proceso específico para obtener esa información (que). Expresión de consultas { t / P(t) } Conjunto de tuplas tal que P(Predicado) es verdadero en t.

75 Calculo relacional de Tuplas Criterio para la Interpretación Las variables se asocian a tuplas Las constantes se asocian a valores de los dominios subyacentes a los ateibutos Los operadores son los permitidos de comparación, los lógicos NOT, And y OR, así como el existencial y el universal

76 Calculo relacional de Dominio Cálculo relacional de dominios Se utilizan variables de dominio que toman valores del dominio de un atributo (en lugar de tuplas completas)

77 Calculo relacional de Dominio Criterio para la Interpretación Las variables se asocian a dominios Las constantes se asocian a valores de los dominios subyacentes a los ateibutos Los operadores son los permitidos de comparación, los lógicos NOT, And y OR, así como el existencial y el universal

78 Normalización Fue Codd quien en 1972 propuso el proceso de normalización, asícualquier esquema de relación se puede someter a una serie de pruebas para certificar si pertenece o no a cierta forma normal, que originalmente fueron tres : primera, segunda y tercera formas normales. Posteriormente Boycey Codd replantearon la tercera forma normal que se conoce hoy como Boice -Codd NormForm( BCNF). La segunda y tercera formas se fundamentan en el concepto de dependencias funcionales. Después se formularon la cuarta y quinta forma normal, basados en dependencias multivaluadas y dependencias de reunión.

79 Concepto El termino normalización se refiere a la manera en que los atributos son agrupados en los esquemas de relaciones de una base de datos, a fin de evitar anomalías y problemas que pueden ocurrir con los datos.

80 Anomalía de Inserción Aquí vemos un mal diseño, donde como se nota hay datos de codEm nom fechNac direc suel nDep nomDep codJefe Cod_jefe 100 Soler Ana Flores Ingeniería Alva Juan Valles Ingeniería Jobe Alan Mar Ventas Vall Kate Jaén Ventas Com Ivan Grau Ingeniería Kori Rony Lomas Ventas Pita Inés Liz Gerencia 999 empleado y de departamento juntos. EMPLEADO Datos del empleado Datos del departamento

81 Que se busca en la normalización A BCD Que todo atributo (campo) dependa totalmente de la clave, y de ningún otro campo que no sea la clave Supuesto Basico: Buen conocimiento del negocio.

82 Reglas de uso de 1ra. FN A B C D E F C D C D C D A B E F C D en Conversión a la 1FN (Retirar grupos repetitivos ) Se descompone

83 Primera forma normal (1FN) Una relación está en primera forma normal si, y sólo si, todos los dominios de la misma contienen valores atómicos, es decir, no hay grupos repetitivos. Si se ve la relación gráficamente como una tabla, estará en 1FN si tiene un solo valor en la intersección de cada fila con cada columna. Si una relación no está en 1FN, hay que eliminar de ella los grupos repetitivos. Un grupo repetitivo será el atributo o grupo de atributos que tiene múltiples valores para cada tupla de la relación. Hay dos formas de eliminar los grupos repetitivos. En la primera, se repiten los atributos con un solo valor para cada valor del grupo repetitivo. De este modo, se introducen redundancias ya que se duplican valores, pero estas redundancias se eliminarán después mediante las restantes formas normales. La segunda forma de eliminar los grupos repetitivos consiste en poner cada uno de ellos en una relación aparte, heredando la clave primaria de la relación en la que se encontraban. Un conjunto de relaciones se encuentra en 1FN si ninguna de ellas tiene grupos repetitivos.

84 Reglas de uso de 1ra. FN NRO. EMPLEADO NOMBRE_EMPLEADO COD_TRABAJO NOM_TRABAJO NRO_PROYECTO1 TERMINO_PROYECTO_ 1 HORAS_TRAB_PROY_1 NRO_PROYECTO2 TERMINO_PROYECTO_ 2 HORAS_TRAB_PROY_2. NRO EMPLEADO NOMBRE_EMPLEAD O COD_TRABAJO NOM_TRABAJO 1FN NRO EMPLEADO NRO PROYECTO TERMINO_PROYECTO HORAS_TRAB_PROYECT O Retirar grupos repetitivos

85 Reglas de uso de 1ra. FN Gruporepetitivo OBRERO codObr nom fechNac direc jornal codJefe oficio añosExp OBRERO codObr nom fechNac direc jornal codJefe oficio añosExp 300 Huamaní Jorge Surco carpintero Huamaní Jorge Surco albañil Huamaní Jorge Surco pintor Sulca Américo Comas electrónico 5 añosExp codObroficio EJEMPLO : OBRERO codObr nom fechNac direc jornal codJefe HABILIDADES

86 TEMARIO SEMANA 7-8 DEPENDENCIA FUNCIONAL-SEGUNDA FORMA NORMAL DEPENDENCIA TRANSITIVA –TERCERA FORMA NORMAL

87 Dependencia Funcional determinante y x determinado Sea el esquema de relación R : () R ( A 1, A 2, A 3,... A k, A k+1,... A m, A m+1,... A t, A t+1,... A n-1, A n ) xy Y los subconjuntos depende funcionalmente Se dice que Y depende funcionalmente de X, ó que X determina Y ó que X implica Y Si y solo si, cada valor de X tiene asociado en todo momento un único un únicovalor de Y

88 Dependencia funcional Se puede decir que el código de un libro determina su título. LIBRO( cod_Lib, titulo, editorial ) titulo depende funcionalmente de codLib Aquíse dice que titulo depende funcionalmente de codLib Este concepto de dependencia funcional también nos dice que el titulo es una información acerca del libroo también que para algún código de libro existe un único título que le corresponde.

89 Dependencia funcional EMP_PROY codEmp numProy nomEmp nomProy lugarProy EMP_PROY( codEmp, numProy, nomEmp, nomProy, lugarProy) codEmp nomEmp numProy { nomProy, lugarProy} Se lee : El valor de código del empleado ( codEmp) determina de manera única el nombre de ese empleado ( nomEmp). Para un codEmpexiste un único nombre de empleado. El valor del número de proyecto ( numProy) determina de manera única el nombre del proyecto ( nomProy) y su lugar ( lugarProy).

90 En 2 FN dos tipos importantes de DF Dependencia funcional parcial PROGRAM codProgramador codModulo nomProgramador nomModulo horasTrab Dependencia funcional completa Dependencia funcional parcial

91 Regla de Uso de 2 FN ABCD ABD Se descompone en BC Conversión a la 2FN (Retirar dependencias funcionales parciales)

92 Regla de Uso de 2 FN NRO PROYECTO TERMINO_PROYECT O NRO EMPLEADO NRO PROYECTO TERMINO_PROYECTO HORAS_TRAB_PROYECT O 2FN NRO EMPLEADO NRO PROYECTO HORAS_TRAB_PROYECT O Retirar dependencias parciales

93 Regla de Uso de 2 FN EMP_PROY codEmp numProy horas nomEmp nomProy lugarProy solución codEmp nomEmp HORAS_TRAB PROYEC codEmp numProy horas numProy lugarProy Identificadas las dependencias, quedan definidas las nuevas relaciones EMPLE

94 Dependencia Funcional Transitiva Suponga que se tiene la siguiente relación R y sus atributos : Tenemos asíuna dependencia funcional transitiva ABC De donde se puede interpretar : C es funcionalmente dependiente de B y B es funcionalmente dependiente de A, entonces : C es funcionalmente dependiente de A

95 Segunda forma normal (2FN) Una relación está en segunda forma normal si, y sólo si, está en 1FN y, además, cada atributo que no está en la clave primaria es completamente dependiente de la clave primaria. La 2FN se aplica a las relaciones que tienen claves primarias compuestas por dos o más atributos. Si una relación está en 1FN y su clave primaria es simple (tiene un solo atributo), entonces también está en 2FN. Las relaciones que no están en 2FN pueden sufrir anomalías cuando se realizan actualizaciones. Para pasar una relación en 1FN a 2FN hay que eliminar las dependencias parciales de la clave primaria. Para ello, se eliminan los atributos que son funcionalmente dependientes y se ponen en una nueva relación con una copia de su determinante (los atributos de la clave primaria de los que dependen).

96 Reglas de Uso de 3 FN Conversión a la 2FN ABCD ABD Se descompone en BC (Retirar dependencias funcionales transitivas)

97 Reglas de Uso de 3 FN NRO EMPLEADO NOMBRE EMPLEADO COD_PUESTO NRO EMPLEADO NOMBRE_EMPLEADO COD_PUESTO NOM_PUESTO 3FN COD PUESTO NOM_PUESTO Retirar dependencias indirectas (transitivas )

98 Reglas de Uso de 3 FN Esta en 1FN por que no hay grupos repetitivos Esta en 2FN pues no existe clave compuesta Pero la dependencia transitiva viola la 3FN EJEMPLO : EMPLEPROY CodEmp nomEmp sueldo numProy fechaFin Normalizar el siguiente esquema de relación : dependencia funcional transitiva

99 Reglas de Uso de 3 FN Así, ya esta en 1FN por que no hay grupos repetitivos, en 2FN porque no existen dependencias parciales sobre claves compuestas, y en 3FN por que no existen transitividades. codEmp nomEmp sueldo nProynumProy fechaFin EMPLEADO PROYECTO

100 Tercera forma normal (3FN) Una relación está en tercera forma normal si, y sólo si, está en 2FN y, además, cada atributo que no está en la clave primaria no depende transitivamente de la clave primaria. La dependencia X Z es transitiva si existen las dependencias X Y: Y Z; siendo X:Y atributos y/o conjuntos de atributos de una misma relación. Aunque las relaciones en 2FN tienen menos redundancias que las relaciones en 1FN, todavía pueden sufrir anomalías frente a las actualizaciones. Para pasar una relación de 2FN a 3FN hay que eliminar las dependencias transitivas. Para ello, se eliminan los atributos que dependen transitivamente y se ponen en una nueva relación con una copia de su determinante (el atributo o atributos no clave de los que dependen).

101 TABLA SIN NORMALIZAR NOMBRE PRECIOFECHA-NUMEROTOTAL-DIRECCIÓ N NUMERO NOMBRE PRODUC. CANT. NUMERO ORDEN TOTAL ORDE NADO CLIENTE PRODUC. ORDEN CLIENTE PRODUC. ORDEN. EJEMPLO ORDEN VENTA

102 PRIMERA FORMA NORMAL: Eliminar los atributos no atómicos (campos repetitivos) ORDEN VENTA FECHA- ORDEN NUMERO- CLIENTE NOMBRE- CLIENTE DIRECCIÓN- CLIENTE TOTAL- ORDEN NUMERO- ORDEN NOMBRE- PRODUCTO PRECIO- PRODUCTO CANTIDAD- ORDENADA TOTAL- PRODUCTO NUMERO- ORDEN NUMERO- PRODUCTO ORDEN-PRODUCTO

103 Eliminar los atributos no dependientes de la llave primaria completa (dependencia funcional parcial). ORDEN VENTA FECHA- ORDEN NUMERO- CLIENTE NOMBRE- CLIENTE DIRECCIÓN- CLIENTE TOTAL- ORDEN NUMERO- ORDEN TOTAL- PRODUCT O CANTIDAD- ORDENADA NUMERO- ORDEN NUMERO- PRODUCTO PRECIO- PRODUCT O NOMBRE- PRODUCT O NUMERO- PRODUCTO SEGUNDA FORMA NORMAL: ORDEN-PRODUCTO PRODUCTO

104 Eliminar los atributos dependientes de atributos diferentes a la llave primera (dependencia funcional transitiva). TOTAL- PRODUCT O CANTIDAD- ORDENADA NUMERO- ORDEN NUMERO- PRODUCTO PRECIO- PRODUCTO NOMBRE- PRODUCT O NUMERO- PRODUCTO DIRECCIÓN- CLIENTE NOMBRE- CLIENTE NUMERO- CLIENTE TOTAL- ORDEN NUMERO- CLIENTE FECHA- ORDEN NUMERO- ORDEN TERCERA FORMA NORMAL: CLIENTEORDEN VENTA ORDEN- PRODUCTOPRODUCTO

105 TERMINO SEMANA

106 TEMARIO SEMANA UML- ENFOQUE CONCEPTO Y DEFINICIONES DISEÑO Y MODELAMIENTO MODELO CONCEPTUAL: entendimiento de negocios y requerimientos DISEÑO LOGICO: Proceso de transformación a tablas Relacional DISEÑO FISICO: Diagramas UML-Traducción del diseño lógico a la Representación Física MECANISMO DE SEGURIDAD –MONITOREO Y AFINAMIENTO

107 Diseño de BD Modelamiento de la BD Definir objetos de datos con sus atributos, relaciones y normalizado hasta la tercera forma normal. Analiza aspectos de implementación relacionados a optimización de consultas, desnormalización, comunicación con el aplicativo Se centra principalmente en construir modelos de cómo se verá la BD cuando la información sea capturada por los usuarios. Modelamiento de BD VS.

108 Diseño de BD Diseño de la BD Abarca el proceso completo desde la captura de los requerimientos, los procesos del negocio, el análisis,el diseño, y la implementación física de la base de datos, incluyendo su puesta en marcha. Modelamiento de BD VS.

109 Visión del Proceso Proceso de Transformació n ESQUEMADEDATOSESQUEMADEDATOS DISEÑO LÓGICO Definición de Requerimientos Tablas MUNDO REAL DISEÑO FÍSICO Reglas del negocio Archivos BASES DE DATOS

110 Modelamiento con UML Modelamiento Tradicional VS. El Modelamiento Tradicional de la BD promueve la siguiente teoría:La BD es la columna vertebral del sistema y todo gira alrededor de ésta El equipo de BD a menudo trabajaba a puertas cerradas basados en lo que conocían y no en el sistema completo que se requería.

111 Modelamiento con UML Modelamiento Tradicional VS. Aplicar UML como lenguaje común para todos los equipos envueltos destruye puertas, convirtiéndolos en un solo equipo de desarrollo. El UML permite modelar con un lenguaje simple: el negocio, la aplicación, la base de datos y la arquitectura del sistema.

112 Modelamiento con UML Modelamiento Tradicional VS. El uso del UML para capturar Los requerimientos del negocio beneficia al Equipo de BD ya que entenderán lo mismo que los demás miembros del proyecto. El Equipo necesita participar en el entendimiento de la problemática del negocio, la captura de requerimientos, el reconocimiento de las metas actuales y futuras de la organización, para asegurarse que puedan ser plasmados en la BD.

113 UML Lenguaje estándar que permite visualizar, especificar, construir y documentar las herramientas del sistema de software. Está demostrado que el trabajo con UML incrementa la productividad, reduce el ciclo de vida de construcción del software e incrementa la calidad del sistema.

114 UML para el diseño de la BD El UML ( Unified Modeling Language) se ha convertido rápidamente en el lenguaje estándar utilizado para modelar el negocio y las aplicaciones de software. Utilizar el UML para el diseño de la BD permite a los equipos del negocio y aplicaciones que están utilizando el UML para sus diseños, comunicarse con el equipo de la base de datos.

115 UML : Modelos y Diagramas Un modelo captura una vista de un sistema del mundo real. Es una abstracción de dicho sistema, considerando un cierto propósito. Así, el modelo describe completamente aquellos aspectos del sistema que son relevantes al propósito del modelo, y a un apropiado nivel de detalle. Diagrama: una representación gráfica de una colección de elementos de modelado, a menudo dibujada como un grafo con vértices conectados por arcos OMG UML 1.4 Specification

116 Diagrama de Casos de Uso Diagrama de Clases Diagrama de Objetos Diagramas de Comportamiento Diagrama de Estados Diagrama de Actividad Diagramas de Interacción Diagrama de Secuencia Diagrama de Colaboración Diagramas de implementación Diagrama de Componentes Diagrama de Despliegue Diagramas de UML

117 Diseño de BD Una metodología es un conjunto de modelos y herramientas que nos permiten pasar de una etapa a la siguientes en el proceso de diseño de la BD. La metodología propuesta considera el proceso de diseño como un conjunto de medios a aplicar en las distintas etapas del ciclo de vida de una BD. Metodología para el

118 Fases de la Metodología MODELO CONCEPTUAL DISEÑO LOGICO DISEÑO FISICO Se tiene 3 fases mencionadas que se estudiarán con mayor detenimiento en las siguientes sesiones:

119 Fases de la Metodología Modelo Conceptual: Cuyo objetivo es obtener una buena representación de los recursos de información de la empresa, con independencia de usuarios o aplicaciones en particular. Diseño Lógico: Cuyo objetivo es transformar el esquema conceptual obtenido, adaptándolo al modelo de datos en el que se apoya el SGBD que se va a utilizar. Diseño Físico: Cuyo objetivo es conseguir una instrumentación lo más eficiente posible del esquema lógico.

120

121 y tipos de modelos en los que se apoyan Etapas en el diseño de una base de datos MUNDO REAL Universidad Biblioteca, Departamento de formación de una empresa, hospital, Entidad bancaria, etc. UNIVERSO DEL DISCURSO Visión del mundo real bajo unos determinados objetivos. MODELADO CONCEPTUAL DE Modelos Conceptuales (Modelo E/R, etc.) Modelos convencionales o de base de datos (Modelo relacional, red jerárquico, etc.) Modelos internos (registros internos o almacenados, puntero, organizaciones secuenciales, indizadas, direccionadas, agrupamientos, etc.) LOS DATOS MODELADO LÓGICO (BASE DE DATOS) MODELADO INTERNO (ESTRUCTURAS DE DATOS) ALMACENAMIENTO FÍSICO Estructuras físicas (registros físicos, bytes, bits, etc.)

122 TEMARIO SEMANA SQL-INTRODUCCION-PARTES BASICAS COMBINACION TABLAS (WHERE,GROUP BY,HAVING) SENTENCIAS DE MANIPULACION: (INSERT-DELETE) MODIFICACION DE DATOS:(UPDATE) SENTENCIA DE DEFINICION: ESQUEMAS-DOMINIOS –TABLAS RESTRICCIONES Y REGLAS DE INTEGRIDAD SENTENCIAS DE CONTROL-CONFIDENCIALIDAD- DISPONIBILIDAD E INTEGRIDAD UNIDADES DE PROGRAMACION ALMACENADAS: FUNCTIONS,PROCEDURES,PACKAGES,TRIGGERS,INDEX,VIEWS

123 TEMARIO SEMANA EVOLUCION DE LA BD : CONCEPTOS –TERMINOLOGIA Y VENTAJAS (SQL3) PRINCIPALES CARACTERISTICAS DE LAS BDRO EXTENSIONES DE TIPO DE DATOS-OBJETOS COMPLEJOS- HERENCIA Y REGLAS DISEÑO LOGICO DE BDRO: Proceso de Transformación a tablas Relacional – Objeto DISEÑO FISICO DE BDRO IMPLEMENTACION DE UDT-UDF ORGANIZACION DE LA DATA FISICA


Descargar ppt "TEORIA Y DISEÑO DE BASE DE DATOS ING. GIAN PIERRE SOLORZANO REVILLA DBA."

Presentaciones similares


Anuncios Google