Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Tecnología de la información
Unidad: 4 El DBMS Profesor: Lic. Roberto García
2
Tecnología de la información
Unidad 4: DBMS Tópico 1 Funciones Tópico 2 Redundancia Tópico 3 Normalización Tópico 4 Vistas Tópico 5 SQL
3
Tecnología de la información
Unidad 4 El DBMS Funciones: Mantener estructuras de datos complejas. Proteger los programas frente a cambios en los archivos. Reconstrucción de archivos. Brindar seguridad a los datos. Controlar los accesos simultáneos. Se adaptan a los distintos SOs. Efectividad en la búsqueda de información.
4
Enfoque de las bases de datos para la administración de datos
Base de datos: Conjunto de datos organizados para servir eficientemente a muchas aplicaciones al centralizar los datos y controlar su redundancia Sistemas de administración de bases de datos: Interfaces entre los programas de aplicación y los archivos de datos físicos Separa las vistas lógica y física de los datos Resuelve los problemas del entorno de archivos tradicional Controla la redundancia Elimina la inconsistencia Elimina la dependencia entre los programas y los datos Permite la posibilidad de centralizar la administración de datos, su uso y seguridad
5
Organización de datos en un entorno tradicional de archivos
Conceptos de organización de archivos Un sistema de cómputo utiliza jerarquías Campo: agrupación de caracteres Registro: grupo de campos relacionados Archivo: grupo de registros del mismo tipo Base de datos: grupo de archivos relacionados Registro: Describe una entidad Entidad: persona, lugar, cosa o evento sobre el cual se almacena y conserva información Atributo: cada característica o cualidad que describe a una entidad en particular Por ej.: ID_Estudiante, curso , grado pertenecen a la entidad CURSO
6
Organización de datos en un entorno tradicional de archivos
Problemas con el entorno tradicional de archivos (archivos se mantienen de manera separada por departamentos diferentes) Redundancia e inconsistencia de datos Redundancia de datos: presencia de datos duplicados en múltiples archivos de datos Inconsistencia de datos: el mismo atributo podría tener valores diferentes Dependencia entre los programas y los datos: Cuando los cambios en los programas requieren cambios a los datos Carencia de flexibilidad Seguridad escasa Carencia de compartición y disponibilidad de los datos
7
Organización de datos en un entorno tradicional de archivos
8
Problemas del uso de Archivos
Vendedor Cliente Ventas Prg. Selección Archivo Auxiliar Prg. Ordenador Archivo Ordenado Prg. Impresión
9
Enfoque de las bases de datos para la administración de datos
Base de datos: Conjunto de datos organizados para servir eficientemente a muchas aplicaciones al centralizar los datos y controlar su redundancia Sistemas de administración de bases de datos: Interfaces entre los programas de aplicación y los archivos de datos físicos Separa las vistas lógica y física de los datos Resuelve los problemas del entorno de archivos tradicional Controla la redundancia Elimina la inconsistencia Elimina la dependencia entre los programas y los datos Permite la posibilidad de centralizar la administración de datos, su uso y seguridad
10
Enfoque de las bases de datos para la administración de datos
DBMS relacional Representan los datos como tablas bidimensionales llamadas relaciones Cada tabla contiene datos acerca de una entidad y sus atributos Tabla: Cuadrícula de columnas y filas Tuplas (filas) : registros para diferentes entidades Campos (columnas): representa un atributo para entidades Campo clave: campo utilizado para identificar únicamente cada registro Clave principal: campo en la tabla utilizado para los campos clave Clave externa: clave principal utilizada en una tabla segundaria para buscar campo para identificar los registros de su tabla original
11
Enfoque de las bases de datos para la administración de datos
Diseño de bases de datos Diseño conceptual (lógico): modelo abstracto de la base de datos desde una perspectiva de negocios Diseño físico: manera real en que la base de datos está organizada en dispositivos de almacenamiento de acceso directo El proceso de diseño identifica: Las relaciones entre los elementos de datos, los elementos de datos redundantes La manera más eficiente de agruparlos para que cumplan los requerimientos de información de la empresa, necesidades de programas de aplicación Normalización Simplificar las agrupaciones complejas de datos para minimizar elementos de datos redundantes y complicadas relaciones muchos a muchos SABD Lenguaje de Definición de Datos Manejo de Diccionario de Base Física Prg 1 Prg 2 Prg 3
12
Enfoque de las bases de datos para la administración de datos
13
Enfoque de las bases de datos para la administración de datos
14
Enfoque de las bases de datos para la administración de datos
Operaciones de un DBMS relacional: tres operaciones básicas para generar conjuntos de datos útiles SELECCIONAR: crea un subconjunto que consta de todos los registros de la tabal que cumplen los criterios establecidos UNIR: combina tablas relacionales para dar al usuario más información de la que está disponible en las tablas individuales PROYECTAR: crea un subconjunto que consiste en las columnas de una tabla, creando nuevas tablas que contengan solamente la información que se requiere
15
Enfoque de las bases de datos para la administración de datos
Operaciones Básicas Seleccionar Unir Proyectar
16
Enfoque de las bases de datos para la administración de datos
DBMS orientado a objetos (OODBMS) Almacena los datos y los procedimientos como objetos Capaces de manejar gráficos, multimedia y subprogramas de Java Relativamente lento comparado con los DBMS relacionales para procesar grandes cantidades de transacciones DBMS relacional-orientado a objetos: proporciona capacidades de DBMS orientado a objetos y relacional
17
Enfoque de las bases de datos para la administración de datos
Componentes de los sistemas de administración de bases de datos Definición de datos: especifica la estructura del contenido de la base de datos, utilizada para crear tablas de bases de datos y para definir las características de los campos Diccionario de datos: archivo automatizado o manual que almacena definiciones de elementos de datos y sus características Lenguaje de manipulación de datos: se utiliza para agregar, cambiar, eliminar y recuperar la información de la base de datos Lenguaje de Consultas Estructurado o SQL Las herramientas para el usuario de Microsoft Access para la generación SQL También: Muchos DBMS son populares generadores de informes (Crystal Reports)
18
Elementos del modelo Entidad - Relación
Bases de Datos Elementos del modelo Entidad - Relación Elementos Rectángulo Representa entidades básicas Doble Rectángulo Representa entidades débiles; su clave está compuesta por atributos propios y atributos de otras entidades fuertes. Diamante identificador de relaciones Elipse Atributos de la entidad, si esta subrayado es llave primaria Línea Conexión entre la entidades y sus relaciones Alumno Efectúa Examen Asignaturas Pertenece
19
Proceso de Normalización
Bases de Datos Proceso de Normalización La normalización es el proceso de organizar los datos de una base de datos. Incluye la creación de tablas y las relaciones entre ellas según reglas diseñadas para proteger los datos como para eliminar la redundancia. Los datos redundantes desperdician el espacio de disco y crean problemas de mantenimiento. Hay algunas reglas en la normalización de una base de datos. Cada regla se denomina una "forma normal“.
20
Primera Forma Normal Una tabla se dice que esta en 1FN si y sólo si:
Bases de Datos Primera Forma Normal Una tabla se dice que esta en 1FN si y sólo si: los valores que componen el atributo de una tupla son atómicos. La tabla contiene una clave primaria única. La clave primaria no contiene atributos nulos. Un atributo solo debe mantener valores elementales o únicos. Debe Existir una independencia del orden tanto de las filas como de las columnas. Pasos a seguir para Normalizar en Primera Forma Normal: Elimine los grupos repetidos de las tablas individuales. Cree una tabla independiente para cada conjunto de datos relacionados. Identifique cada conjunto de datos relacionados con una clave principal
21
Primera Forma Normal (1FN)
Bases de Datos Primera Forma Normal (1FN) No esta normalizada ya que no existen relaciones atómicas entre los dominios. Anomalía ¿De qué tamaño es un registro? Entidad en 1FN En el producto cartesiano todos los dominios tienen valores atómicos
22
Dependencias Funcionales
Bases de Datos Dependencias Funcionales Es una conexión entre uno o más atributos. Las dependencias funcionales del sistema se escriben utilizando una flecha, de la siguiente manera: Clave DF Atributos secundarios
23
Bases de Datos Segunda Forma Normal La Segunda Forma Normal está basada en el concepto de dependencia completamente funcional. Una tabla se dice que esta en 2FN si y solo si cumple dos condiciones: Se encuentra en 1FN. Todo atributo secundario ( aquéllos que no pertenecen a la clave principal) depende totalmente de la clave completa (DFT).
24
(Dependencia Funcional Total)
Segunda Forma Normal (Dependencia Funcional Total) E S E S F T F T G A A G H H I I J J K K L B M L N B M C O N D P C O Q R D P A Q B C R D
25
Bases de Datos Tercera Forma Normal Se dice que esta en 3FN si y solo si se cumplen dos condiciones: Se encuentra en 2FN. Cada atributo secundario solo se debe conocer a través de la clave principal o claves secundarias de la tabla y no por medio de otro atributo primario.
26
Dependencias Funcionales
Bases de Datos Dependencias Funcionales Dependencia Funcional Transitiva: DF Transitiva Se aplica para analizar las tablas en tercera forma normal (3FN). Consiste en considerar que “un atributo no primario solo debe conocerse a través de la clave principal o claves secundarias. DF Clave Atributos con DFT Atributos con DF Transitiva
27
(Dependencia Funcional Transitiva)
Tercera Forma Normal (Dependencia Funcional Transitiva) E S E F T F G G A A H H I I J J K K E S F T
28
Forma Normal de Boyce-Codd
Bases de Datos Forma Normal de Boyce-Codd Una tabla esta en FNBC si y solo si las únicas dependencias funcionales elementales son aquellas en las que la clave principal y claves secundarias determinan un “atributo”.
29
Dependencia Multivaluada (DMV)
Bases de Datos Dependencia Multivaluada (DMV) La dependencia multivaluada es un concepto que se introduce para tratar la 4FN. Es necesario que entre dos atributos el resto de los campos sean independientes. Deben existir al menos 3 atributos para que haya dependencia multivaluada. la definición dice: “sean A, B y C tres subconjuntos distintos de atributos de una tabla T se dice que A tiene una dependencia multivaluada con B, que A multidetermina B, o que B depende multivaluadamente de A y se escribe: A B Si para cada valor de A existen un conjunto de valores B asociados y esta es independiente del resto de atributos C”. Dependencia Join: Es una dependencia entre tablas
30
Bases de Datos Cuarta Forma Normal Se aplica para eliminar las DMV de las tablas (por redundancia de datos). Se dice que esta en 4FN si esta en FNBC Las únicas DMV existentes son las DF de la clave con los atributos secundarios. Es como FNBC, pero con dependencias multivaluadas.
31
Bases de Datos Quinta Forma Normal Es un nivel de normalización de bases de datos diseñado para reducir redundancia en las bases de datos relacionales que guardan hechos multivalores aislando semánticamente relaciones múltiples relacionadas. Debe cumplir dos condiciones: encontrarse en 4FN. Toda Dependencia Join viene implicada por las claves de la tabla.
32
Normalización: Redundancia controlada
Bases de Datos Normalización: Redundancia controlada La normalización genera más entidades, sin embargo esta redundancia aparente esta controlada por el manejador de BD, siendo ajena para el usuario. Por otro lado el tamaño de los archivos tiende a reducirse. Entidades normalizadas Entidad sin normalizar
33
Normalización Ulterior
Bases de Datos Normalización Ulterior La normalización puede ser continuada mas allá de la 3FN, existen argumentos académicos interesantes para la existencia de BCFN Forma Normal de Boyce y Codd Las entidades están en 3FN y además todo dominio independiente es una llave candidato: Ent={A,B,C,D} y las depencias son A==> BCD y D==>A aqui A y D son llaves 4FN Cuarta Forma Normal Las entidades están en BCFN y además no se tienen dependencias multievaluadas 5FN Quinta Forma Normal D/KFN Forma Normal de Dominio y Llave Para los propósitos de una operación administrativa la 3FN es suficientemente poderosa. :
34
Bases de Datos Guía de Normalización 1. Defina los Dominios ( Atomice lo mínimo necesario ) 2. Defina los Formatos ( Defina formatos comunes ) 3. Escriba todas las suposiciones semánticas iniciales 4. Obtenga la Tabla de Dependencias (conectando todos los dominios) 5.Determine las dependencias funcionales ( sentido de la fecha, dominios independientes conjuntos ) 6. Elimine las dependencias transitivas 7. Partiendo de la Tabla de Dependencias obtenga: las entidades mínimas necesarias, tomando cada dominio(s) independiente para entablar a la entidad. 8. Complete la lista de suposiciones semánticas 9. Presente los resultados: Dominios, Entidades, Suposiciones 10. Obtenga aprobación firmada de la definición ó en caso necesario efectúe las modificaciones requeridas (un buen diseño debe no contener más de 100 dominios y 40 entidades por sistema )
35
Enfoque de las bases de datos para la administración de datos
36
Enfoque de las bases de datos para la administración de datos
37
Enfoque de las bases de datos para la administración de datos
Diagrama entidad-relación Utilizad por los diseñadores de bases de datos para documentar sus modelos de datos Ilustra las relaciones entre entidades Distribución de bases de datos: almacena en más de un lugar físico Reduce la vulnerabilidad, incrementa los resultados Puede partir de definiciones estándar, plantea problemas de seguridad Particionada: unas partes de datos se almacenan y mantienen físicamente en un lugar y otras partes se almacenan y mantienen en otros lugares Replicada: la base de datos central duplicada por completo en ubicaciones diferentes
38
Enfoque de las bases de datos para la administración de datos
1 M 1 M M 1 Cardinalidad: Forma en que los elementos de un objeto se relacionan con Los elementos de otro objeto (Teoría de conjuntos)
39
(Para la construcción de sistemas DSS y ESS)
Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones (Para la construcción de sistemas DSS y ESS) Para bases de datos y sistemas muy grandes, se requieren capacidades y herramientas especiales para analizar grandes cantidades de datos y para acceder datos de sistemas múltiples Almacenes de datos (Data Warehouse) Minería de datos (Data Mining) Herramientas para acceder la base de datos interna a través de la Web
40
Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones
Almacenes de datos (Data werehose) Almacén de datos: Almacena datos actuales e históricos que se originan en muchos sistemas de transacciones operativas esenciales Consolida y estandariza información para que se pueda utilizar a través de la empresa, pero los datos no se pueden modificar El sistema del almacén de datos aportará informes, análisis y herramientas de informes Mercados de datos: Subconjunto de un almacén de datos en el que una parte resumida o altamente enfocada de los datos de la organización se coloca en una base de datos separada por una población específica de usuarios Por lo general se enfoca en una sola área objetivo o línea de negocios
41
Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones
(Data werehose)
42
Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones
Inteligencia de negocios: Herramientas para consolidar, analizar y dar acceso a extensas cantidades de datos para ayudar a los usuarios a tomar mejores decisiones de negocios Por ej.: Una empresa analiza los datos sobre sus clientes para construir un perfil de consumidor detallado e identificar a los clientes más rentables Las principales herramientas incluyen: Software para consultas e informes de base de datos Procesamiento analítico en línea (OLAP) Minería de datos
43
Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones
44
Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones
Procesamiento analítico en línea (OLAP) Soporta el análisis de datos multidimensionales Permite ver los mismos datos utilizando múltiples dimensiones Cada aspecto de la información (producto, precio, costo, región o periodo) representa una dimensión diferente Por ej.: ¿cuántos lavarropas vendió Garbarino en Junio / Agosto en las sucursales del noroeste del país? OLAP permite obtener respuestas en línea en un lapso de tiempo sumamente rápido a preguntas específicas
45
Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones
Minería de datos: (Datamining) Más orientada al descubrimiento de información que la OLAP Encuentra patrones y relaciones ocultas en robustas bases de datos Infiere reglas para predecir el comportamiento futuro Los patrones y reglas se utilizan para orientar la toma de decisiones y predecir el efecto de tales decisiones Uno de los usos populares de la minería de datos es ofrecer análisis detallados de patrones existentes en los datos de clientes para realizar campañas de marketing o para identificar clientes rentables.
46
Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones
Tipos de información que se pueden obtener de la minería de datos Asociaciones: ocurrencias enlazadas a un solo evento Secuencias: eventos enlazados con el paso del tiempo Clasificación: reconoce patrones que describen el grupo al cual pertenece un elemento Agrupamiento: funciona de una manera semejante a la clasificación cuando aún no se han definido grupos; encuentra agrupamientos dentro de los datos Pronósticos: emplea una serie de valores existentes para pronosticar qué otros valores habrá
47
Uso de bases de datos para mejorar el desempeño empresarial y la toma de decisiones
Análisis predictivo Utiliza técnicas de minería de datos, datos históricos y suposiciones sobre condiciones futuras para predecir resultados de eventos Por ej.: la probabilidad de que un cliente responderá a una oferta o comprará un producto específico. La minería de datos vista como un reto para la protección de la privacidad individual Se usa para combinar información de muchas fuentes diversas para crear una “imagen de datos” detallada sobre cada uno de nosotros –nuestros ingresos, nuestros hábitos de conducir, nuestras aficiones, nuestras familias y nuestros intereses políticos
48
Administración de los recursos de datos
Establecimiento de una política de información Política de información: especifica las reglas de la organización para compartir, estandarizar la información Administración de datos: es responsable de las políticas y procedimientos específicos; gobierno de la información Administración de la base de datos: diseño y administración de bases de datos responsable de definir, organizar, implementar y mantener la base de datos Aseguramiento de la calidad de datos
49
SQL
50
Esquema de Base de Datos
Cursa 1 M 1 M M Alumnos Examenes 1 Efectua Pertenece Materias M Pertenece 1 Departamentos
51
Definición de Tablas Claves Primarias
52
Definición de Tablas Claves Secundarias
53
Sintaxis SQL Sintaxis Consulta en una sola tabla
SELECT columna1, columna2, ... FROM tabla WHERE {condiciones1} and/or condiciones2} ORDER BY {columnas} ASC/DEC Sintaxis Consulta en múltiples tablas SELECT tabla.columna, tabla.columna, ... FROM tabla1, tabla2 WHERE {tabla1.columna = tabla2.columna} AND {condiciones1} and/or condiciones2} ORDER BY {columnas} ASC/DEC
54
Ejemplo consulta en SQL
Tabla ALUMNOS NLEGAJO APELLIDO PROMEDIO 1 Velasquez 2 Perez 3 Dominguez 4 Gonzalez ... Tabla MATERIAS NLEGAJO NOMBREMATER CODDEPTO Sistemas I Contabilidad II ... Matematicas Psicología Tabla DEPARTAMENTOS CODDEPTO NOMBREDEPTO Informatica Contable Exactas Sociales Ciencias Empresarias Ciencias Industriales ...... Ejemplo Mostrar el Legajo, Apellido del Alumno, Nombre de la materia que cursa y Nombre del departamento que pertenece la materia de los alumnos cuyo promedio es superior a 7 puntos. SELECT ALUMNOS.apellido, MATERIAS.nombremater,DEPATAMENTOS.nombredepto FROM ALUMNOS,DEPARTAMENTOS, MATERIAS WHERE ALUMNOS.nlegajo = MATERIAS.nlegajo AND MATERIAS.coddepto = DEPARTAMENTOS.coddepto AND ALUMNOS.promedio > 7;
55
SELECT Apellido, Domic, CodCarrera FROM Alumnos, Materias
Indique si la siguiente consulta está correcta de acuerdo a la siguiente consigna (Justifique la respuesta). Mostrar el apellido, domicilio y código de carrera para aquellos alumnos de la carrera 01 y 02 que aprobaron al menos 10 materias. Correcta ( ) Incorrecta ( ) SELECT Apellido, Domic, CodCarrera FROM Alumnos, Materias WHERE MaterAprob >= 10 AND CodCarrera = 01 OR CodCarrera = 02;
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.