IBD Clase 16.

Slides:



Advertisements
Presentaciones similares
IBD Clase 8.
Advertisements

IBD Curso 2007 Clase 2.
Almacenamiento del sistema de archivos La gestión de archivos es uno de los componentes mas visibles de un sistema operativo. Las computadores pueden almacenar.
IBD Plan 90 y 2003 Clase 10.
IBD Clase 13.
IBD Clase 14.
MODELO DE REGRESIÓN LINEAL SIMPLE
CARACTERISTICAS, CLASES, EJEMPLOS
IBD Clase 7.
IBD Plan 90 y 2003 Clase 12. UNLP - Facultad de InformáticaIBD - CLASE 12 2 Modelado de datos Como mejorar la calidad del Esquema Conceptual ? Validación:
Base de Datos Unidad I Introducción.
Base de Datos Distribuidas PROCESAMIENTO DE CONSULTAS DISTRIBUIDAS
GESTION DE DISPOSITIVOS
Optimización del rendimiento de las consultas
Noveno Semestre UNIDEC
Base de Datos Distribuidas FUNDAMENTOS DE BASES DE DATOS DISTRIBUIDAS
PROGRAMACIÓN PARALELA Tema 5: Análisis de algoritmos paralelos
Optimización de Consultas Distribuidas
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
“Tuning” Universidad Nacional Autónoma de México Bases de datos I
Computación PROGRAMACIÓN.
Paricial IV Ing. Esmeralda Elizabeth Rodríguez Rodríguez
ALGEBRA RELACIONAL Y CALCULO RELACIONAL CON REFERENCIA A BASE DE DATOS
Introducción al software
IBD Plan 2003 Clase 4. UNLP - Facultad de InformáticaIBD - CLASE 4 2 Archivos - Búsqueda Búsqueda de información (costo) # de comparaciones (operaciones.
Unidad 3 Tema “Transformacion Equivalentes”
Planificación de la Información.
Metodología para la Construcción de Programas
MOTORES DE BASE DE DATOS
Tema 8 : Sistemas relacionales Resumen Sobre el modelo relacional
Evaluación y Optimización de Consultas Láminas seleccionadas de las láminas de la Prof. María Esther Vidal.
8. Procesamiento y optimización de consultas
Diseño de Bases de Datos Distribuidas (1era Parte)
HILOS Y COMUNICACIÓN ENTRE PROCESOS
Procesamiento de Consultas Distribuidas (1era Parte)
CARACTERÍSTICAS DE LOS PROGRAMAS
1 John Freddy Duitama U.de.A. Facultad de Ingeniería Optimización Algebraica. Profesor: John Freddy Duitama Muñoz. Facultad de Ingeniería. U.de.A. Profesor:
Ing. Fabián Ruano.  Definición  Diferencias con BD Centralizadas.
Algebra Relacional.
Optimización de Preguntas. Optimización de preguntas zOptimización: pregunta  plan costo ópt. costo = CPU + I/O + COMUNICACIONES zNecesario para responder.
Estructura de Datos II Equipo 4 Equipo 7 Acosta Montiel Miguel A.
Administración de Bases de Datos
BASE DE DATOS BY: Julián Villar Vázquez.
(Organización y Manejo de Archivos)
Introducción Informática Aplicada.
Introducción a los Sistemas Operativos
Bases de datos relacionales
Bases de Datos Distribuidas M. en C. Anastacio Antolino Hernández PROBLEMA DE LOS SISTEMAS DISTRIBUIDOS SISTEMAS MANEJADORES DE BASES DE DATOS DISTRIBUIDAS.
Parte II. Algorítmica. 4. Programación dinámica.
Introducción a los SOs.
Teoría de Sistemas Operativos Administración de Archivos.
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
Estructura de los Sistemas Operativos
SISTEMAS OPERATIVOS Por Martín Arosemena.
Sistemas de Archivos Sistemas Operativos.  Se debe proporcionar un almacenamiento secundario que respalda a la memoria principal  El Sistema de archivos.
FUNCIONAMIENTO INTERNO DEL ORDENADOR
Universidad del Valle de Tlaxcala Maestría en Educación TIC’s aplicadas Alumnas: Sánchez peregrina Maricarmen.
Tipos de Datos.
Introducción a la Base de Datos Profesora: Nelwi Báez.
LA COMPLEJIDAD DE LAS OPERACIONES DEL ÁLGEBRA RELACIONAL
Administración de Base de Datos Procesamiento y Optimización de Consultas Prof Mercy Ospina Torres Prof Renny A. Hernandez
Diccionario/Directorio de Datos
Sistema de Gestión de Archivos FUNDAMENTOS TEORICOS Ing. Jorge Gutiérrez D Universidad Nacional de Colombia Catedrático - I Sem 2009
BASES DE DATOS DISTRIBUIDAS M.C.C. María Guadalupe Villanueva Carrasco INGENIERIA EN SISTEMAS COMPUTACIONALES.
Administración de Base de Datos Procesamiento y Optimización de Consultas Prof Mercy Ospina Torres Prof Renny A. Hernandez
Bases de datos II Universidad del Cauca Ing. Wilson Ortega.
ARCHIVO Es una colección de información o bien es una secuencia de bits, bytes, líneas o registros definida por su creador.
Arquitectura de Computadoras (Taller) Semestre II de 2008.
Optimización de Consultas Distribuidas. ÍNDICE Definiciones básicas Modelo de costo Estadísticas de la base de datos Optimización centralizada de consultas.
ALGORITMOS Asignatura: Informática. Algoritmos Conjunto de instrucciones ordenadas de forma lógica y precisa, con un inicio y fin que permite resolver.
Transcripción de la presentación:

IBD Clase 16

Optimización de consultas Componentes del “costo” de ejecución de una consulta: Costo de acceso a almacenamiento secundario  buscar, leer y escribir bloques de datos que residen en disco. Costo de almacenamiento  costo de almacenar archivos intermedio que genera una estrategia de ejecución Costo de cómputo  Costo de realizar operaciones Costo de comunicación  Costo de enviar la consulta y los resultados (si es un Sistema Distribuido) IBD - CLASE 16 UNLP - Facultad de Informática

Optimización de consultas Interpretación de consultas Dada una consulta hay varios métodos para llegar a la respuesta. Fórmula de cálculo  sistema Usuario  Consulta  consulta depurada Más eficiente IBD - CLASE 16 UNLP - Facultad de Informática

Optimización de consultas Consulta  forma interna  proceso de optimización parser  más eficiente elección de índices  # de acceso a disco  orden en el uso de tuplas Parser equivale a un compilador IBD - CLASE 16 UNLP - Facultad de Informática

Optimización de consultas Optimización Lógica Expresiones equivalentes: Algebra relacional: procedural, existe una secuencia de resolución  se puede encontrar una expresión más eficiente que otra. IBD - CLASE 16 UNLP - Facultad de Informática

Optimización de consultas Operaciones Selección: hacerlas lo antes posible Cambiar  p1^p2(e)  p1(p2(e)) (descomponer la condición) Ejemplo Proyección Resolver la proyección lo antes posible Producto natural (r1 |x| r2 |x| r3) = r1 |x| (r2 |x| r3)  sexo=‘M’ and edad>=18( PERSONA )  sexo=‘M’ (edad>=18 (PERSONA)) PERSONAS=(DNI,nombre, dir) SALARIOS=(DNI,monto) nombre,monto (PERSONAS |x| SALARIOS) -> nombre,monto ((nombre,DNI (PERSONAS)) |x| SALARIOS) Selección Proyección (selección (r1|x|r2|x|r3) Proyección (selección(r1) |x| selección (r2) |x| r3) Proyección  suc, activo(  suc (  localidad (cliente) |x| deposito ) |x| sucursal ) IBD - CLASE 16 UNLP - Facultad de Informática

Optimización de consultas Otras operaciones (equivalencias) p(r1  r2) = p(r1)  p(r2) p(r1 - r2) = p(r1) - p(r2) (r1  r2)  r3 = r1  (r2  r3) r1 |x| r2 = r2 |x| r1 IBD - CLASE 16 UNLP - Facultad de Informática

Optimización de consultas Estimación del costo de las consultas Elección de estrategia  estadísticas # tuplas en la relación (nr) Tamaño en bytes de la tupla (sr) # valores distintos en la relacion r para un atributo V(a,r) Costos de las consultas Producto cartesiano: r x t # tuplas nr * nt # bytes en cada tupla sr + st IBD - CLASE 16 UNLP - Facultad de Informática

Optimización de consultas Selección: p (r) # tuplas nr se supone distribución uniforme V(A,r) # bytes de la tupla sr IBD - CLASE 16 UNLP - Facultad de Informática

Optimización de consultas Optimización Física -> depende del DBMS Generar “buenos” índices Costo de acceso por índices Índice  más rápido, existe ordenamiento Costo adicional  acceso al índice Cálculo de tiempo Depende del la organización y características del índice. IBD - CLASE 16 UNLP - Facultad de Informática

Optimización de consultas Generar “buenos” clusters (criterios para agrupar información, para acceder menos al disco) de información -> se puede “clusterizar” por tablas, atributos o tuplas relacionadas Procesadores paralelos Redes: separar el trabajo entre distintas computadoras IBD - CLASE 16 UNLP - Facultad de Informática