RENDIMIENTO Y ORGANIZACIÓN DE ARCHIVOS. En este documento se compara el coste de algunas operaciones simples en varias organizaciones de archivo básicas.

Slides:



Advertisements
Presentaciones similares
ÍNDICES.
Advertisements

ESTRUCTURA DE DATOS Unidad 05 ALGORITMOS DE BUSQUEDA.
CONSULTAS SOBRE UNA TABLA
Herramientas informáticas
Organización Secuencial
IBD Clase 7.
LICENCIATURA EN SISTEMAS COMPUTACIONALES EN ADMINISTRACION
ESTRUCTURA DE DATOS Unidad 04 Árboles BINARIOS DE BUSQUEDA.
Unidad 8 Métodos de Búsqueda
Organización Secuencial
Sistemas Gestores de Ficheros
ACTUALIZACIÓN DE INFORMACIÓN DE PROCESOS
Instructivo para la carga de la planilla de acceso al incentivo Año 2012 TODA LA INFORMACIÓN A CARGAR EN LA PLANILLA DEBE CORRESPONDER A SU ACTIVIDAD DURANTE.
Ordenamiento Interno y Búsqueda Binaria
Curso Administrativo OTEC/Empresa Unidad III: Revisión del Libro de Clases (Actualizado el ) Curso creado por : Libro de Clases Electrónico (LCE)
Especialista en Business Intelligence Integration Services SSIS (Sesión 5) Microsoft SQL Server 2008 R2 (Nov.2013) Suscribase a o.
SQL Server Integration Services SSIS
DISEÑO Y GESTIÓN DE BASES DE DATOS Luciano H. Tamargo Depto. de Ciencias e Ingeniería de la Computación Universidad Nacional del Sur, Bahía Blanca INTRODUCCIÓN.
MODIFICACIÓN DE INFORMACIÓN Y/O DOCUMENTOS DE PROCESOS POR ESTADO
PROGRAMACION DE ESTRUCTURAS DE DATOS
Algoritmos Aleatorizados
Tema: Las Consultas (y II) Tipos de uniones
Tema II Unidad de memoria. 2 Unidad de memoria 2.1 Definiciones y conceptos básicos Localización Capacidad Unidad de transferencia
Planificación de la Información.
Johanna Lizeth Rodríguez Lorena Fda. Chávarro Ramos
Integrantes: Esteban Jiménez Guesseppe Lozada Mario Rodriguez Gustavo Tenorio Fabio.
Como usar el Catálogo Bello Guía práctica Acceso al catálogo  Se puede acceder al catálogo desde cualquier parte del mundo por Internet.  Es posible.
COLAS, IMPLEMENTACIÓN A PARTIR DE LISTAS Y PARA PILAS
Material de apoyo Unidad 8 Estructura de datos
Acceso del usuario a la aplicación.
ROMERO G ARCIA FANY KARINA Y BARRIOS CRUZ REBECCA SARAHI GRUPO:303 EQUIPO:5.
Mantenimiento lógico del pc
OpenOffice Calc CURSO OpenOffice Calc.
La organización indexada está formada por registros que se encuentran en conjunto de datos que se graban en un disco secuencialmente, llamado área primaria.
Subconsultas Avanzadas
Estructuras de Datos Arreglos.
Clase 10: Estructuras de datos y arreglos.
Elaborado por: Guillermo Baquerizo I Término
Tablas de Hash.
Programación IMC José Andrés Vázquez Flores. Definición Un arreglo es un conjunto finito e indexado de elementos homogéneos, que se referencian por un.
HERRAMIENTAS DE EXCEL ORDENAR Y FILTAR.
(Organización y Manejo de Archivos)
Administración de Memoria
Almacenamiento y Recuperacion de Información- Arbol AVL
Capítulo 7 Gestión de memoria.
Análisis y Diseño de Algoritmos
Estructura de Datos M.C. José Andrés Vázquez Flores FCC/BUAP
Los catálogos.
Bases de Datos Sql.
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 3) Microsoft SQL Server 2008 R2 Suscribase a
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:21 PRESENTACION: BASE DE DATOS ALUMNAS: Adán Millán Sánchez.
EQUIPO:#3 GRUPO:304 NOMBRES: Lizbeth Nava Barón y Erick Ali Mejía.
Sistemas de Archivos Sistemas Operativos.  Se debe proporcionar un almacenamiento secundario que respalda a la memoria principal  El Sistema de archivos.
ESTRATEGIA DE BUSQUEDA. La estrategia de búsqueda se concibe como una necesidad: concepto que depende de los valores de la sociedad y de la profesión,
Almacenamiento de la información IES Virgen del Espino.
¿ QUE ES UNA BASE DE DATOS? Una base de datos es un «almacén » que nos permite guardar grandes cantidades de información de manera organizada para que.
Los virus informáticos son pequeños programas de software diseñados para propagarse de un equipo a otro y para interferir en el funcionamiento del equipo.
Febrero 2014 ORIENTACIONES PARA CARGUE DE LA EVALUACION DE DESEMPEÑO DOCENTE Y DIRECTIVO DOCENTE EN EL APLICATIVO HUMANO DE LA SED CHOCÓ.
MIA - Grupo 5 Unidad 2.
FORMULARIOS Para introducir datos en las tablas de una forma simple, visual y cómoda. Los formularios tambien se usan para IMPRIMIR datos BASE DE DATOS.

ARRAYS Y COLECCIONES DE DATOS. ARRAYS Arrays – Matriz – Vector Elemento del lenguaje que nos permite agrupar un conjunto de valores del mismo tipo, y.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
TRABAJOS PRACTICOS REALIZADOS ALUMNA: Lesly Sasshira Cruz Pancca.
Unidad 6. Tema 4. Lenguaje de consultas SQL
Administración de datos Ing Tania Ordóñez. Un archivo es un elemento de información conformado por un conjunto de registros. Estos registros a su vez.
Structure Query Languaje SQL. Introducción a SQL El lenguaje de consulta estructurado (SQL) es un lenguaje de base de datos normalizado, utilizado por.
Introducción a phpmyadmin índice 1. Introducción 6. Insertar registros 5. Crear usuario para php 8. Modificar registros 2. Base de datos MySQL 3. Crear.
Bases de datos II Universidad del Cauca Ing. Wilson Ortega.
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO FACULTAD DE INGENIERÍA COORDINACIÓN DE MATERIAS PROPEDÉUTICAS INGENIERÍA EN SISTEMAS ENERGÉTICOS SUSTENTABLES.
Transcripción de la presentación:

RENDIMIENTO Y ORGANIZACIÓN DE ARCHIVOS

En este documento se compara el coste de algunas operaciones simples en varias organizaciones de archivo básicas sobre una colección de archivos de empleado. Se supondrá que los archivos e índices están organizados de acuerdo a la clave de búsqueda compuesta(edad, sueldo) y que las operaciones de selección están sobre estos campos. Las organizaciones que se consideran son: - Archivos de registros de empleados ordenados de forma aleatoria en un archivo de montículo. - Archivo de registros de empleados ordenado por (edad, sueldo). - Archivo de árbol B+ agrupado por (edad, sueldo). - Archivo de árbol B+ no agrupado por (edad, sueldo). - Archivo de Montículo con un índice no agrupado por (edad, sueldo).

OPERACIONES A REALIZAR Nótese que si el archivo de datos está ordenado. !un índice cuya clave de búsqueda difiera del orden del archivo se comporta como un índice sobre archivo de montículo. Las operaciones que se consideran son: – Exploración: Lee todos los registros del archivo. – Búsqueda con selección de igualdad: Lee todos los registros que satisfacen una selección de igualdad; ejemplo: Determinar el registro de empleados con edad 23 y sueldo 50 – Búsqueda con selección por rango: Lee todos los registros que satisfacen una selección por rango; Los registros de empleados con edad mayor a 35. – Insertar un registro: Insertar un registro en el archivo, se debe identificar la página en la que se debe insertar el registro. – Borrar un registro: borrar un registro identificado por un criterio de búsqueda, se debe encontrar la página, leerla, modificarla y escribirla en disco.

MODELO DE COSTE B: número de páginas de datos cuando los registros están distribuidos en páginas sin desperdiciar espacio. R: número de registros por página. D: tiempo medio para leer o escribir una página en disco. C: tiempo medio para procesar un registro (comparar el contenido del registro).. Función de asociación: se utiliza para corresponder un registro en un rango de números. H: tiempo requerido para aplicar la función de asociación a un registro.

MODELO DE COSTE: VALORES TÍPICOS D =15 milisegundos. C y H = 100 nanosegundos. Se debe considerar también la velocidad del CPU y el tráfico generado al transmitir datos.

ARCHIVOS EN MONTÍCULO Exploración: el coste es B(D+RC) pues hay que recuperar cada una de las B páginas tomando un tiempo D por página y para cada página procesar los B registros con un tiempo C por registro. Búsqueda por selección de igualdad: – Suponiendo que el registro exista en promedio se debe leer la mitad del archivo 0,5B(D+RC). – En caso que no exista el registro se debe leer todo el archivo. – Sino se busca por un criterio de clave candidata se debe leer todo el archivo y no se sabe cuantos registros cumplen el criterio. Búsqueda por selección de rango: no se sabe donde están ubicados los registros que satisfacen el criterio de búsqueda el coste es B(D+RC). Inserción: se insertan los registros al final del archivo, es necesario leer la última página del archivo, añadir el registro y escribir la página, el coste es: 2D+C Borrado: Es el cote búsqueda + (C+D); sin considerar compactación.

ARCHIVOS ORDENADOS Exploración: el coste es B(D+RC), obsérvese que este caso no es mejor ni peor que los archivos no ordenados. Búsqueda por selección de igualdad: – Suponiendo que la selección de igualdad se corresponde con el criterio de ordenación (edad, sueldo) (al menos edad=30 o sueldo=50) – Se puede encontrar la primera página con una búsqueda binaria log2B, cada paso posterior para encontrar todos los registros que cumplen la condición requieren de una operación E/S y dos comparaciones. – Una vez encontrada la página el primer registro puede encontrarse nuevamente haciendo una búsqueda binaria cuyo coste es Clog2R por tanto el coste es Dlog2B+Clog2R. Búsqueda por selección de rango: suponiendo que la selección es por el criterio de búsqueda (edad, sueldo) el coste es similar a la búsqueda por selección de igualdad para varios registros que cumplan la condición. Inserción: para insertar un registro y mantener el orden es necesario encontrar la posición correcta en el archivo, añadir el registro y después leer y reescribir todas las páginas posteriores. El coste es el correspondiente a encontrar la posición del registro nuevo 2(0,5(D+RC)) es decir coste de búsqueda B(D+RC). Borrado: Es necesario buscar el registro, borrarlo de la página y escribir la página.

COMPARACIÓN DE LOS COSTES E/S Tipo de Archivo ExploraciónBúsqueda por Igualdad Búsqueda por Rango InserciónBorrado MontículoBD0,5BDBD2DBúsq+D OrdenadoBDDLog 2 BDLog 2 B+núm paso sel. Búsq+BD Agrupado1,5BDDLog F 1,5BDLog F 1,5B+n úm. paso sel. Búsq+D Índice en árbol no agrupado BD(R+0,15)D(1+Log F 0,1 5B) D(1+Log F 0,1 5B)+núm. pasos sel. D(3+Log F 0,15B)Búsq+2D Índice asociativo no agrupado BD(R+0,125)2DBD4DBúsq+2D

ÍNDICES Y AJUSTES DE RENDIMIENTO La elección de los índices tiene un impacto enorme en el rendimiento del sistema y debe realizarse en el contexto de la carga de trabajo es decir la combinación más habitual de operaciones y actualización. El tratamiento completo de índices y su rendimiento requiere entender lqa evaluación de consultas de la base de datos y el control de concurrencia.