Paralelización de Análisis de Reglas de Asociación Andrés Villavicencio T.

Slides:



Advertisements
Presentaciones similares
IMPLEMENTACION CONTIGUA Y NO CONTIGUA
Advertisements

Almacenamiento del sistema de archivos La gestión de archivos es uno de los componentes mas visibles de un sistema operativo. Las computadores pueden almacenar.
DISEÑO DE TRANSFERENCIA ENTRE REGISTROS
Procesos y procesadores en sistemas distribuidos
Arquitectura de Sistema de E/S
Red Social: “Un millón de Amigos”.
Los Ordenadores Javier Yebra. ¿Qué es un ordenador? El ordenador es un dispositivo electrónico que permite almacenar información, modificarla y generar.
Los Ordenadores Javier Yebra. ¿Qué es un ordenador? El ordenador es un dispositivo electrónico que permite almacenar información, modificarla y generar.
Base de Datos Distribuidas FUNDAMENTOS DE BASES DE DATOS DISTRIBUIDAS
Dentro del grupo de investigación TELETECNO se desarrollo el proyecto el cual esta dirigido al estudio y aplicación de tecnología inalámbrica wifi y su.
Estructura de Datos Hugo Araya Carrasco Hugo Araya Carrasco.
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
CLIENTE - SERVIDOR Es un esquema de trabajo en la distribución y operación de información entre los equipos computacionales disponibles en una red. Quién.
Módulo 5. Proyectos de ahorro de energía
Término que se le da al conjunto de equipos de cómputo que se encuentran conectados entre si por medio de dispositivos físicos que envían y reciben -
Servidores de nombres de dominio (DNS)
Elemento Lógico (Software)
HILOS Y COMUNICACIÓN ENTRE PROCESOS
Análisis y Diseño de Algoritmos
Temas importantes para el desarrollo de la segunda parte del TPE
Algoritmos de ruteo 1. El algoritmo de ruteo es un componente de software de la capa de red responsable de decidir en que salida transmitir un paquete.
Protocolos de enrutamiento por vector de distancia
Función Estructura y composición Tipos
Elaborado por: Guillermo Baquerizo I Término
JERARQUIA DE LA MEMORIA
Regalo de Banesto al domiciliar tu nómina durante 30 meses y dos recibos.
ARQUITECTURA DE COMPUTADORAS INTEGRACION DE LAS TECNOLOGIAS DE INFORMACION Y COMUNICACION.
Adaptive Coded Modulation System Model. El problema  Usuarios de servicios inalámbricos requieren altas tasas de transferencia de datos.  Requerimientos.
Sistema de comunicación segura.. Comunicación Segura Las agencias gubernamentales, organizaciones y personas del común tienen a disposición todas las.
Enrutamiento IP. Enrutamiento IP El router como una computadora Describa la función básica de un router Son computadoras que se especializan en el.
File Transfer Protocol (FTP) Jorge Cobeña David González Christian Maray Andrés Valarezo.
1 Capítulo 15: Traducción de Direcciones de Protocolo ICD-327: Redes de Computadores Agustín J. González.
Análisis y Diseño de Algoritmos
COMPONENTES DEL SISTEMA OPERATIVO.
PROCESO DE RESOLUCIÓN DE UN NOMBRE DE DOMINIO. El resolver o cliente DNS es la parte del sistema operativo encargada de resolver nombres de dominio cuando.
MEDIOS DE ALMACENAMIENTO
PROTOCOLO.
Introducción a los SOs.
Mejora de la localidad en operaciones de E/S colectivas no contiguas XVIII Jornadas de Paralelismo, JP’2007 Rosa Filgueira, David E. Singh, Florin Isaila,
Procesos Estocásticos Edgar H Criollo V Mayo 2010
TARJETAS DE RED.
Tendencias Generales Dotación física Software lógica Más pequeño
UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO MODULO IV ADMINISTRACIÓN DE BASES DE DATOS Ajustes de configuración de rendimiento (performance & tuning) E.I.
Protocolos de enrutamiento por vector de distancia
EL SERVICIO ORIENTADO A CONEXIONES Sigue el modelo del sistema telefónico. Para hablar con alguien levantamos el auricular, marcamos el número, Hablamos.
INFORMÁTICA Conceptos Fundamentales
Referencia: Robert Barro, Macroeconomics Capítulo 4
DOCUMENTOS DE UN ALMACEN
DISEÑAR Y ELABORAR ALGORITMOS NOMBRE: LAURA PAEZ GARCIA GRADO Y GRUPO: 1 “3” MATERIA: INFORMÁTICA Y COMPUTACIÓN MAESTRO: ÁNGEL BUENDÍA TURNO: VESPERTINO.
Unidad 4: Estándares de documentación (continuación)
PROTOCOLOS DE COMUNICACIÓN PRESENTAN: GUADALUPE MORALES VALADEZ ESTELA ORTEGA AGUILAR IRAIS UGARTE BAUTISTA LAURA ARELI JERONIMO FLORES ANA LILIA CONDE.
Jorge De Nova Segundo. Clientes DNS Se puede considerar que un resolver es cualquier software capaz de preguntar a un servidor DNS e interpretar sus respuestas.
Diseño de Redes - Capítulo 3
ROUND ROBIN.
Sistemas Operativos I Introducción
Elementos y tipos de sistemas operativos
PROTOCOLOS Modelo TCP/IP
DISCOS RAID (Redundant Array of Independent Disks)
ADMINISTRACIÓN DE REDES SIZING de Servidores.
TIPOS DE REDES Dedicadas
YUBER ANDRÉS LOAIZA OROZCO SERVIDOR PROXY GESTIÓN DE REDES DE DATOS.
Profesor: ► Héctor Shultz Pérez Integrantes: Wladimir Cortés Cortés Macarena Quiroz Armijo Juan Muñoz Salazar Ives Escobar Ávila.
LOS COMPONENTES DEL ORDENADOR
Planificación de uso del procesador Rina Arauz. Planificación de CPU 2 UNAN-Leon La ejecución de un trabajo se compone de secuencias de procesador y de.
En informática, es un protocolo de red para la transferencia de archivos entre sistemas conectados a una red TCP (Transmission Control Protocol)
Planificación de CPU Conceptos Básicos Criterios de Planificación Algoritmos de Planificación Planificación con Múltiples Procesadores Planificación Real-Time.
9-Febrero Características técnicas de los dispositivos periféricos Ana Luz Martínez Guerra.
Al seleccionar una red es importante conocer los elementos que la componen, entre estos elementos contamos con: el equipo de cómputo que se estará utilizando.
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) IV. IMPLANTACION DE ALGORITMOS.
 Trabaja con el esquema relacional surgido en los laboratorios de IBM  La instalación completa ocupa alrededor de 10 Mb incluyendo librerías, ejemplos.
Transcripción de la presentación:

Paralelización de Análisis de Reglas de Asociación Andrés Villavicencio T.

Itinerario. División del Algoritmo secuencial. Propuesta Inicial. Evaluación de rendimiento. Corrección propuesta. Evaluación de rendimiento. Comentarios.

División del Algoritmo secuencial. Aplanar transacciones: aproximadamente 5% del consumo de cpu. Expandir itemes: aproximadamente 25% del tiempo de procesamiento. Generar Pares: aproximadamente 10% del tiempo de procesamiento. Almacenar reglas: 60% del procesamiento y 95% del consumo de memoria.

Propuesta inicial Se divide el algoritmo en 2 procesos. – Procesador de archivos. – Servidor de Almacenamiento (Activo). Se pueden crear cualquier numero de instancias de ambos procesos.

Procesador de Archivos. Recibe como parámetro la lista de servidores de almacenamiento creados. Realiza: aplanamiento, expansión y generación de pares. Construye grupos de 1 millón de pares de productos y los envía al servidor correspondiente.

Servidor de Almacenamiento. Es un objeto activo Realiza el almacenamiento de los datos. Esquema de operación: – Si hay un paquete de datos esperando ser recibido, se recibe. – En cualquier otro caso procesa datos.

Evaluación del rendimiento.

Corrección Propuesta Gran parte de la reducción de la velocidad esta asociada a problemas de red. 1.5 millones de transacciones con un promedio de 80 itemes por transacción significan: 3200 pares * 12 bytes por par * transacciones = bytes o alrededor 57 GB de transferencia.

Correccion Propuesta En vez de transmitir los pares de reglas, transmitimos los itemes de las transacciones. 1.5 millones de transacciones a 80 itemes por transacción: 324 bytes * = 486M por servidor.

Evaluación del rendimiento 2.

Comentarios Aun hay asuntos por resolver: – Manejo de excepciones. – Deployment automatizado. – Configuración optima de servidores almacenamiento vs procesador de archivos. – Carga máxima de red.

¿Preguntas?