RESEARCH ON ALGORITHMS OF DATA MINING UNDER CLOUD COMPUTING ENVIRONMENT BY FEI LONG KEVIN FLORES ALVAREZ 201-30-5386 INF-252.

Slides:



Advertisements
Presentaciones similares
Internet y tecnologías web
Advertisements

Introducción a servidores
Base de Datos Distribuidas FUNDAMENTOS DE BASES DE DATOS DISTRIBUIDAS
Universidad Nacional Autónoma de Honduras
Stuart Pérez A12729.
SISTEMAS DE PROCESAMIENTO DE TRANSACCIONES
MÉTODOS Y ELEMENTOS DE PROGRAMACIÓN
Utilización de la plataforma Hadoop para implementar un programa distribuido que permita encontrar las paredes de células de la epidermis de plantas modificadas.
MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS
Sistema de Agrupamiento y Búsqueda de Contenidos de la Blogosfera de la ESPOL, Utilizando Hadoop como Plataforma de Procesamiento Masivo y Escalable de.
Sistema Para GENERAR gráficas a partir de logs tcpdump usando Hadoop
Completeness of Information Sources
Jesús Angel Ovando División de Estudios de Posgrado Instituto Tecnológico de Orizaba.
Programación 1 Introducción
BASES DE DATOS DISTRIBUIDAS
Teoría de lenguajes y compiladores
Introducción arquitectura base de datos Microsoft SQL Server 2000/2005
Infraestructura de Tecnologías de Información
SOA, Web 2.0 y Cloud Computing Tres aspectos innovadores en IT
DEFENSA PÚBLICA Jorge Salinas
Denisse Cayetano – Christian Rivadeneira
Introducción a la computadora
Administración de la Tecnología Empresarial Mtro. Arturo Téllez Mejía Problemática de negocio Caso Aguirre Newman Chávez Mejía Jaime Peragallo Álvarez.
Introducción a la Programación. Lenguaje de Máquina.
Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar.
Sistemas de Información IS95872
Contenido: 1- Que es el .Net Framework 2- Arquitectura en .Net
Colegio de Bachilleres Xochimilco Tepepan Plantel No. 13 Stone Chávez Mayra Fernanda Gabriela Pichardo Grupo: 308 Equipo: 22 1Stone Chávez Mayra Fernanda.
Clusters Presentado por : Manuel Alejandro ahumada trochez Yenny carabali.
DATA WAREHOUSE PREPARADO POR : María Alejandra Franco Lina María Arias.
Programación I MC José Andrés Vázquez Flores
Introducción al modelo Cliente-Servidor Carlos Rojas Kramer Universidad Cristóbal Colón.
Computación en la Nube UASF.
FUNDAMENTOS DE PROGRAMACION
Integrantes: Jorge Herrera M. Carlos Rodríguez R..
ANÁLISIS DE FACTIBILIDAD Y SELECCIÓN DE UN FRAMEWORK DE BÚSQUEDA GLOBAL PARA SU IMPLEMENTACIÓN EN EL SISTEMA GESTOR FIDUCIA FONDOS JEE DE LA EMPRESA GESTORINC.
ASOPROJECT Componentes del grupo: - Alberto Díaz Gil - Miguel Ángel Llorente Gracía - Javier E. Yépez Hualde.
Una nube de servicios y oportunidades. El cloud computing es un modelo de distribución de tecnológica que se caracteriza principalmente porque tiene una.
Programación de Sistemas 2003 Cambio de passwords en la RCE vía Web.
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
LOGO e-Learning Desktop Integración de RIA’s a objetos de Aprendizaje Alvaro Rodríguez, Darvin Orozco, Rocael Hernández Universidad Galileo {alvrodriguez,
Cloud Computing.
carlos luis loor  La computación en la nube, concepto conocido también bajo los términos servicios en la nube, informática en la nube, nube de cómputo.
Cloud Computing Grupo 4 de computación y programación
Access.
SERVICIOS EN LA NUBE La computación en la nube, concepto conocido también bajo los términos servicios en la nube, informática en la nube, nube de cómputo.
Microsoft Access Microsoft Access, es la base de datos relacional más popular, además forma parte de la aplicación de Microsoft Office. Permite crear.
Abdelahad, Yanina Zoraida Abdelahad, Corina Natalia Perez, Norma Beatriz Abril de 2003.
COMPUTACIÓN EN LAS NUBES
GESTIÓN DE REDES - INTRODUCCIÓN
Generalidades Autor: Yohn Jair Palacios Fecha: octubre 23 de 2013.
WINDOWS 2008 SERVER
Aplicado a Negocios Hecho por Jocelyne Gutierrez
Naime Cecilia del Toro Alvarez
Unidad TemáticaI. Conceptos Básicos Horas Prácticas10 Horas Teóricas8 Horas Totales18 Objetivo El alumno determinará las entradas, procesos y salidas.
LA NUEVA GESTIÓN DEL TALENTO ALEJANDRO SOLER CHAUZA TAG Distancia 5ª INFORMÁTICA V 1.
BASE DE DATOS DISTRIBUIDAS
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
Gestión Electrónica Documental (GED)
Computación en la Nube.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
INFORMATICA EN LA NUBE Lesbia E. González M.. La nube es un hogar para los archivos que no viven en tu computadora. La computación en la nube nos permite.
BUSINESS T&G Think & Grow Uniclass Gestión Documental Solución Web para Mejorar la Captura y Gestión.
Antivirus Cloud Computing ¿Que es? Antivirus Cloud Computing es un software de protección, como los antivirus tradicionales, pero con la característica.
Optativa II Carlos Quilumbaqui. ¿Qué es Big Data? Big Data son grandes en cantidad, se capturan a un índice rápido, y son estructurados o no estructurados,
Los Antivirus en la Nube no son otra cosa que antivirus tradicional, pero con la característica de no estar ejecutándose en nuestra computadora, con el.
CICLO DE VIDA DE UN SOFTWARE. Es el conjunto de los programas de cómputo, procedimientos, reglas, documentación y datos asociados, que forman parte de.
Silberschatz, Galvin, and Gagne  Applied Operating System Concepts Memoria Virtual Concepto Paginado bajo demanda Performance del Paginado bajo.
Diccionario/Directorio de Datos
Transcripción de la presentación:

RESEARCH ON ALGORITHMS OF DATA MINING UNDER CLOUD COMPUTING ENVIRONMENT BY FEI LONG KEVIN FLORES ALVAREZ INF-252

INTRODUCCIÓN Fei Long, el autor del articulo “Research on algorithms of data mining under cloud computing environment” habla sobre la mejora de la entrada de Datos utilizando un algoritmo llamado MRApriori, en vez de utilizar el algirtmo original Apriori para el manejo de los datos.

QUE ES DATA MINING Es el proceso de encontrar correlaciones o patrones entre campos de información en banco de datos relaciones. Consiste de: Extraer, transformar y cargar datos Almacenar y manejar datos Proveer acceso Analizar los datos Presentar datos en un formato útil y fácil de entender

QUE ES MAPREDUCE Es un modelo de programación para el procesamiento de datos. Simplifica la implementación de muchas aplicaciones de datos mediante la eliminación de tareas. Simplifica el procesamiento de los datos Tolerancia a fallos Alto nivel Ayuda al mantenimiento eficiente del sistema.

EJEMPLO: MAPREDUCE

QUE ES CLOUD COMPUTING Cloud computing son servicios y programas localizados en el internet que incluyen: Virtualización Servicios de Paginas web Service oriented arquitecture Web 2.0 Web mash up

GOOGLE HADOOP Esta escrito en Java Conjunto de libretos de instalaciones y librerías de programas que están optimizadas para la infraestructura de google. El usuario o la compañía tiene un ambiente de alta calidad para poder procesar datos. MapReduce puede ser ejecutado desde el Google Hadoop sin necesitar copiar datos o procesos al local disk.

ALGORITMO MRAPRIORI Utiliza componentes de Google Hadoop para hacer ejecuciones de trabajo y almacenar información El algoritmo MRApriori consiste de: Generar todos los conjuntos (itemsets) frecuentes Generar una regla de asociación a base de los conjuntos (itemsets) frecuentes. Puede procesar grandes cantidades de datos sin reducir su tiempo de ejecución.

MRAPRIORI ALGORITHM

INFORMACIÓN ADICIONAL PARA MRAPRIORI Reglas de asociación – declaraciones if/then que ayudan a demostrar la relación entre datos en un banco de datos transaccional, relacional o de cualquier otro tipo. Los conjuntos (itemsets) son conjuntos de información que pueden aparecer en diferentes tablas múltiples veces que a su vez es un subconjunto de otro.

RESULTADO DEL MRAPRIORI

CONCLUSION El algoritmo original Apriori hace lo mismo que el MRApriori, pero la diferencia esta en los componentes que el MRApriori utiliza para manejar los datos. Los resultados del experimento comprobó que el algoritmo propuesto por Fei Long es mas rápido y eficiente al ejecutar la misma o mayor cantidad de trabajos ejecutados que el código original.

REFERENCIAS Long, F. Research on algorithms of data mining under cloud computing environment. Journal of Chemical and Pharmaceutical Research, 2014, 6(7):