Presentado por: Luis Loaiza Carlos Andrés Granda Informe de Materia de Graduación Procesamiento Masivo y Escalable de Datos.

Slides:



Advertisements
Presentaciones similares
Google AdWords de la A a la Z Juan Pittau Google Advertising Trainer
Advertisements

1 Monitoreo en Línea División de Informática Superintendencia de Valores y Seguros de Chile 2008.
Contenido Sistemas de Información Desarrollo de software
E-BUSINESS UNIDAD V PLAN DE NEGOCIOS.
Repaso DBD!!! (Es ahora o nunca)
Desarrollo de Base de Datos en la Web
Construcción de la marca digital
Almacenamiento en la nube
Introducción que se desprende del slide que presentamos la primera vez donde estaban las posibles aplicaciones animadas (para que vean que no estamos presentando.
Entrada Procesos Salida ¿Qué es un Proceso?
Fondos Específicos Estado de Variaciones en el Saldo de los Fondos al 31/12/13 (Detalle por Subprograma) Consolidado por Proyecto.
Utilización de la plataforma Hadoop para implementar un programa distribuido que permita encontrar las paredes de células de la epidermis de plantas modificadas.
MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS
Búsquedas avanzadas en la Wikipedia
Sistema de Agrupamiento y Búsqueda de Contenidos de la Blogosfera de la ESPOL, Utilizando Hadoop como Plataforma de Procesamiento Masivo y Escalable de.
Sistema Para GENERAR gráficas a partir de logs tcpdump usando Hadoop
SERIE V Inventarios S I S T E M A S.
Agenda Introducción Relevamientos de tecnologías
Universidad Nacional de Córdoba
Sistemas Monolíticos y Micro núcleos
Virtualization Day 2012 Virtualización y SQL Server 2012 Lic. Horacio A. Gonzalez
Se pueden realizar búsquedas de palabras claves (nombre de la marca) mediante la siguiente pagina: arroja un resultado extenso de.
SOA, Web 2.0 y Cloud Computing Tres aspectos innovadores en IT
Soluciones en la nube, decisiones aterrizadas
Johanna Lizeth Rodríguez Lorena Fda. Chávarro Ramos
Convertir su marketing en social.Agregar un + Agregue un + para que sus campañas en Google sean sociales.
Denisse Cayetano – Christian Rivadeneira
SkyDrive SkyDrive permite a los usuarios subir archivos de una computadora y almacenarlos, a manera de un disco duro virtual y acceder a ellos desde un.
SQL SERVER APLICADO (SSA010) Ariel Alexis Fierro Sáez DuocUC.
PREZENSA ASISTENCIA Compensación WEB.
MySQL M.C. Pedro Bello López.
Propuesta del proyecto de Gestion de archivos del Registro Oficial Hernando Manotoa Rodrigo Salazar.
Weka.
Cloud Computing Miguel Mendoza Senior Consultant.
Objetivos Objetivos Teorías Técnicas Resultados Conclusiones
Su opción de orientación. Red de Display de Google Red de Display de Google Opciones de orientación.
Generación de recomendaciones de ítems musicales basado en las valoraciones implícitas y las similitudes de los usuarios utilizando Hadoop para procesamientos.
INFORME DE PROYECTO DE GRADUACIÓN
Graficación IA7200-T Imágenes – Introducción. Graficación2 Imágenes Definición Formatos de archivos Representación Interna Save: Imágenes-> Archivo Imágenes.
SISTEMA DE PLANIFICACION EN LINEA
Trabajo Final de Grado Propuesta de Seguridad en Herramienta de Desarrollo Colaborativo Project Management Europe Config & Build China JAZZ Development.
Sesión 6 Plataforma Virtual Moodle Plataforma Virtual e-ducativa
Presentado por:  Andrés Cantos Rivadeneira  Bolívar Elbert Pontón “MÓDULO DE RECOMENDACIONES DE PÁGINAS A VISITAR EN LA WIKIPEDIA, BASADO EN LAS APORTACIONES.
Sistema Organizador de Invitaciones, Eventos y Memos basado en una aplicación Cliente – Servidor SOIEM TESIS DE GRADO FIEC – ESPOL 2007 Christian Vulgarin.
Auditoria Sistema Información RRHH.
Manual de usuario. Configuración inicial Para comenzar a utilizar la aplicación lo primero que tiene que hacer es configurar el Huso horario y la configuración.
DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR TECNOLÓGICA INSTITUTO TECNOLÓGICO DE SALINA CRUZ UNIDAD: 1.- INTRODUCCIÓN A LAS REDES ACTIVIDAD: CUADRO SINOPTICO.
Cloud Computing Expositor: Andrius Morganti. Cloud Computing Cloud Computing Nube, Internet Abstracción de detalles Uso de TI Cloud computing = Computar.
PROGRAMA DE APOYO AL PROCESO DE PARTICIPACIÓN PRIVADA Y CONCESIONES EN INFRAESTRUCTURA, SEGUNDA ETAPA PPCI-2 CAPTACIÓN DE NUEVOS RECURSOS PARA LA INFRAESTRUCTURA.
Condiciones Sustentación Trabajo de grado
Integrantes: Jorge Herrera M. Carlos Rodríguez R..
ASOPROJECT Componentes del grupo: - Alberto Díaz Gil - Miguel Ángel Llorente Gracía - Javier E. Yépez Hualde.
Informe de Materia de Graduación “Uso de la plataforma Pig sobre Hadoop como alternativa a una RDBMS para el análisis de datos masivos. Prueba de concepto.
TIPOS DE LICENCIAMIENTOS Ing. Andres Jara Werchau.
Cloud Computing.
carlos luis loor  La computación en la nube, concepto conocido también bajo los términos servicios en la nube, informática en la nube, nube de cómputo.
Francisco Gamboa Herrera Tanya Pérez Herrera 26 Noviembre 2010.
Sus Funciones, Formación Necesaria y Rasgos Característicos
RESEARCH ON ALGORITHMS OF DATA MINING UNDER CLOUD COMPUTING ENVIRONMENT BY FEI LONG KEVIN FLORES ALVAREZ INF-252.
ALMACENAMIENTO EN LA NUBE
business intelligence
Computación en la Nube.
Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Optativa II Carlos Quilumbaqui. ¿Qué es Big Data? Big Data son grandes en cantidad, se capturan a un índice rápido, y son estructurados o no estructurados,
1.ª Parte: Dónde y cómo buscar información.  Cuando se busca información sobre un tema, es necesario emplear una «estrategia de búsqueda» para optimizar.
Bases de datos II Universidad del Cauca Ing. Wilson Ortega.
Libro Electrónico Clase 3 – Las librerías y la web.
Informe de Materia de Graduación
Informe de Materia de Graduación
Transcripción de la presentación:

Presentado por: Luis Loaiza Carlos Andrés Granda Informe de Materia de Graduación Procesamiento Masivo y Escalable de Datos

MINERÍA DE LOGS DE UNA APLICACIÓN SOCIAL MULTIUSUARIO EN LÍNEA

Introducción Minería es el proceso de extraer información que se encuentra implícita en los datos. Aplicación social: son de uso masivo y están vinculadas a las redes sociales. Logs o bitácoras son archivos que almacenan información con respecto a actividades siguiendo un formato específico.

Objetivo Realizar minería sobre los archivos de log de una aplicación social que utiliza el concepto de In-Game Advertising, para obtener indicadores de aceptación de marcas o productos, que se encuentran representados de manera virtual dentro de la aplicación.

In-Game Advertising Estrategia de Marketing que incluye publicidad sutilmente dentro del contexto de un juego o aplicación social.

FarmVille de ZINGA Usuarios diarios Usuarios mensuales Crecimiento Diario 2.12 Pet Society de PlayFish Usuarios diarios Usuarios mensuales Crecimiento Diario 0.78 Aplicaciones similares a la del caso de estudio.

Características de la aplicación de caso de estudio.

1.Generar archivo de usuarios 2.Generar archivo de empresas 3.Obtener log de actividades 4.Subir los archivos al S3 5.Cargar el proceso en EC2 6.Generar Reportes Flujo de Procesos

Recursos Utilizados Facebook API Amazon Web Services: – Elastic Cloud Computing (EC 2 ) – Simple Storage Server (S 3 ). Apache Hadoop Apache Pig

Id UsuarioNombreFecha NacimientoEdadSexo 125 George Enrique Reyes Tomalá July 4, male Id Marca Producto NombreEmpresaCaracterísticas Mercado Objetivo 12HotWheelsMattel edad =25;sexo=masculino; claves=autos,juguetes DateTimeIdUsuarioActividadTipoMarca 12126Personalizar112 Datasets de entrada Marca o Producto por Empresa Usuario Log de Actividades

Código Pig log = load 'proyecto/logSocketServer.txt' using PigStorage('\t') as(fecha:chararray, uid:int, accion:chararray, tipo:int, marca:int); userData = load 'proyecto/usersData.txt' using PigStorage('\t') as (uid:int, nombre:chararray, birthday:chararray, edad:int, sexo:chararray); marcaNombreFilter = filter filtro by marcaCondicion; marcaNombreUsuarios = foreach marcaNombreFilter generate uid; marcaNombre = distinct marcaNombreUsuarios; marcaNombreGroup = group marcaNombre All; marcaNombreGeneral = foreach log generate marca, COUNT(uid) as totalUsuarios;

Resultados

Conclusiones Mayor cantidad de características de usuario. Este trabajo puede ser replicado para obtener otro tipo de información estadística. Para trabajo futuro se podrían categorizar las marcas y productos. Recomendaciones Los indicadores obtenidos permiten inferir nivel de aceptación. Optimiza el proceso de minería de logs.