Desde Big data a la Analítica de Datos

Slides:



Advertisements
Presentaciones similares
O ALUMNO: SOLA AGUSTÍN o PROFESORA: PARDO MARÍA JOSÉ o COLEGIO: INSM o ASIGNATURA : TIC TIC.
Advertisements

Aplicaciones para el manejo óptimo de la información.
COMUNICACIÓN Y TICS Károl Fernanda Barragán M. Jennylith Dayana Ardila P. Wendy Paola Pinto F.
La mercadotecnia tal y como la conocemos no es la misma que conocíamos hace algunos años y tampoco será la misma en un futuro próximo. Desde la llegada.
COMUNICACIÓN Y TIC Ángela Espinosa Hayler Peñaranda.
MAESTRIA EN ADMINISTRACION NEGOCIOS ELECTRONICOS MC. OMAR AGUSTIN HERNANDEZ G.
Sistemas de Información Capítulo 2. Sistemas de información.
Magister René Ramírez Fernández
DIRECTOR SECTOR PÚBLICO ECUADOR Y COLOMBIA
TENDENCIAS FUTURAS DE TIC EN LA EDUCACIÓN
ADMINISTRACION Y FINANZAS
Tipos de Sistemas de Información
Proceso de inventario Almacenes
Plataforma & Modelo de Innovación
1ERA UNIDAD DE MICROSOFT WORD
SISTEMAS DE INFORMACION GERENCIAL
TECNOLOGÍA PARA EL CAMBIO SOCIAL
Herramienta de Gestión de Inventario de Activos
09 de mayo del 2016Pg. 1 ING. BERTHA MAZON, UNIDAD III: SOLUCIONES DE INTELIGENCIA DE NEGOCIOS.
U.T. 11: Introducción A Las Bases De Datos
Gestión de Riesgos Corporativos
NETSUITE Y OTRAS SOLUCIONES INTEGRALES CON ERP, SCM Y CRM
La gerencia Es un cargo que ocupa el director de una empresa, el cual representa a la sociedad frente a terceros y coordina todos los recursos mediante.
Inteligencia de Negocios Business Intelligence (BI)
Windows server 2008.
Casos de Éxito Internacionales y uso efectivo de Datos Abiertos
ARQUITECTURA DE COMPUTADORES
Customer Relationship Management
II Unidad Procesador de texto Docente Guillermo Verdugo Bastias.
SISTEMAS DE INFORMACIÓN
MEJORA EN LA TOMA DE DECISIONES
PROCESOS DE NEGOCIOS Y SISTEMAS DE INFORMACION
SISTEMAS DE INFORMACION
BIG DATA e INTERNET DE LAS COSAS
Para reflexionar ¿Cuál es la importancia de la información para la investigación y el desarrollo de la innovación técnica? ¿Cuáles son las principales.
AuraPortal Cloud ayuda a las organizaciones a automatizar y controlar sus procesos de negocio a través de aplicaciones en la nube de Microsoft Azure PERFIL.
BASES DE DATOS FUNDAMENTO DE BASES DE DATOS
M. En C. Pedro Alejandro Calvo Guerrero. Objetivo del proyecto Business Intteligence “La información en las organizaciones está aumentando rápidamente,
Sistemas De Información.
PROVEEDOR DATA WAREHOUSE TERADATA
Inteligencia de Negocios Business Intelligence (BI) Una herramienta para tomar decisiones.
NEGOCIOS ELECTRONICOS. INTRODUCCION Los negocios electrónicos, también conocidos como "e-business", pueden definirse como la utilización de tecnologías.
Tecnologías de la Información y Comunicaciones
Fundamentos de Sistemas de Información
Sistemas de Información Capítulo 2. Sistemas de información.
Sistemas de Información Capítulo 2. Sistemas de información.
Informe de Materia de Graduación
Customer Relationship Management
Servidor de Reportes basado en Tecnología Java y XML
Ciencia de datos, big data y redes sociales
Sistemas de Información Capítulo 2. Sistemas de información.
A continuación, le vamos a contar
Sistemas de Información Capítulo 2. Sistemas de información.
Introducción con “Google Activate” Recopilación Profra Myrna para la Clase CV
Inteligencia (estrategia) empresarial Cómo generar valor en las
PLANEAR ACTIVIDADES DE MERCADO. POR DR. C.P./ LIC. EDUARDO BARG RESPONDER A LAS NECESIDADES, EXPECTATIVAS Y OBJETIVOS DE LOS CLIENTES Y LAS EMPRESAS.
UNIVERSIDAD TECNOLÓGICA DEL PERÚ Microsoft Corporation fue fundada por Paul Allen y Bill Gates, está dedicada al sector de software y hardware. Un producto.
Función general Norma relacionada Implicancias de la función – Dependencias involucradas AREA DE ALMACEN Emisión de documentos fuentes NEA, PECOSAS, KARDEX.
Tema 8: Administración de la cadena de suministro (SCM)
Conceptos de Hadoop Rogelio Ferreira Escutia
Inteligencia de Negocios Business Intelligence (BI) Una herramienta para tomar decisiones.
Presentación CRM 2019.
Sistemas de Información Capítulo 2. Sistemas de información.
Sistemas de Información. 2 Capítulo 2. Sistemas de información y métodos de desarrollo. Estructura 1. ¿Qué es un sistema de información? 1.1. Concepto.
Saca provecho de la tecnología para que tu negocio sea más competitivo
Las Tecnologías de la Información y la Comunicación (TIC) son todos aquellos recursos, herramientas y programas que se utilizan para procesar, administrar.
ING. NANCY BASILIO MARCELO ADMINISTRACIÓN REDES DE COMPUTADORAS.
DISEÑO DE CARGOS Proceso de organización del trabajo a través de las tareas necesarias para desempeñar un cargo específico. Incluye el contenido del cargo,
Microsoft SharePoint MARTIN LOTHAR SOLONDZ MEZA. ¿QUE ES MICROSOFT SHAREPOINT? SharePoint Online es un servicio basado en la nube que ayuda a las organizaciones.
Transcripción de la presentación:

Desde Big data a la Analítica de Datos Estevan Gómez, PhD (c ) UNLP

Agenda Una Explosión de Datos La situación actual y a futuro de BigData Porqué necesitamos soluciones de Big data? Estructura para procesamiento de Big Data Principios de una Estrategia de Datos Exitosa Transformación de la Información en Conocimiento Big Data y las Oportunidades para los DBAs Herramientas Casos de Estudio

Una Explosión de Datos Los datos son cada vez más baratos y ubicuos. Ahora estamos: Digitalizando contenido analógico creado en siglos pasados Recopilando una gran cantidad de nuevos tipos de datos: registros web, dispositivos móviles, sensores, instrumentos, transacciones,etc

Qué es y cómo se genera el Big Data? Big data, macrodatos o datos masivos es un concepto que hace referencia al almacenamiento de grandes cantidades de datos y a los procedimientos usados para encontrar patrones repetitivos dentro de esos datos https://es.wikipedia.org/wiki/Big_data

La Era de los datos

Porqué necesitamos soluciones de Big data El crecimiento anual de datos es exponencial, y continuará en el futuro. La habilidad de manejar apropiadamente y analizar estos grupos de datos es la clave para el crecimiento y expansión de los negocios

Evaluando la necesidad de Big Data

Necesidad de usar Big Data Se requiere la habilidad de manejar Velocidad de datos? La solución involucra datos de: SENSORES Monitoreo de Tráfico Transmisión Multimedia Dispositivos Móviles Análisis Web La tasa de ingreso de datos es alta Se puede esperar del flujo de datos: grandes volúmenes y alta velocidad? Gran cantidad de eventos/elementos El volumen medido esta en Tb’s y Pb’s La solución manejará grandes volúmenes de datos? Data Cleaning y otras actividades de mantenimiento es para gran cantidad de datos?

Necesidad de usar Big Data La Distribución de datos, el movimiento y la migración, involucra multiples Data Centers en diverentes áreas geográficas La solución puede manejar complejidad? Requiere datos como elemento principal, basado en la Nube o Hibrida Rendimiento Escalable Cómo se puede optimizar la solución? Efectiva en Costos Fácil de Operar La solución ideal será aquella que involucre todos los tres factores

Desafios de Big Data y como enfrentarlos

1 2 3 Recolección de datos Selección de datos Limpieza de Datos PROCESOS PREVIOS 1 Recolección de datos 2 Selección de datos 3 Limpieza de Datos (Duplicados, nulos, Ruido)

Aplicación de Algoritmos PROCESOS PREVIOS 4 Carga 5 Aplicación de Algoritmos 6 Resultados

Tratamiento a Grandes Volúmenes de Datos Big data Aparecen *Grandes volúmenes de datos cambiantes y complejos *los datos se vuelven inmanejables Administración *No puden ser adecuadamente: Almacenados Administrados y Procesados Por los sistemas tradicionales de bases de datos y sus herramientas de software Soluciones-Big Data Se refiere a las soluciones para: Manejar, procesar, y analizar grandes cantidades de datos Además –Sol- Big Data Incluyen el análisis de datos *Estructurados *Semiestructurados *Multiestructurados

Estructura para procesamiento de Big Data “Se Requiere un Software capaz de administrar con herramientas e infraestructura el desafío de los grandes volúmenes de datos” Apache Hadoop es un framework de software que soporta aplicaciones distribuidas bajo una licencia libre. Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspiró en los documentos Google para MapReduce y Google File System (GFS).

El Ecosistema de Hadoop

Componentes del Eco Sistema de Hadoop

Qué logramos

Procesamiento de Big Data- Batch

Procesamiento de Big Data- Real Time

Procesamiento de Big Data- Real Time

Escogiendo las herramientas

Escogiendo las herramientas

Usos de Big data

Usos de Big data

Otras Aplicaciones de Big Data

Otras Aplicaciones de Big Data- EJEMPLO El análisis de sentimiento se refiere a entender los sentimientos de las personas más apropiadamente; analizando las claves que dejan los clientes en redes sociales o sitios de compra Por ejemplo analizando la historia de búsqueda y de compras de los clientes Usando las tiendas en línea como Amazon.com, puede proveer valiosa información de acuerdo a que marcas ellos prefieren, que productos usan regularmente, y así por el estilo. Con ésta información, Amazon.com puede rastrear las opiniones de los clientes, con referencia a los productos o servicios, para obtener ideas útiles y así mejorar la experiencia del cliente, Y una mejor orientación de las recomendaciones de productos

Hay 4 preguntas que definen una estrategia de análisis de datos Cómo los datos generan valor en un negocio? Cuáles son los activos críticos de datos? Cuál es su ecosistema de datos? Cómo se gobierna los datos? EE

Cómo los datos generar valor en un negocio? La estrategia de datos debe ser impulsada por una comprensión de cómo la información puede habilitar o mejorar un proceso de negocio. Por ejemplo, aumento de las ventas en varios canales (un valor de negocio) requiere datos sobre sus clientes actuales y los productos que poseen (los datos); o Reducir el costo de conciliación manual de la información financiera (el valor comercial) Requiere estandarización y consolidación de datos redundantes e inconsistentes a través de aplicaciones de negocio (los datos).

Cuáles son los activos críticos de datos? No todos los datos en la empresa SON CRITICOS. De hecho, la mayoría son datos específicos de una aplicación, la función comercial o transacción. Los datos que son típicamente tiene dos características fundamentales:

Cuál es su ecosistema de datos? Utilizamos una arquitectura de negocios (no es una arquitectura de tecnología) para definir las capacidades de datos centrales que empresas y TI deben crear juntos Estas capacidades organiza plataformas tecnológicas y procesos de negocio basados en su función en el ecosistema: Creación y captura de datos, limpieza y organización, conocimiento del negocio, y el uso de esos puntos de vista inteligentes para impulsar acciones de la empresa.

Herramientas Disponibles R y R Studio Rapid Miner Orange Knime Oracle Dataminer

Analisis de Sentimiento con Rapid Miner