Historia, Evolución y Casos de Uso de Big Data Autor: Sergio Muzzupappa Profesora: Ana Darcacha.

Slides:



Advertisements
Presentaciones similares
Agenda ¿Qué es Big Data? ¿Por qué usar Big Data? ¿Quién usa Big Data? Hadoop Arquitectura de Hadoop.
Advertisements

Para desarrollar esta parte debemos de: 1
Evaluaciones de Sistemas de Administración de la Seguridad SMSA
Arquitectura Orientada a Servicios (SOA)
Modelo de Tecnología para Crédito Educativo en Chile Sistema Crédito Estudios Superiores INGRESA - Chile.
el comercio electrónico forma parte del negocio en línea, y no comprende todo el e-business. Es por esto que no podemos decir que el e-business es igual.
Ventaja estratégica y Tecnologías de Información
MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS
Sistema de Agrupamiento y Búsqueda de Contenidos de la Blogosfera de la ESPOL, Utilizando Hadoop como Plataforma de Procesamiento Masivo y Escalable de.
Base de Datos Distribuidas
1.1.2 Sistemas de información para la gestión y para la ayuda en la toma de decisiones. Los SI contribuyen activamente a la consecución de los objetivos.
Aplicaciones del Big Data a la Inteligencia del Negocio
DATA WAREHOUSE Equipo 9.
Programacion Web Practica 1 Estudio de la aplicación distribuida: Apache Hadoop.
Miguel angel amaya G41 Convergencia tecnologica
Integrantes: Jorge Herrera M. Carlos Rodríguez R..
Gerencia Inform á tica Alumno: ANGELES BOCANEGRA, Oscar C ó digo: Profesor: VEGA HUERTA, Hugo Tema: Soluci ó n de un problema en una Empresa Peruana.
Contabilidad General de Exactus:
CRECER SIN MORIR EN EL INTENTO Presenta: Mariano Moral Vicepresidente Empresas y Gobierno El uso de las TICs en el desarrollo de las PYMES.
Es la capacidad de recolectar datos del entorno, transformar esos datos en información y, a su vez, transformar esa información en conocimiento.
QUE ES EL ESTUDIO DEL MERCADO. El estudio de mercado es un proceso sistemático de recolección y análisis de datos e información acerca de los clientes,
La Importancia de la Seguridad Cibernética Corporativa.
SOLUCIONES EMPRESARIALES
LOGO Profa. Oly Mata. Concepto de Datos: Un dato puede considerarse como un elemento no tratado; como una señal emitida. 25% es un dato Son los elementos.
Optativa II Carlos Quilumbaqui. ¿Qué es Big Data? Big Data son grandes en cantidad, se capturan a un índice rápido, y son estructurados o no estructurados,
La creciente importancia de la Gerencia de Capital Humano
Programa Sobre Procesos de Negocios SCM y Logística. Integración de procesos que permite a empresas en crecimiento implementar las mejores prácticas en.
Metro como emisor y operador de medios de pago no bancarios Tarjeta bip! Multiuso, alternativa de solución para la inclusión financiera Rodrigo Azócar,
Contabilidad y Presupuesto Clase 2 Profesor Mario Flores Loredo UTA.
Centre for Tax Policy and Administration Organisation for Economic Co-operation and Development Auditoría de Empresas Multinacionales 7. Corporación “Cutting.
VALIDACIÓN Ejemplos en modelos de DS Información adaptada del libro de Sterman, y del curso de dinámica de sistemas de la Universidad Nacional de.
MODELO DE EXCELENCIA EN LA GESTION - MEG OBJETIVOS  Comprender y gestionar de forma sistémica  Contribuir a mejorar el desempeño y resultados.
Copyright © 2015 Acuntia UN “SELFIE” A LAS REDES DE CAMPUS Vicente Belda Resp. Ingeniería Preventa Zona Sur.
DE LOCAL A GLOBAL: SISTEMA DE INFORMACIÓN DE COLECCIONES CIENTÍFICAS DEL MUSEO NACIONAL DE CIENCIAS NATURALES - SICoC - DE LOCAL A GLOBAL: SISTEMA DE INFORMACIÓN.
“e-Commerce como herramienta de desarrollo del Mercado de artesanías en el estado de Jalisco” Que presenta: Ada Luz Soto Como requisito final para obtener.
Comunicación en los Negocios Electrónicos. ¿Qué es una Intranet? Red de área local (LAN), que utiliza tecnología basada en Web, con protocolos abiertos.
BPM para Consultoras de Informática Carlos Alvarez, estudiante de Informática en la Universidad de Palermo, Argentina.
Cuestionario CP-IDEA: conclusiones y perspectivas de aplicación 2013 Equipo de Coordinación GTplan.
Fuentes: Introducción a la Inv. De Mdos., Marcela Benassini Introducción a la Inv. De Mdos., Laura Fischer.
Andrea Álvarez Lizzet Pérez Almeyda Rafael Lourdes Hernández Lili M. Quiñones Sosa Abraham Rasgado.
Presentación Recopilación de buenas prácticas de transparencia en la gestión pública y privada 1 Equipo de transparencia: Dayra Valle Tamara.
Cristina Jiménez Bonilla. El programa informático que he utilizado es SAP.  Prestaciones: está creado para abarcar todos los sectores de la empresa.
E-business y comercio electrónico Por Jesse Ruiz.
INTERNET Y EL MARKETING
Kaizen.
BIG DATA - INTRODUCCIÓN jorge ubero. bilbao, junio de 2013.
SEGURIDAD PUBLICA INTEGRANTE: - DEL OLMO GUERRERO CRIZ DANIELA.
Lo retos del futuro: el trabajo en el siglo XXI. Contenido Una economía global 1 Ética y Responsabilidad Social 2 Diversidad de la fuerza laboral 3 Valores.
CENTRO UNIVERSITARIO UAEM TEXCOCO INGENIERÍA EN COMPUTACIÓN DISEÑO DE SISTEMAS M. En C.C. Ma. Dolores Arévalo Zenteno.
Auditoría de la Adquisición del Software Cr. Luis Elissondo Facultad de Ciencias Económicas Universidad Nacional del Centro de la Provincia de Bs. As.
Software Público Chile El pasado, presente y futuro Oscar Díaz Maturana Coordinador Software Público Unidad de Modernización y Gobierno.
Vive Digital, es el plan de tecnología para los próximos cuatro años en Colombia, que busca que el país dé un gran salto tecnológico mediante la masificación.
Control, Controles y Administración
LA RUEDA DE LA COMPETITIVIDAD
Tema: 01 / 02 Importancia de las Finanzas Experiencia curricular Finanzas II Carlos León.
Desarrollo organizacional
SALUD PUBLICA: FACTORES DETERMINANTES
BANCO INTERAMERICANO DE DESARROLLO TALLER SOBRE EVALUACIÓN DEL PRECIO Y LA CALIDAD EN LAS ADQUISICIONES (BEST VALUE FOR MONEY)
Slide 1 Regulación y medición de remesas PANEL 1A 6 de mayo de 2010.
REDES SOCIALES Y NEGOCIOS 2.0 Cómo aprovecharlas para una estrategia de Mktg Online Fecha: 1 SET 2010.
UNIVERSIDAD DE COLIMA FACULTAD DE TELEMATICA REDES DE DATOS Edsel Barbosa Gonzalez GRUPO 1DFECHA: 13/13/12.
Sistema Regional de Monitoreo y Evaluación SIREME Junio, 2007.
 RETOUR SUITE  EasyBusiness La solución clave para su empresa Presentación Corporativa Kompass.
ANÁLISIS DE LAS ESTRATEGIAS TECNOLÓGICAS QUE PERMITAN EL MEJORAMIENTO DEL SISTEMA DE GESTIÓN RELACIONADAS CON LOS CLIENTE (CRM). CASO: TECHTROL SISTEMAS.
3. Organización de proyectos. Estructura y cultura.
C OMERCIO ELECTRÓNICO Consiste en la compra y venta de productos o de servicios a través de medios electrónicos, tales como Internet y otras redes informáticas.
ACCESO REAL = IMPACTO REAL MARCO DE TIC PARA EL DESARROLLO Desarrollado por: bridges.org Para el Currículum de Capacitación en Políticas de TIC Derechos.
Una red es una serie de ordenadores y otros dispositivos conectados por cables entre sí. Esta conexión les permite comunicarse entre ellos y compartir.
 En este trabajo estaré hablando sobre la importancia de los sistemas de información en las redes de negocios y sus procesos.
Transcripción de la presentación:

Historia, Evolución y Casos de Uso de Big Data Autor: Sergio Muzzupappa Profesora: Ana Darcacha

Situación Actual de los Datos a Nivel Mundial Expansión mundial de computadoras baratas potentes al alcance del ciudadano corriente. Cada persona e institución utiliza varios artefactos que generan grandes cantidades de datos diarios. Los datos siguen la tendencia de ser guardados en la Nube. Gran parte de la Nube pública tiende a permitir ser usada como fuente de datos. Mayor competitividad exige satisfacer mejor a los clientes. Las empresas necesitan tomar mejores decisiones guiadas por la informática, en menores tiempos, usando grandes volúmenes de datos y tomarlos de variedad de fuentes. Los datos no sólo son estructurados (Ej. SGBD) sino también no estructurados (Web 2.0, clickstream, sensores, GPS, Redes Sociales, etc.

Solución Planteada por Google Sistemas que: –Permitan procesar el 100% de los datos. –Escalen fácilmente al orden de los 1000PB. –Puedan ser usados en hardware barato. –Sean redundantes y tolerantes a fallas. –Manejen grandes volúmenes de datos a altas velocidades. –Manejen datos estructurados y no estructurados. –Simples de programar.

Solución Planteada por Google Google necesita procesar cantidades masivas de datos de flujo de clicks (clickstream). Entre los años 2003 y 2004 lanza dos papers clave: –Google File System o GFS para delinear la capa de persistencia de su nuevo sistema. –MapReduce para explicar el funcionamiento de su nuevo modelo de programación para procesar los datos.

Solución de Código Abierto Por estas épocas un empleado de Yahoo, Doug Cutting, impulsor del Open Source trabajaba en un buscador Web alternativo. Ni bien fueron publicados esos papers comienza a trabajar en lo que en el 2005 es su versión de código abierto de Mapreduce y un nuevo sistema de archivos distribuido llamado HDFS. En el 2006 el sistema se nombre “Hadoop” gracias a un elefante de juguete al que su hijo había nombrado con este neologismo. Se crea bajo licencia libre incorporado por la Fundación Apache, y permite trabajar con miles de nodos y petabytes de datos.

¿Qué es Hadoop? Es un framework de procesamiento de Big Data. Procesa en forma paralela y altamente escalable. Divide el trabajo en fragmentos pequeños (Map) que se procesan en multitud de nodos y luego los consolida (Reduce). El framework permite que se utilicen varios lenguajes pero se usa mayormente Java. HDFS posee redundancia a nivel de bloque, cada bloque de 64Mb se replica en 3 nodos a la vez. El sistema de archivos es uno solo, aunque distribuido en cientos y hasta miles de nodos.

Mapreduce

Ecosistema

Algunas Fuentes de Datos

Casos de Uso Sentimiento social –Minería de datos. –Redes Sociales, chat, , reviews, etc. –Investigación sobre un producto o persona. –Clasificación de elementos a investigar. –Análisis de afectividad de frases. –Procesamiento de Lenguaje Natural

Casos de Uso Comportamiento Web –Análisis de tráfico Web y keywords buscadas. –Análisis de cookies. –Registros del diversos. –Comprender al consumidor para mejorar su experiencia online. –Detectar comportamiento malicioso.

Casos de Uso Análisis Forense de Registros de Servidor –Eventos de servicios de Servidor. –Servidores Web son candidatos. –Medición de performance. –Verificaciones de seguridad y compliance. –Búsqueda de errores.

Casos de Uso Datos de Máquinas y Sensores –Conversión analógica- digital. –Clima, velocidades, mediciones físicas, luz, cercanía de la pantalla, acelerómetros, GPS. –Salud de las personas. –Casas y ciudades inteligentes.

Casos de Uso Datos de Geolocalización –Análisis de variables respecto a un objeto en un lugar y tiempo. –Velocidad, región, GPS. –Análisis de transgresiones. –Comprender eventos de transportes.

Casos de Uso Inteligencia en Análisis de Crimen –Fuerzas de Seguridad y Gobiernos. –Disminuir la criminalidad. –Encontrar zonas calientes. –Pelear contra el terrorismo. –Costos políticos por invasión a la privacidad. –Se resigna privacidad por seguridad.

Casos de Uso Investigación de Fraudes (Caso EY) –EY es una empresa de auditoría, impuestos, finanzas y contabilidad. –FIDS es el área de investigación y descubrimiento forense. –Minería de datos de distintos países e idiomas. –Se busca información sobre sobornos, pagos, transferencias inusuales, sobrepaso de aprobaciones y protocolos. –Se analizan datos extraídos de compañías. –Se capturan discos de servidores y laptops y se analizan mails, chats, documentos, etc. –Se utilizan programas especiales de descubrimiento forense. –Interviene gente de IT de EY, y abogados, jueces o involucrados quienes encuentran información relevante a fraudes mediante estos programas.

Ejemplos de uso de Big Data en EY Marco 1: Investigación global financiera de una institución de un potencial y repentino colapso financiero. Tiempo: 60 días. Implicados: 500 personas. Acciones: Asegurar y mapear más de mil transacciones únicas de diferentes sistemas de ventas y contabilidad. Datos: 3 Terabytes cargados para revisión. Múltiples partes en litigio y distintas investigaciones sobre regulaciones simultáneas. Dificultad: Desplegar un acercamiento teniendo en cuenta los costos para recolectar y analizar s, datos de ventas de multiples transacciones y obtener pistas y rastrar los fondos perdidos de cuentas de clientes y reportarlas a reguladores en los tiempos requeridos. Marco 2: Una empresa multinacional listada entre las Fortune 100 conduce una revisión global anti corrupción. Tiempo: 120 días. Datos: 310 discos rígidos recolectados en forma forense. 20 Países. 2 Terabytes de datos cargados. Más de 25 millones de documentos, 1,3 millones de ellos revisados. Más de 2000 millones de transacciones financieras revisadas. 20 diferentes sistemas financieros representando 37 unidades de negocios separadas. Dificultad: Integrar las comunicaciones por mail individuales y patrones para cruzar con transacciones financieras para identificar potenciales pagos impropios, además de proveedores y empleados de alto riesgo.

Conclusiones Crecimiento mundial exponencial de datos a nivel de Zb gracias a la explosión de la vida online de personas y expansión de tecnologías baratas, en los últimos años se ha generado el 90% de los datos mundiales. Capacidades de procesamiento deben crecer acorde a las necesidades de las organizaciones. El análisis de información en grandes volúmenes, de diversas fuentes, a gran velocidad y con flexibilidad es un factor diferencial que brinda valor al negocio y ventaja competitiva con respecto a otras empresas del mercado. Se tiende a eliminar silos de datos y cada vez a la mayor integración de la información para aumentar el insight y mejorar la experiencia del cliente. Se abren nuevos mercados laborales como administradores, programadores, y científicos de Big Data. La oportunidad para la próxima generación está en adquirir talento analítico que sea capaz de analizar los resultados y aplicarlos al negocio.

¿ PREGUNTAS ?