Big data analytics for Development

Slides:



Advertisements
Presentaciones similares
Spokesperson will be Jay Schaudies, Vice President, Global eCommerce.
Advertisements

Cable & Wireless Panamá. Entrar a Inicio, Programas y buscar Windows Live.
Software Expo 2005 INTRODUCCION A ITIL Mayo 2005 Title slide.
RFGW-10 (RF Gateway) Visión General
Unifying Concepts and Processes in Science. Explanatory Framework Across Science Disciplines Science is a way of knowing, a process--- it is a systematic.
Last Updated: 3/27/2008 DEV-2 Making OpenEdge Architect work for you
Parent Leadership in Education & Youth Education Tekies Centro Sor Juana in Las Milpas South Pharr, Texas.
Metodología de programación paralela
Copyright(c)2013 Juan B. Morales Ph.D. CCP 1 WMTA August 2013 Juan B. Morales de la Garza Ph.D. CCP RUIZ-MORALES & ASSOCIATES August 21 st 2013 Tel :( )
MEXICAN CUSTOMS UPDATE
POLICY MAKING ON MIGRATION THE COSTA RICAN EXPERIENCE Luis Alonso Serrano Echeverría Head of the Planning Department General Direction of Migration & Alien.
RENAISSANCE es un proyecto del programa CONCERTO co-financiado por la Comisión Europea dentro del Sexto Programa Marco 1 WP 1.5 Description of work (month.
Mexico Chances for Wind Power
WB XBRL VIDEO CONFERENCE Nelson Carvalho – XBRL I. I. Board Member XBRL: A TOOL FOR WHAT? BUSINESSES NEED FUNDING RISKS CONTAMINATE PRICES - MAKE FUNDING.
Como Configurar el Internet
Enchúlame la Máquina SQL Server 2005
Acelere el Ciclo de Vida de sus Aplicaciones
PLEASE READ (hidden slide) This template uses Microsofts corporate font, Segoe Segoe is not a standard font included with Windows, so if you have not.
Productividad personal Estar al día Colaboración Limitada.
© 2008 IBM Corporation IBM Information Management La siguiente generación de Datawarehouse : Más allá del Data Warehouse permitir information on demand.
Grupos de Trabajo 6 - Informe Working Group 6 – Report Transparency.
Grupos de Trabajo # 7 - Informe Working Group # 7 – Report General Business and Operational Risks.
BIENVENIDOS AL WORKSHOP DE ACSDA SOBRE LOS PRINCIPIOS DE INFRAESTRUCTURAS FINANCIERAS DE MERCADO WELCOME TO ACSDAS FINANCIAL MARKET INFRASTRUCTURES PRINCIPLES.
Minería de datos Dr. Francisco J. Mata
USING THE INTERNET. 2 Concept 6.1 What Is the Internet? The Internet is millions of computers from all parts of the world connected so that they can communicate.
In both English and Spanish, the verb to be (ser) and numbers are used to tell time. Copyright © 2008 Vista Higher Learning. All rights reserved.
Conceptos Básicos del lenguaje de programación COBOL
TechBA: Modelo de Aceleración en Silicon Valley Jorge Zavala CEO TechBA Silicon Valley TechBA: Mexicos Premier Source for Innovative.
About Services News Publications EventsContactHome SPOTLIGHT - NEWS Ipso greek ipso greek IMPORTANT LINKS PROJECTS DATABASE Ipso greek ipso greek Registre.
Description Digital school is an educational movement that use technology to learn and transform the educational practice to promote the students integral.
You will now learn how to form and use the past subjunctive (el pretérito imperfecto de subjuntivo), also called the imperfect subjunctive. Like the present.
Both Spanish and English use the present progressive, which consists of the present tense of the verb to be and the present participle (the -ing form in.
Remember present tense –AR verbs… Copyright © 2008 Vista Higher Learning. All rights reserved
SQL Server 2005 ADO.NET Javier Fernández Rodríguez Noviembre 2005, Sevilla Javier Fernández Rodríguez Noviembre 2005, Sevilla.
Implementing DDI in the National Institute of Statistics and Geography of Mexico Eric Rodriguez.
Programación con OpenMP* Intel Software College. Copyright © 2006, Intel Corporation. All rights reserved. Intel and the Intel logo are trademarks or.
PRESENTACIÓN REUNIÓN PREPARATORIA IX REUNIÓN DE MINISTROS DE JUSTICIA O DE MINISTROS O PROCURADORES GENERALES DE LAS AMÉRICAS, REMJA. PRESENTATION WORKING.
Departamento Administrativo de Ciencia, Tecnología e innovación Colciencias República de Colombia VII Ordinary Meeting of the COMCYT Working Group Technological.
Redes de Datos Fundamentos Básicos. Telecomunicaciones y Redes de Datos Las telecomunicaciones hoy La convergencia entre telecomunicaciones e informática.
copyright teddy gauthier
Programa de las Naciones Unidas para el Desarrollo Youth and political participation Attitudes towards voting and the protest.
Gestión de la Informacion– Siguiente paso? Ken Reid Head of International Technical Relations EUROCONTROL.
BUSINESS MODEL INNOVATIONS FACILITATED DISCUSSIONS Prepared for: Tecnológico de Monterrey October 17, 2012 © 2012 ATC, All Rights Reserved
ExpoForo 2008 "Políticas Públicas em la era digital" Camillo Speroni VP & GM Novell Latin America
10/07/2006Jorge A. F. Herrera, Mechatronics Lab. EESC-USP 1 Business Intelligence An Overview Jorge A. Félix Herrera.
CONSOLIDATING THE CONTINUOUS REPORTING SYSTEM ON INTERNATIONAL MIGRATION IN THE AMERICAS (SICREMI) Department of Economic and Social Development SEDI Committe.
© 2008 Cisco Systems, Inc. All rights reserved.Cisco ConfidentialPresentation_ID 1 IT Essentials PC Hardware and Software 4.1 Instructional Resource Chapter.
El 27 de noviembre de Tienes 5 minutos para escribir 5 líneas por lo menos en un papel sobre tus vacaciones del día de gracias.
Copyright © 2008, Solid Quality Mentors. All rights reserved. PerformancePoint Server Implementar una solución PPS-Monitoring Pablo Ahumada Koschitzky.
Antonio Gámir TSP – Windows Client Microsoft Ibérica.
Su Negocio Conectado. VisibilidadVisibilidad ColaboraciónColaboración PlanificaciónPlanificación EjecuciónEjecución Build Connections.
Clustered Hard Disk Drives Cold data.
para desarrolladores Minimizar el cambio Concentrarse en estabilidad, confiabilidad y rendimiento. Ayudar a mejorar la productividad Reducir la curva.
Technical Track Analytics. Analytics in PPS Alejandro Leguizamo SQL Server MVP, Mentor Solid Quality Mentors
Bienvenido a Technet Summit Forefront Client Security.
Avenida de Mayo 869 (C1084AAD) - Ciudad Autónoma de Buenos Aires - Argentina - Tel: / Experiences on harmonization and.
LA SOCIEDAD CONECTADA EL lugar de trabajo del futuro.
Transformaciones que conservan ángulos
Cancela, JM. Ayán C. University Of Vigo. Throughout history the definition of learning has been conceptualized in many different ways depending on the.
SISTEMA DE INFORMACIÓN RETO DE NEGOCIOS SOLUCIONES DE NEGOCIOS ADMINISTRACIÓN TECNOLOGÍA DE LA INFORMACIÓN ORGANIZACIÓN SOSTENER LA VENTAJA COMPETITIVA.
1 USMP PhD in Information Systems Engineering INFRASTRUCTURE MANAGEMENT - IM The Information and Communications Technology Infrastructure Management (ICT-IM)
1 USMP PhD in Information Systems Engineering INFRASTRUCTURE MANAGEMENT - IM The Information and Communications Technology Infrastructure Management (ICT-IM)
¿Qué haces si estás atrapado/a en un edificio en llamas? Usa 3 términos de vocabulario.
“La comprensión interdisciplinaria es la capacidad de integrar conocimientos y formas de pensar de dos o más disciplinas para crear una nueva perspectiva.
1 AA-DG/MKC | 03/2012 | © Robert Bosch GmbH All rights reserved, also regarding any disposal, exploitation, reproduction, editing, distribution,
Practica para “la foto” Año B Diversidad cultural Ciencia y Tecnologia 15 min. para preparar 3-4 min. describe en relación a una opción 5-6 min. Discusión.
Santiago de Chile January 2012 Roundtable 6: Lobby regulation János Bertók Head of Public Sector Integrity Division Organización para la cooperación.
Proceso KDD MSc. Carlos Alberto Cobos Lozada
Copyright © 2008 Vista Higher Learning. All rights reserved In Lección 1, you learned how to conjugate and use the verb ser (to be). You will now.
Integrated Management System
Transcripción de la presentación:

Big data analytics for Development Juan Carlos Puentes Country Manager SAS Colombia Copyright © 2011, SAS Institute Inc. All rights reserved.

VOLUME VARIETY VELOCITY VALUE THRIVING IN THE BIG DATA ERA DATA SIZE VALUE La conocida frase de los 80’s “quien tiene la información tiene el poder” ya ha sido revaluada a “quien analiza la información en tiempo real y toma provecho de ella para ejecutar de forma inmediata, tiene una ventaja competitiva”.   Es asi como hoy dia, podemos tomar ventaja de ese mar de datos, por ejemplo, en redes sociales. Hacer un análisis para entender mejor a nuestros clientes, hacer el análisis de millones de expresiones en twetts, blogs o en facebook, de datos en tiempo real via dispositivos moviles, y entender los sentimientos con que una persona se expresa de mi Compañía o Marca. TODAY THE FUTURE Copyright © 2011, SAS Institute Inc. All rights reserved.

Big Data: Datos de interes Menos del 0,5% de la data producida del mundo está siendo analizada. Según el estudio, 2.8 ZB de datos se generaron en 2012. Un Zetta Byte son 10 a la 21 bytes. El crecimiento esperado de los datos generados en el 2020 es 15 veces mayor al 2012 llegando a 42 ZB. Google: más de 2 millones de búsquedas por minuto. Facebook: más de 684.000 artículos y 34.000 “Me gusta” por minuto. Twitter: más de 236.000 tuits por minuto. Correos electrónicos: más de 100.000 emails por minuto. iTunes: casi 47.000 descargas de aplicaciones por minuto.. YouTube: más de 4.300 minutos de video cargados por minuto. Instagram: más de 3.600 fotos por minuto. Foursquare: más de 2.000 check-ins por minuto.

Analytics Big data Que es para sas? Data Platforms “Big Data se refiere a tecnologías y practicas emergentes que habilitan la colección, procesamiento, descubrimiento y almacenamiento de grandes volúmenes de datos estructurados y no estructurados de forma rápida y efectiva. .” Volumen Velocidad Variedad Value Undercut competition DB2, teradata, SAPSQO They can store tremendous amounts of data can get data very very quickly in support of BI but they are bound cannot do complex analytical processing in those relational database systems We have a ceiling in the capability of those Relational Databases. There is a lot of data in thos databases but to analyze it they have to take out of these DB’s and that takes much too long.

Analytics Big data Que es para sas? Data Platforms “. Big Data es un termino que describe grandes volumenes de datos de alta velocidad, complejos y variables que requieren tecnologias avanzadas y procesos para capturar,almacenar, distribuir, gestionar y analizar la informacion” Volumen Velocidad Variedad Value Undercut competition DB2, teradata, SAPSQO They can store tremendous amounts of data can get data very very quickly in support of BI but they are bound cannot do complex analytical processing in those relational database systems We have a ceiling in the capability of those Relational Databases. There is a lot of data in thos databases but to analyze it they have to take out of these DB’s and that takes much too long.

CONceptos de big data Big Data tiene el potencial de transformar el Estado y la Sociedad. Escondido en el inmenso volumen, variedad y velocidad de datos, esta la nueva informacion; hechos, correlaciones, indicadores entre otros, los cuales eran practicamente imposible descubrirlos en el pasado, o simplemente no existian.

Capability Segmentation TamaNo de los datos y terminologia Big Analytics Big Data Analytics BI Big DATA BI Reactive Alerts OLAP Ad Hoc Reports Standard Reports Proactive Optimization Predictive Modeling Forecasting Statistical Analysis Analytics proactive analytic capability reactive large big data data size

THE ANALYTICS LIFECYCLE IDENTIFY / FORMULATE PROBLEM BUSINESS MANAGER BUSINESS ANALYST EVALUATE / MONITOR RESULTS DATA PREPARATION Domain Expert Makes Decisions Evaluates Processes and ROI Data Exploration Data Visualization Report Creation DEPLOY MODEL DATA EXPLORATION IT SYSTEMS / MANAGEMENT DATA SCIENTIST VALIDATE MODEL TRANSFORM & SELECT Exploratory Analysis Topic Creation Predictive Modeling Model Validation Model Deployment & Monitoring Data Preparation BUILD MODEL So lets briefly consider the aspects of analytics, and what are the necessary factors you need in an integrated analytics platform. Well, this slide illustrates the learning, and feedback that is fundamental to doing analysis – and explains innovation can occur – because you continue to learn and grow from what you have already done. There are different constituents in this process – the business manager/or management who are focused on decisions, or streamlining processes – , Business analysts work to help formulate the business problem to an analytical problem, those that are creating models based on the informational inputs – and the technology teams who ensure that the analytical models are deployed in the appropriate to deliver business results in ‘right time’ – ie. when they are needed (which may or may not be ‘real time). While this may seem like a number of roles – in smaller companies they collapse to one or two people wearing different hats. What is consistent, regardless of the size of the organization is that all of these steps are necessary – and whether they are being applied to structured data, or unstructured text – these are still the phases of model development. Copyright © 2011, SAS Institute Inc. All rights reserved.

Industry analysts agree with this approach The Forrester Wave: Industry analysts agree with this approach BIG DATA PREDICTIVE ANALYTICS SOLUTIONS, Q1 2013

analytics SAS analytics view “Analitica son los procesos, tecnologias y mejores practicas que tornan los datos en informacion y conocimiento que impulse decisiones y acciones de negocio .” Wayne Eckerson Como punto inicial, se definió la plataforma SAS como la solución para soportar las iniciativas analíticas de Bancolombia

Arboles de decisión y clas. Otros modelos de minería Model generation process- SEMMA analytics Redes Neuronales Arboles de decisión y clas. Modelos de regresión Otros modelos de minería Datos de entrada Muestras Partición de datos Exploración estadística Variables importantes Transformación Creación de variables Reemplazo de Valores Calif. y comparación de modelos Sample Explore Modify Model Assess Explicar primero la metodología de Minería de datos Through more than 27 years of its experience in leading the top companies in the world towards customer intelligence, SAS has been following the SEMMA methodology in conducting its data mining initiatives. You start with: Sample: your data by extracting a data set large enough to contain the significant information, yet small enough to manipulate quickly Explore: your data by searching for unanticipated trends and anomalies in order to gain understanding and ideas Modify: your data by creating, selecting, and transforming the variables to focus the model selection process Model: your data by allowing the software to search automatically for a combination of data that reliably predicts a desired outcome Assess: your data by evaluating the usefulness and reliability of the findings from the data mining process On the technology side, we the SAS data mining tool also known as the Enterprise Miner. Copyright © 2006, SAS Institute Inc. All rights reserved.

7 pasos de la implementacion de biG data Recoleccion – Data en Diferentes Fuentes Procesamiento – Uso de Altas tecnologias de paralelismo para que la Data sea mas entendible.Hallazgos de Datos. Gerenciar – Limpieza, Transformacion, Auditoria, Seguridad. Medir – Integracion o Correlaciones entre datos, basados en metricas de Negocio Consumir – Uso final de los datos resultantes Almacenar – Soluciones de Storage Gobernar – Gobierno de datos desde la perspectiva de Negocio 7 pasos de la implementacion de biG data Pero es importante, que los temas de Big Data Analytics estén enfocados en generar rentabilidad y no solo a trabajar en temas básicos de reputación en redes sociales. El gran valor de las actividades de Big Data Analytics, se ve reflejado entre otros en el mejoramiento de los resultados de las organizaciones, que se da con la adecuada implementación de tecnologías de analítica en estrategias de Marketing, que permiten optimizárlas con el aprovechamiento de los multiples canales de comunicación, de ofertas y productos hacia y para los Clientes.

High performance computing Computers have become increasingly powerful. Required for Big Data Analytics A standard blade server (cost ~ $15k USD) Dr. Jim Goodnight CEO, SAS

High performance computing Blade servers connected for greater computing power “Chassis” has > 48 Billion instructions per second “Rack” has > 144 Billion instructions per second SAS Optimized to divide work across all processors Dr. Jim Goodnight CEO, SAS

big data visualization SAS’ High Performance Computing enables: Real-time visualization of Big Data Real-time Query and Analytics on Big Data Enables self-service and democratization of data Dr. Jim Goodnight CEO, SAS

Big data visualization (DEMO)