Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013.

Slides:



Advertisements
Presentaciones similares
Agenda ¿Qué es Big Data? ¿Por qué usar Big Data? ¿Quién usa Big Data? Hadoop Arquitectura de Hadoop.
Advertisements

Programa de Análisis Numérico
Diseño y análisis de algoritmos
Unidad 1 Conceptos básicos de computación
Google Confidential and Proprietary El impacto económico de Internet Laura Camacho Gerente General, Google Colombia Diciembre 2013.
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Programación 10-Marzo-11.
SISTEMAS DE ECUACIONES
VECTORES Vector fijo, AB, es un segmento orientado determinado por un punto origen A(a1, a2) y un punto extremo, B(b1, b2). Componentes de AB: (b1 –
MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS
Búsquedas avanzadas en la Wikipedia
Sistema de Agrupamiento y Búsqueda de Contenidos de la Blogosfera de la ESPOL, Utilizando Hadoop como Plataforma de Procesamiento Masivo y Escalable de.
Sistema Para GENERAR gráficas a partir de logs tcpdump usando Hadoop
MODELO DE REGRESIÓN MÚLTIPLE
Raúl Ramos Pollán Universidad Nacional de Colombia
SOA, Web 2.0 y Cloud Computing Tres aspectos innovadores en IT
Biología Computacional / Bioinformática
No only sql NOSQL (No only sql). Definicion NOSQL No Relacional Sin esquemas No hay tablas, joins, ACID.
Autor: Alberto Luengo Cabanillas
Métodos Matemáticos I.
Integración Diario Impreso y Web 9ª Jornadas Técnicas Oct-08.
Índice Introducción Big Data Arquitectura HDFS
BIG DATA Hernán Rodríguez M Gerente Proyectos & Desarrollo
Análisis y Diseño de Algoritmos
Principio de la presentación © Prof. Dr. François E. Cellier Modelado Matemático de Sistemas Físicos Febrero 5, 2008 El Algoritmo de Pantelides para Eliminar.
Método de Gauss-Seidel
Fundamentos de programación
2º Bachillerato de Ciencias y Tecnología BC2A – BC2B Curso
1 Asignatura: Autor: Análisis Numérico César Menéndez Titulación: Planificación: Materiales: Conocimientos previos: Aproximación Ingeniero Técnico Informático.
Symbol Proprietary and Confidential SPS 3000 Rolando A. Lopez Product Manager Netpoint International.
Fundamentos de bases de datos:
Presentado por:  Andrés Cantos Rivadeneira  Bolívar Elbert Pontón “MÓDULO DE RECOMENDACIONES DE PÁGINAS A VISITAR EN LA WIKIPEDIA, BASADO EN LAS APORTACIONES.
“A hybrid VNS/Tabu search Algorithm for apportioning the European Parliament” Villa, Lozano, Racero, Canca, LNCS 3906, Problema: Como distribuir.
LOS COMPONENTES ALEATORIOS DE LOS COEFICIENTES DE REGRESIÓN
Lab.3: Solución de sistema de ec. lineales con Montecarlo / Metropolis Algoritmos Paralelos Glen Rodríguez.
Regresión No- lineal y Múltiple
STATISTICS ON THE ROAD Lunes, 15 de Diciembre de 2014.
Parte II. Algorítmica. 4. Programación dinámica.
Confidential and proprietary to Elster Redes Inteligentes Septiembre 5, 2012 Nuevas Tecnologías.
Business Intelligence. SQL Server Team Lead PABLO DOVAL.
SIG. LAURA VELAZQUEZ MORELOS. Hace referencia a un refrán que implica resolver un problema difícil, dividiéndolo en partes más simples tantas veces como.
1.Principios de variable compleja 2.Análisis de Fourier 3.Ecuaciones diferenciales.
Parte I. Estructuras de Datos.
Redes de Area Local, LAN Una red de área local es una red de datos de alta velocidad que cubre un área geográfica relativamente pequeña. Típicamente conecta.
© Prof. Dr. François E. Cellier Principio de la presentación Modelado Matemático de Sistemas Físicos Febrero 5, 2008 Resolución Eficaz de Sistemas de Ecuaciones.
Departamento de Sistemas Informáticos y Programación Universidad Complutense de Madrid Bloque 2: Divide y Vencerás Unidad 1: Nociones básicas.
Introducción al análisis de expresiones
» IronPack Systems® es un innovador proyecto de software que llega como solución a las necesidades de la cadena de envío de paquetes, Redex®,y le ofrece.
¿Por qué usar Data Mining?  Proporciona un punto de encuentro entre los investigadores y las personas de negocios.  Ahorra grandes cantidades de dinero.
Bases de Datos.
TECNOLOGIAS ACCESIBLES
Entendiendo las partes
Ecuaciones con Radicales
ALUMNOS : MUÑANTE REVILLA, EDGAR MORI BAZAN, NORKA.
Sistemas de Ecuaciones Lineales Método de GAUSS.
Son sistemas de computación que emulan la habilidad de tomar decisiones de un especialista humano en un dominio restringido. Son programas que tienen.
Unidad TemáticaI. Conceptos Básicos Horas Prácticas10 Horas Teóricas8 Horas Totales18 Objetivo El alumno determinará las entradas, procesos y salidas.
UNIVERSIDAD TECNICA DE MANABI ESTUDIANTE KARINA TOALA CATEDRATICO ING.RENE GARCIA TEMA CASCADA.
Lab. 8: Métodos directos e iterativos para sistemas de Ec. lineares Algoritmos paralelos Glen Rodríguez.
Diagrama de Flujo de un proceso del SADUS. Concepto y modelo de ficha de indicadores I Indicador: Magnitud utilizada para medir o comparar los resultados.
Soluciones en Serie de Ecuaciones Lineales
ObjetivoObjetivo DEFENSA FINAL. UNIDAD III.1 : CONTENIDO CAPITULO I: ANTECEDENTES CAPITULO II: MARCO TEORICO CAPITULO III: MODELO DE REQUISITOS CAPITULO.
Optativa II Carlos Quilumbaqui. ¿Qué es Big Data? Big Data son grandes en cantidad, se capturan a un índice rápido, y son estructurados o no estructurados,
» IronPack Systems® es un innovador proyecto de software que llega como solución a las necesidades de la cadena de envío de paquetes, Redex®,y le ofrece.
PROGRAMA DE INGENIERÍA DE TELECOMUNICACIONES Tipo de Curso Observaciones PERIODO I Algoritmos O 3 M Competencias Comunicativas O 3 T Software.
Auxiliar 11 IN4402-1: Aplicaciones de Probabilidades y Estadística en Gestión Profesora: Paola Bordón T. Auxiliar: Andrés E. Fernández V, 28 de Julio,
Herramientas Análisis Masivo de Datos
Aldadsdasaszxczxczxddsalslasdlasdasdasddasd as.
FUNCIÓN CUADRÁTICA—FUNCIÓN LINEAL.
1 Confidential and proprietary. SOLE SUPPLY – ENGINEERING PROJECT SOLENIS PROPOSAL.
Transcripción de la presentación:

Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Índice presentación Introducción : Tecnología Big Data. ¿Dónde encaja R en todo esto? Principios: herramientas básicas y cómo trabajar en Big Data ¿Qué es Map-Reduce? Map-Reduce programando en R Map-Reduce usando paquetes de R Map-Reduce usando SQL desde R © 2013 Synergic Partners – Proprietary and Confidential

Introducción : Tecnología Big Data. ¿Dónde encaja R en todo esto? (I) ¿Qué es? Big Data != muchos datos Hadoop – Pig, jaql – Hive – HBase – … MongoDB Cassandra … © 2013 Synergic Partners – Proprietary and Confidential

Introducción : Tecnología Big Data. ¿Dónde encaja R en todo esto? (II) Usamos datos tabulados. (En caso contrario, habría otras soluciones que no explicamos aquí.) R es: – la solución analítica – la consola de control de (casi) todo el sistema © 2013 Synergic Partners – Proprietary and Confidential

Principios: herramientas básicas y cómo trabajar en Big Data (I) © 2013 Synergic Partners – Proprietary and Confidential

Principios: herramientas básicas y cómo trabajar en Big Data (II) © 2013 Synergic Partners – Proprietary and Confidential

Principios: herramientas básicas y cómo trabajar en Big Data (III) © 2013 Synergic Partners – Proprietary and Confidential

¿Qué es Map-Reduce? (I) © 2013 Synergic Partners – Proprietary and Confidential

¿Qué es Map-Reduce? (II) Tanto para clasificación como para regresión: Algunos algoritmos se pueden paralelizar de manera centralizada. Por ejemplo: Regresión lineal, regresión logística, k-means Algunos algoritmos se pueden paralelizar “as is” y combinar todos los modelos en un único modelo. Por ejemplo: Random Forests Todos los algoritmos se pueden paralelizar “as is” y utilizar una metaheurística (por ejemplo, un voto ponderado) para obtener una clasificación conjunta. © 2013 Synergic Partners – Proprietary and Confidential

¿Qué es Map-Reduce? (III) En R Podemos programar Map-Reduce Podemos usar un paquete que use Map- Reduce Podemos controlar desde R programas como Hive que usan Map-Reduce © 2013 Synergic Partners – Proprietary and Confidential

Map-Reduce programando en R (I)

© 2013 Synergic Partners – Proprietary and Confidential

Map-Reduce programando en R (II)

© 2013 Synergic Partners – Proprietary and Confidential

Map-Reduce programando en R (III)

Map-Reduce usando paquetes de R (I)

Map-Reduce usando paquetes de R (II)

Map-Reduce usando SQL desde R (I)

Map-Reduce usando SQL desde R (II)

Map-Reduce usando SQL desde R (III)

© 2013 Synergic Partners – Proprietary and Confidential

Map-Reduce usando SQL desde R (III) © 2013 Synergic Partners – Proprietary and Confidential

Map-Reduce usando SQL desde R (III) © 2013 Synergic Partners – Proprietary and Confidential

Map-Reduce usando SQL desde R (III) © 2013 Synergic Partners – Proprietary and Confidential