SISTEMAS DE BASES DE DATOS MASIVOS (U. N.) / GESTIÓN Y EL PROCESAMIENTO DE GRANDES VOLÚMENES DE DATOS (U. de A.) Francisco Moreno & Freddy Duitama 2015-II.

Slides:



Advertisements
Presentaciones similares
DESARROLLO DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS PARA EL ANÁLISIS DE INFORMACIÓN ACADÉMICA Danilo Castro T. GISC-PG 2011.
Advertisements

Complejidad Algorítmica: Análisis de algoritmos
Francisco Moreno Universidad Nacional Sede Medellín
Sistema de Agrupamiento y Búsqueda de Contenidos de la Blogosfera de la ESPOL, Utilizando Hadoop como Plataforma de Procesamiento Masivo y Escalable de.
Informe caso de estudio Implementación de un Datawarehouse
Bienvenidos... ACI Bases de Datos Marzo 2006 Universidad de las Américas.
Francisco Moreno Universidad Nacional Sede Medellín
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Algoritmos y Programación Paralela Presentación 1 ALGORITMOS Y PROGRAMACIÓN PARALELA curso profesor Domingo Giménez Cánovas dis.um.es/~domingo/app.html.
Prueba Suficiencia Investigadora Doctorando: Rosa Filgueira Vicente Tutor: David Expósito Singh 27 Febrero 2007.
1 John Freddy Duitama U.de.A. Facultad de Ingeniería Optimización Algebraica. Profesor: John Freddy Duitama Muñoz. Facultad de Ingeniería. U.de.A. Profesor:
Presentación de la Herramienta Repositorio de Información del Observatorio Mtra. Graciela Eugenia Espinosa De la Rosa 09 de Julio.
Autómatas y Lenguajes Formales
sisOpe Presentación Curso 14/15
Business Intelligence y Data Mining
Aspectos Generales de IPD-414 IPD 414 – Seminario de Procesamiento Digital de Señales Segundo semestre Matías Zañartu, Ph.D. Departamento de Electrónica.
Estructura y presentación del trabajo final
Sistemas de Información Agosto-Diciembre 2007 Patricia Verdines Oficina: A2-134B
M0372. Gestión de Bases de Datos
CONTEXTA Introducción a FEDORA y modelos de extensión que provee Pablo Inostroza Valdera 11 de julio de 2007.
1 Fundamentos de Bases de Datos. U.de.A. Facultad de Ingeniería Características Generales de un Sistema de Bases de Datos. Profesor: John Freddy Duitama.
Chihuahua, 9-11 de octubre de 2003 José Hernández Orallo
Sistemas Concurrentes I.T. Informática de Sistemas Curso
Lenguajes de Programación M.C. Juan Carlos Olivares Rojas Agosto, 2009.
COMUNICACIONES INDUSTRIALES
5/8/2015Metamodelamiento1 METAMODELADO Carlos Mario Zapata J.
Curso de Lógica Difusa Prof. José Edinson Aedo Cobo, Msc. Dr. Ing.
Temas avanzados de Ingeniería Informática (II)”: Procesamiento Paralelo José María Carazo Centro Nacional de Biotecnología - C.S.I.C. Universidad Autónoma.
1 Procesamiento del Lenguaje Natural Curso Arantza Díaz de Ilarraza German Rigau IXA group Ingeniería.
1.Principios de variable compleja 2.Análisis de Fourier 3.Ecuaciones diferenciales ordinarias de segundo orden.
CONTENIDOS ANALISIS ESTADISTICO 2009/06/15. Títulos disponibles en estadística EBSCO vs. utilizados y recomendados.
Un Modelo Multidimensional (Cont.) Extractos de Jensen et al Francisco Moreno.
Teoría de Sistemas Operativos Departamento de Electrónica 2º Semestre, 2003 Gabriel Astudillo Muñoz
5/12/2015Calidad de Software1 CALIDAD DE SOFTWARE Carlos Mario Zapata J.
ALGORITMOS Y ESTRUCTURAS DE DATOS Ingeniería Técnica en Informática de Sistemas curso Teoría: Domingo Giménez, tutorías: L 9:30-10:30; M 10:00-12:30,
Prácticas – Año 2008…Estuvimos en estas empresas:.
Características Generales de un Sistema de Bases de Datos.
1 Prof:Paula Quitral INTRODUCCIÓN DATAWAREHOUSE Departamento de Informática Universidad de Rancagua.
Auditoría Informática1Copyright 2008 Tecnotrend SC Auditoría Informática.
Aulas virtuales.
COMUNICACIÓN I UNIVERSIDAD FRANCISCO DE PAULA SANTANDER DEPARTAMENTO DE PEDAGOGIA ESP. MARLING CAROLINA CORDERO DIAZ.
Presentación del cursoUniversidad de AntioquiaInformática I Sesión 01: Presentación del Curso Departamento de Ingeniería Electrónica y de Telecomunicaciones.
John Freddy Duitama M. Universidad de Antioquia. El Cálculo Relacional. John Freddy Duitama Muñoz. Facultad de Ingeniería. U.de.A. John Freddy Duitama.
Curso Nuevas Tecnologías y Educación Introducción al Curso Profesores: Carol Césped Hugo Martínez Asunción, agosto 2004.
Julio 2015 DOMINGO LUNES MARTES MIÉRCOLES JUEVES VIERNES SÁBADO 1 2 3
Herramientas de Colaboración Digital
7/24/2015Lingüística Computacional1 LINGÜÍSTICA COMPUTACIONAL Carlos Mario Zapata J.
Kernel Para PDA Con Soporte a Procesos De Tiempo Real Francisco Javier Zuluaga Ramírez Asesor: Dr. Pedro Mejía Álvarez.
Math and Science Partnership for the 21 st Century Elementary and Secondary School Teacher MSP-21 - Phase IV – Año 2.
Extractos de “Representing Spatiality in a Conceptual Multidimensional Model” y de “Advanced Data Warehouse Design” E. Malinowski & E. Zimanyi por Francisco.
INTRODUCCIÓN A LOS SERVICIOS BIBLIOTECARIOS Facultad de Farmacia UCM Curso
2-oct-15Ingeniería de Requisitos1 INGENIERÍA DE REQUISITOS Carlos Mario Zapata J.
INTRODUCCIÓN A LOS SERVICIOS BIBLIOTECARIOS Facultad de Farmacia UCM Curso
TABLÓN DE ANUNCIOS Normas del Curso Tutorías Notas Exámenes sisOpePresentaciónCurso 15/16 Departamento: Sistemas Informáticos (Bloque.
Presentación: Contabilidad Financiera y de Costes Profesor responsable: Jose Ignacio González Gómez.
Daniel Sánchez Santolaya Tutores: Mario Huerta(IBB) Jordi Gonzàlez(CVC)
DESARROLLO DEL CURSO Asignatura de 2 partes:. Teórica: programa
TESIS II Comité de Asesores Agosto 8 de Agenda Administración de los trabajos de tesis. Manejo del Word para insertar óptimamente figuras. Presentaciones.
Plataforma Educativa Diciembre de 2010.
Características Generales de un Sistema de Bases de Datos. Profesor: John Freddy Duitama Muñoz. Facultad de Ingeniería. U.de.A. Profesor: John Freddy Duitama.
La Empresa La Problemática Estado Actual, Bases de datos relacionales Problemas con las consultas No muestra datos históricos Poca integridad en.
Presentación del cursoInformática I (2015-2) Departamento de Ingeniería Electrónica y de Telecomunicaciones Facultad de Ingeniería Informática I.
Técnico Certificado en Agricultura de Conservación
CURSO VIRTUAL FUNCIONES ESENCIALES DE SALUD PÚBLICA Reunión Revisión Curso Funciones Esenciales de Salud Pública 13 de febrero OPS- Buenos Aires,
Bases de datos II Universidad del Cauca Ing. Wilson Ortega.
COSTOS Y PRESUPUESTOS INGENIERÍA INDUSTRIAL INSTITUCIÓN UNIVERSITARIA PASCUAL BRAVO DOCENTE: CARLOS ALBERTO LOPERA QUIROZ
Examen de Grado. El problema: En el Centro el Centro Regional Universitario de San Miguelito, Facultad de Informática Electrónica y Comunicación se dictan.
La tecnología como herramienta didáctica Juan Hernández Aquino Noviembre 2014 Maestría en Innovación Educativa Grupo “B” 2013.
1 INTERNET: Abreviatura de palabras para designar su actividad: INTERconnected NETworks redes interconectadas.
Tópicos Avanzados en Bases de Datos
Transcripción de la presentación:

SISTEMAS DE BASES DE DATOS MASIVOS (U. N.) / GESTIÓN Y EL PROCESAMIENTO DE GRANDES VOLÚMENES DE DATOS (U. de A.) Francisco Moreno & Freddy Duitama 2015-II

Propósito del curso Presentar los fundamentos computacionales para la gestión, análisis y modelamiento de grandes volúmenes de datos estructurados, semi-estructurados o no estructurados.

Justificación La web y la gestión de datos de diversa naturaleza generan retos al análisis de grandes volúmenes de datos en áreas poco exploradas: aplicaciones médicas, los gustos de los usuarios, la seguridad informática, la minería de datos, entre otras. Estas posibilidades plantean problemas en la computación tanto en la gestión como en el procesamiento y análisis de este tipo de datos.

Objetivo general Presentar los fundamentos y las técnicas esenciales para la gestión computacional de grandes volúmenes de datos.

Objetivos específicos Conocer los fundamentos para el modelamiento y manejo de bodegas de datos. Conocer nuevos paradigmas computacionales para el manejo de grandes volúmenes de datos distribuidos.

Contenido resumido Bodegas de datos DFS (Distributed File Systems) MapReduce - SPARK Técnicas básicas para el análisis de información

Unidad 1 Tema a desarrollar: Bodegas de datos Subtemas: Introducción Operaciones OLAP Modelos multidimensionales Elementos espaciales y temporales en una bodega de datos

BIBLIOGRAFÍA BÁSICA PARA ESTA UNIDAD Malinowski, E., & Zimányi, E. (2008). Advanced Data Warehouse Design: From Conventional to Spatial and Temporal Applications. Springer. Jensen, C. S., Kligys, A., Pedersen, T. B., & Timko, I. Multidimensional data modeling for location-based services. The VLDB Journal, Vol. 13(1), Imhoff C., Galemmo N. (2003). Mastering Data Warehouse Design: Relational and Dimensional Techniques. Wiley.

Unidad 2 Tema a desarrollar: Sistemas de archivos distribuidos, MapReduce y SPARK Subtemas: DFS (Distributed File Systems) MapReduce - SPARK El álgebra relacional y MapReduce Modelo de costos para MapReduce

BIBLIOGRAFÍA BÁSICA PARA ESTA UNIDAD Leskovec, J., Rajaraman, A., Ullman, J. (2012). Mining of Massive datasets. Cambridge: Cambridge University Press. Ghemawat, S., Gobioff H., Tack-Leung S. (December, 2003). The Google File System. ACM SIGOPS Operating Systems Review - SOSP '03. sigops. 37(5), Afrati, Foto N. and Ullman, Jeffrey D. (March, 2010) Optimizing Joins in a MapReduce Environment. EDBT. Stanford InfoLab. SPARK.

Unidad 3 Tema a desarrollar: Minería de datos Subtemas: Introducción a minería de datos. Reglas de asociación Link analysis Clustering o análisis de sentimientos.

BIBLIOGRAFÍA BÁSICA PARA ESTA UNIDAD Leskovec, J., Rajaraman, A., Ullman, J. (2012). Mining of Massive datasets. Cambridge: Cambridge University Press. Manning, C. D., Raghavan, P., Schutze, H. (2009). An Introduction to Information Retrieval.Cambrigde: Cambridge University Press.

Unidad 4 Tema a desarrollar: Búsqueda por similitud Subtemas: Finding similar items Locality sensitive hashing (LSH) Recommendation systems

BIBLIOGRAFÍA BÁSICA PARA ESTA UNIDAD Leskovec, J., Rajaraman, A., Ullman, J. (2012). Mining of Massive datasets. Cambridge: Cambridge University Press. Manning, C. D., & Raghavan, P., Schutze, H. (2009). An Introduction to Information Retrieval.Cambrigde: Cambridge University Press.

Programación clases Bodegas de datosFrancisco Moreno3 agosto Bodegas de datosFrancisco Moreno10 agosto Festivo 17 agosto Bodegas de datosFrancisco Moreno24 agosto TemaResponsableFecha

Introduccion a big data - DFS Freddy Duitama31 agosto MapReduceFreddy Duitama7 septiembre MapReduce - SPARK Freddy Duitama14 septiembre Exposición trabajo bodega de datos 30% Francisco Moreno21 septiembre Programación clases TemaResponsableFecha

Programación clases Introducción minería de datos - reglas de asociación Francisco Moreno28 septiembre Cont. reglas de asociación - link analysis Francisco Moreno5 octubre Festivo 12 Octubre Clustering o análisis de sentimientos Francisco Moreno19 octubre Exposición Trabajo MapReduce 40% Freddy Duitama26 octubre TemaResponsableFecha

Programación clases Finding similar items Freddy Duitama9 noviembre Festivo 16 Noviembre Locality sensitive hashing Freddy Duitama23 noviembre Recommendation systems Freddy Duitama30 noviembre Exposición trabajo sobre minería de datos - búsqueda por similitud 30% Francisco Moreno Freddy Duitama 7 diciembre TemaResponsableFecha

Evaluación ActividadValor Trabajo sobre bodega de datos 30% Trabajo sobre MapReduce y SPARK 40% Trabajo sobre minería de datos / Trabajo sobre búsqueda por similitud. 30%

Información de Contacto Francisco Moreno (reviso correos de L-V, una vez al día) Teléfono: Oficina: Bloque M8A (anexo al M8), Of. 312 Celular: No tengo Horario de atención: W 4 – 6 pm.

Información de Contacto Freddy Duitama Oficina: Bloque 21 – 316 (Universidad de Antioquia) Horario de atención. Cita previa por .

Otros datos Página del curso UN: Página del curso U de A. Por confirmar Aulas: M8-117 UN – Facultad de Minas Por definir U de A.