PARTE I: INTRODUCCIÓN José Hernández Orallo

Slides:



Advertisements
Presentaciones similares
Procesamiento y Análisis en Línea OLAP
Advertisements

SISTEMAS DE INFORMACION PARA EJECUTIVOS
Bases De Datos Para El Soporte En La Toma De Decisiones
DATA MART Sergio Daniel.
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
U I B 12/05/1999 Datawarehouse 1. U I B 12/05/1999 Datawarehouse 2 Conceptos Datawarehouse Datawarehouse: Repositorio completo de datos de la empresa,
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
Sistemas de Información en las Organizaciones
Herramientas para la Investigación
Topicos Avanzados de Ingeniería
DESARROLLO DE CUBOS OLAP
Materia Fundamento de Computación Nombre Juan David Riera Otero Docente Ana María Arellano.
Informe caso de estudio Implementación de un Datawarehouse
Jesús Angel Ovando División de Estudios de Posgrado Instituto Tecnológico de Orizaba.
Sistema de soporte a la toma de decisiones
VIVIANA ACHURY S. ANGIE NATALIA GARCIA S.. En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos (Bajo.
Objetivo: Conocer los componentes hardware y software que constituyen un computador.
On Line Analytical Processing
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
DATA WAREHOUSE Joseba Gil Noelia Suaña. ÍNDICE 1. Introducción. 2. ¿Qué es Data Warehouse? 3. Arquitectura. 4. Ventajas/Inconvenientes.
INTELIGENCIA DE NEGOCIOS
SEMANA Introducción.

Weka.
Bases de Datos II OLAP Online Analytical Processing
Inteligencia de Negocios (Sistemas de Información) Cristian Olivares Rodríguez Carlos Neira Carrasco.
DATA MART Los data warehouses están hechos para proporcionar una fuente de datos única para todas las actividades de apoyo para la toma de decisiones.
Viviana Poblete López Módulo: Modelo de Datos
Implementación de Datawarehouse
DATA WAREHOUSE Equipo 9.
EVOLUCION DE SISTEMAS DE SOPORTE DE DECISIÓN. La evolución  1960: creación de aplicaciones individuales- Fortran, COBOL – Tarjetas perforadas.  Cintas.
Página 1 20/03/2005 Materia: Tecnología de la Información Curso: Profesora Ariana Rosenthal Tecnología de la Información Profesora Ariana Rosenthal Administración.
“Diseño de un Data Mart para la Unidad de Programación y Abastecimiento de Hidrocarburos de Petrocomercial, Filial de Petroecuador”. Clientes deslumbrados.
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
Introducción a Pentaho BI Suite 3.5
GUTIÉRREZ GRANADOS HÉCTOR DANIEL
Inteligencia de Negocios (Presentación)
1 Prof:Paula Quitral INTRODUCCIÓN DATAWAREHOUSE Departamento de Informática Universidad de Rancagua.
“Introducción a las Ciencias de la Informática”
INTEGRANTES: CALVIMONTES NOGALES DANIELA QUIROGA HINOJOSA CLAUDIA.
Business Intelligence. ¿Por qué Business Intelligence?  a capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una.
Métrica v2.1 Técnicas: Modelado de datos (Parte 1)
BUSINESS INTELIGENCE. ¿PORQUE BUSINESS INTELLIGECE  La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una.
1 Prof:Paula Quitral INTRODUCCIÓN MINERIA DE DATOS Departamento de Informática Universidad de Rancagua.
Diseño de un data warehouse
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
DATA WAREHOUSE.
ORACLE OLAP CAECE Integrantes: *Aizaga, Martiniano *Gallegos, Marina *Kleinlein, Guillermo *Schiano di Cola, Emiliano.
Sistemas de Información
KDD y Técnicas de Minería de Datos en Weka
Johandra Gastier David De Freitas
Business Intelligence. ¿Por qué Business Intelligence? La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una.
 La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una de las claves para que una empresa llegue al éxito.
Karla Yunuen González Villanueva
Introducción al Data Warehouse
Sistemas de Información Administrativa Ttramestre MAY - AGO 2008 Catedrático: MC. Pedro Martínez Lucio MC. Pedro Martínez.
Herramientas para Toma de Decisiones
Sistemas de Información para Apoyo a las Decisiones Gerenciales
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
SISTEMAS DE INFORMACION ORGANIZACIONAL
DATA WAREHOUSE.
SOLUCIONES EMPRESARIALES
Business Intelligence 2013 (Conceptos Generales) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
María Trinidad Serna Encinas
Ing. Ernesto Sierraalta Fundamentos de Desarrollo de Proyectos de Inteligencia de Negocios ( Decision Support Systems & Data Warehousing.
BUSINESS INTELIGENCE. La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una de las claves para que una empresa.
La Empresa La Problemática Estado Actual, Bases de datos relacionales Problemas con las consultas No muestra datos históricos Poca integridad en.
Es el proceso mediante el cual quienes toman decisiones en una organización obtienen, procesan y analizan información pertinente, interna y externa,
PARTE I: INTRODUCCIÓN.
Transcripción de la presentación:

PARTE I: INTRODUCCIÓN José Hernández Orallo jorallo@dsic.upv.es Departamento de Sistemas Informáticos y Computación Universidad Politécnica de Valencia

Temario 1. Introducción 2. Almacenes de Datos 3. Minería de Datos 1.1. Finalidades y Evolución de los Sistemas de Información. 1.2. Herramientas para la Toma de Decisiones: diferencias e interrelación. 1.3. Almacenes de Datos, OLAP y Minería de Datos: definición e interrelación. 2. Almacenes de Datos 2.1. Introducción a los Almacenes de Datos. 2.2. Arquitectura de un Sistema de Almacén de Datos. 2.3. Explotación de un Almacén de Datos: Herramientas OLAP. 2.4. Sistemas ROLAP y MOLAP. 2.5. Carga y Mantenimiento de un Almacén de Datos. 2.6. Diseño de un Almacén de Datos. 2.7. Líneas de Investigación Abiertas. 3. Minería de Datos 3.1. Introducción a la Minería de Datos (DM) 3.2. El proceso de KDD 3.3. Técnicas de Minería de Datos 3.4. Web Mining 3.5. Líneas de Investigación Abiertas

Objetivos Parte I Distinguir los sistemas de información para la gestión y los sistemas de información para la toma de decisiones. Conocer la evolución de las herramientas para el análisis de sistemas de información para la toma de decisiones. Distinguir las propiedades y finalidades de las diferentes herramientas DSS (soporte a la toma de decisiones): EIS, OLAP, consultas & informes, minería de datos.

Finalidad de los Sistemas de Información La información reduce nuestra incertidumbre (sobre algún aspecto de la realidad) y, por tanto, nos permite tomar mejores decisiones

Finalidad de los Sistemas de Información Inicialmente la finalidad de los sistemas de información era recopilar información sobre un parcela del mundo para ayudar en la toma de decisiones: recuentos de cereales en Babilonia, de cacao por los pipiles, censos civiles y militares romanos o chinos, libros contables de árabes o sefardíes, ... Actualmente, con la informatización de las organizaciones y la aparición de aplicaciones software operacionales sobre el sistema de información, la finalidad principal de los sistemas de información es dar soporte a los procesos básicos de la organización (ventas, producción, personal...).

Interés Renovado por la Finalidad “Prístina” Una vez satisfecha la necesidad de tener un soporte informático para los procesos básicos de la organización (sistemas de información para la gestión). Las organizaciones exigen nuevas prestaciones de los sistemas de información (sistemas de información para la toma de decisiones).

Evolución 60’s: Informes batch: la información es difícil de encontrar y analizar, poco flexible, se necesita reprogramar cada petición. 70’s: Primeros DSS (Decision Support Systems) y EIS (Executive Information Systems): basados en terminal, no integrados con el resto de herramientas. 80’s: Acceso a datos y herramientas de análisis integradas (conocidas como intelligent business tools): Herramientas de consultas e informes, hojas de cálculo, interfaces gráficos e integrados, fáciles de usar. Acceden a las bases de datos operacionales (“killer queries”). 90’s: Almacenes de Datos y herramientas OLAP. 00’s: Herramientas de Minería de Datos y Simulación.

Herramientas para la Toma de Decisiones Han aparecido diferentes herramientas de negocio o DSS que coexisten: EIS, OLAP, consultas & informes, minería de datos, ... ¿Cuál es la diferencia entre EIS y OLAP? ¿Cuál es la diferencia entre “informes avanzados” y OLAP? ¿Cuál es la diferencia entre OLAP y Minería de Datos? ¿Qué interrelaciones existen entre todas estas herramientas?

Herramientas para la Toma de Decisiones ¿Cuál es la diferencia entre EIS y OLAP? Un EIS (Executive Information System) es un sistema de información y un conjunto de herramientas asociadas: Proporciona a los directivos acceso a la información de estado y sus actividades de gestión. Está especializado en analizar el estado diario de la organización (mediante indicadores clave) para informar rápidamente sobre cambios a los directivos. La información solicitada suele ser, en gran medida, numérica (ventas semanales, nivel de stocks, balances parciales, etc.) y representada de forma gráfica al estilo de las hojas de cálculo. Las herramientas OLAP (On-Line Analyitical Processing) son más genéricas: Funcionan sobre un sistema de información (transaccional o almacén de datos) Permiten realizar agregaciones y combinaciones de los datos de maneras mucho más complejas y ambiciosas, con objetivos de análisis más estratégicos.

Herramientas para la Toma de Decisiones ¿Cuál es la diferencia entre “informes avanzados” y OLAP? Los sistemas de informes o consultas avanzadas: están basados, generalmente, en sistemas relacionales u objeto-relacionales, utilizan los operadores clásicos: concatenación, proyección, selección, agrupamiento, … (en SQL y extensiones). el resultado se presenta de una manera tabular. Las herramientas OLAP Están basadas, generalmente, en sistemas o interfaces multidimensionales, Utilizando operadores específicos (además de los clásicos): drill, roll, pivot, slice & dice, … El resultado se presenta de una manera matricial o híbrida.

Herramientas para la Toma de Decisiones ¿Cuál es la diferencia entre OLAP y minería de datos? Las herramientas OLAP proporcionan facilidades para “manejar” y “transformar” los datos. producen otros “datos” (más agregados, combinados). ayudan a analizar los datos porque producen diferentes vistas de los mismos. Las herramientas de Minería de Datos: son muy variadas: permiten “extraer” patrones, modelos, descubrir relaciones, regularidades, tendencias, etc. producen “reglas” o “patrones” (“conocimiento”).

Herramientas para la Toma de Decisiones ¿Qué interrelaciones existen entre todas estas herramientas? Fuentes Internas Herramientas de consultas e informes Base de Datos Transaccional Almacén de Datos ETL Interfaz y Operadores Herramientas EIS Fuentes Externas Fuente de Datos Fuente de Datos 3 HTML Fuente de Datos 1 texto Herramientas OLAP Herramientas de Minería de Datos La aparición de algunas de ellas han hecho cambiar la manera de trabajar de otras herramientas.

Almacenes de Datos El almacén de datos es ahora el “sistema de información central” en todo estre proceso. Un almacén de datos es una colección de datos: orientada a un dominio integrada no volátil variante en el tiempo para ayudar en la toma de decisiones [Immon 1992, 1996]

Almacenes de Datos Actualmente, La tecnología OLAP generalmente se asocia a los almacenes de datos, aunque: Podemos tener Almacenes de Datos sin OLAP y viceversa. Los almacenes de datos y las técnicas OLAP son las maneras más efectivas y tecnológicamente más avanzadas para integrar, transformar y combinar los datos para facilitar al usuario o a otros sistemas el análisis de la información.

Minería de Datos La Minería de Datos es un conjunto de técnicas de análisis de datos que permiten: Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos. Extraer patrones y tendencias para predecir comportamientos futuros. Debido al gran volumen de datos este análisis ya no puede ser manual (ni incluso facilitado por herramientas de almacenes de datos y OLAP) sino que ha de ser (semi-)automático.

la minería de datos “analiza” los datos La Minería de Datos se diferencia claramente del resto de herramientas en el sentido de que: no transforma y facilita el acceso a la información para que el usuario la analice más fácilmente. la minería de datos “analiza” los datos

Minería de Datos La minería de datos es sólo una etapa del proceso de extracción de conocimiento a partir de datos. Este proceso consta de varias fases: Preparación de Datos (selección, limpieza, y transformación), Minería de Datos, Evaluación, Difusión y Uso de Modelos. incorpora muy diferentes técnicas árboles de decisión, regresión lineal, redes neuronales artificiales, técnicas bayesianas, máquinas de soporte vectorial, etc. de campos diversos: aprendizaje automático e I.A., estadística, bases de datos, … aborda una tipología variada de problemas: clasificación, categorización, estimación/regresión, agrupamiento, ...

Almacenes de Datos y Minería de Datos ¿Es necesario tener almacenes de datos para realizar minería de datos? Los almacenes de datos no son imprescindibles para hacer extracción de conocimiento a partir de datos. se puede hacer minería de datos sobre un simple fichero de datos. Las ventajas de organizar un almacén de datos para realizar minería de datos se amortizan sobradamente a medio y largo plazo cuando: tenemos grandes volúmenes de datos, o éstos aumentan con el tiempo, o provienen de fuentes heterogéneas o se van a combinar de maneras arbitrarias y no predefinidas.