La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

UNIVERSIDAD LATINA BASES DE DATOS NUEVAS TECNOLOGÍAS.

Presentaciones similares


Presentación del tema: "UNIVERSIDAD LATINA BASES DE DATOS NUEVAS TECNOLOGÍAS."— Transcripción de la presentación:

1 UNIVERSIDAD LATINA BASES DE DATOS NUEVAS TECNOLOGÍAS

2 2 Qué es Business Intelligence (BI) (Inteligencia Empresarial). Business Intelligence es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.

3 3 Qué es Business Intelligence (BI) (Inteligencia Empresarial). Business Intelligence es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.

4 4 Definición de minería de datos Es la exploración y análisis de grandes cantidades de datos con el objeto de encontrar patrones y reglas significativas que generen conocimiento.

5 5 Metas de la minería de datos Permitir a una organización MEJORAR sus decisiones a través de un mejor CONOCIMIENTO de su información de negocios Mejorar la ventaja competitiva

6 6 La minería de datos es un campo multidisciplinario Minería de datos Inteligencia Artificial (“Machine Learning”) Estadística Bases de Datos (VLDB) Graficación y visualización Ciencias de la información Otras disciplinas

7 7 La minería de datos es un subconjunto de la inteligencia de negocios

8 Minería de datos nos permite Proceso de utilizar datos “crudos” para inferir importantes relaciones entre ellos Colección de técnicas poderosas para analizar grandes volúmenes de datos No existe un solo enfoque para minería de datos sino un conjunto de técnicas que se pueden utilizar de manera independiente o en combinación Existe una relación con la estadística, aunque frecuentemente se separan las técnicas que no están basadas en métodos estadísticos

9 9 Tipos de aplicaciones de la minería de datos Aplicaciones o problemas de minería de datos pueden clasificarse en las siguientes categorías –Clasificación –Estimación –Pronóstico –Asociación –Agrupación o segmentación

10 10 Clasificación Examinar las características de un nuevo objeto y asignarle una clase o categoría de acuerdo a un conjunto de tales objetos previamente definido Ejemplos: –Clasificar aplicaciones a crédito como bajo, medio y alto riesgo –Detectar reclamos fraudulentos de seguros

11 11 Estimación Relacionado con clasificación –Mientras clasificación asigna un valor discreto, estimación produce un valor continuo Ejemplos: –Estimar el precio de una vivienda –Estimar el ingreso total de una familia

12 Pronóstico Predecir un valor futuro con base a valores pasados Ejemplos: –Predecir cuánto efectivo requerirá un cajero automático en un fin de semana

13 13 Asociación Determinar cosas u objetos que van juntos Ejemplo: –Determinar que productos se adquieren conjuntamente en un supermercado

14 Agrupación o segmentación Dividir una población en un número de grupos más homogéneos No depende de clases pre-definidas a diferencia de clasificación Ejemplo: –Dividir la base de clientes de acuerdo con los hábitos de consumo

15 Usos de la minería de datos Administración de la relación con los clientes: –Identificar nuevos clientes potenciales para aumentar ventas –Ampliar la base de cliente con la mínima inversión por parte de la empresa –Retener clientes existentes evitando que se vayan a la competencia (“attrition”) –Vender más a clientes existentes (“ventas cruzadas”)

16 Usos de la minería de datos Detección de fraudes en el uso de tarjetas de crédito Determinar patrones que puedan estar relacionados con lavado de dinero Determinar el precio de una casa con base en sus características y el precio de otras casas vendidas

17 Usos de la minería de datos Usos de la minería de datos se han ampliado con el comercio electrónico

18 Justificación de la minería de datos Datos se encuentran disponibles Poder computacional es cada vez menos costoso Las presiones competitivas son enormes Software para minería de datos se encuentra disponible

19 Ciclo de vida de minería de datos

20 Principales técnicas de minería de datos Análisis de canasta de supermercado K vecinos más cercanos Detección de grupos Análisis de encadenamiento Árboles de decisión Redes neuronales artificiales Algoritmos genéticos

21 Un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Que es el Dataware Housing.

22 Introducción a los Almacenes de Datos Se desea operar eficientemente con esos datos... los costes de almacenamiento masivo y conectividad se han reducido drásticamente en los últimos años, parece razonable recoger los datos (información histórica) en un sistema separado y específico. Data warehouses (Almacenes o Bodegas de Datos) NACE EL DATA-WAREHOUSING

23 Introducción a los Almacenes de Datos Almacenes de Datos (AD) (data warehouse) disponer de Sistemas de Información de apoyo a la toma de decisiones* disponer de bases de datos que permitan extraer conocimiento de la información histórica almacenada en la organización motivación análisis de la organización previsiones de evolución diseño de estrategias objetivos * DSS: Decision Support Systems

24 Arquitectura de un Almacén de Datos Modelo multidimensional: en un esquema multidimensional se representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones). la información relevante sobre el hecho (actividad) se representa por un conjunto de indicadores (medidas o atributos de hecho). la información descriptiva de cada dimensión se representa por un conjunto de atributos (atributos de dimensión).

25 Arquitectura de un Almacén de Datos Ventas importe unidades Almacén Ciudad Región Tipo Producto Departamento Nro_producto Categoría Marca Tipo Descripción hecho medidas dimensión atributos Tiempo Día Mes Semana Año Trimestre

26 26 Arquitectura de un Almacén de Datos Zumo Piña 1l. Cola 33cl. Leche Entera Cabra 1l Tauritón 33cl Cerveza Kiel 20 cl Jabón Salitre 123412 TIEMPO: trimestre Madrid Barcelona Valencia Zaragoza Alicante Murcia 17 57 93 5 12 Ventas en miles de Euros Jerarquía de dimensiones: Categoría  Gama Prov. \ / Artículo País  Ciudad  Supermercado Año / \ Trimestre \ / \ Mes Semana \ / Día | Hora PRODUCTO: artículo LUGAR: ciudad PRODUCTOLUGARTIEMPO 2004 2005 22 Se pueden obtener hechos a diferentes niveles de agregación: obtención de medidas sobre los hechos parametrizadas por atributos de las dimensiones y restringidas por condiciones impuestas sobre las dimensiones  Un nivel de agregación para un conjunto de dimensiones se denomina cubo. HECHO: “El primer trimestre de 2004 la empresa vendió en Valencia por un importe de 22.000 euros del producto tauritón 33 cl.”

27 Arquitectura de un Almacén de Datos  El almacén de datos puede estar formado por varios datamarts y, opcionalmente, por tablas adicionales. Data mart se definen para satisfacer las necesidades de un departamento o sección de la organización. contiene menos información de detalle y más información agregada. subconjunto de un almacén de datos, generalmente en forma de estrella o copo de nieve.

28 28 Herramientas OLAP OLAP procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el campo de la llamada Inteligencia de negocios (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares

29 29 Ventajas OLAP Las herramientas de OLAP presentan al usuario una visión multidimensional de los datos (esquema multidimensional) para cada actividad que es objeto de análisis. El usuario formula consultas a la herramienta OLAP seleccionando atributos de este esquema multidimensional sin conocer la estructura interna (esquema físico) del almacén de datos. La herramienta OLAP genera la correspondiente consulta y la envía al gestor de consultas del sistema (p.ej. mediante una sentencia SELECT).

30 Tipos de Sistemas OLAP Tipos 1.ROLAP (Procesamiento Analítico Relacional en Línea). 2.MOLAP (procesamiento Analítico multidimensional en Línea). 3.HOLAP (Procesamiento Analítico Híbrido en Línea).

31 ROLAP Son sistemas en los cuales los datos se encuentran almacenados en una base de datos relacional. VentajasDesventajas Seguridad e integridad en la base de datos. Consultas más lentas. Escalable para grandes volúmenes. Construcción cara. Los datos pueden ser compartidos con aplicaciones SQL. Cálculos limitados a las funciones de las bases de datos. Estructura más dinámica.

32 MOLAP En estos sistemas los datos se encuentran almacenados en una estructura de datos multidimensional. VentajasDesventajas Mayor rendimiento en el procesamiento de consultas. Tamaño limitado para la arquitectura del cubo. Posibilita hacer cálculos más complicados. No puede acceder a datos que no están en el cubo. No puede explotar el paralelismo las bases de datos.

33 HOLAP En estos sistemas mantienen los registros detallados en la base de datos relacional, mientras que los datos resumidos o agregados se almacenan en una base de datos multidimensional separada.

34 Comparaciones ROLAP MOLAP Los datos son accedidos directamente desde el Datawarehouse u otra fuente de datos relacional y no son almacenados por separado. Los datos son precalculados y luego son almacenados en cubos de datos multidimensionales.

35 Comparaciones HOLAP Mantiene los volúmenes de datos mas grande en la base de datos relacional y las agregaciones en una base de datos MOLAP separada.

36 Utilidades de OLAP Tienen acceso a grandes cantidades de datos. Analizan las relaciones entre muchos tipos de elementos empresariales. Involucran datos agregados. Comparan datos agregados a través de periodos jerárquicos.

37 Utilidades de OLAP Presentan datos en diferentes perspectivas. Involucran cálculos complejos entre elementos de datos. Pueden responder con rapidez a consultas de usuarios.

38 Beneficios de OLAP Es de fácil uso y acceso flexible para los usuarios. Los datos están organizados en diferentes dimensiones, lo que permite un mejor análisis. Permite encontrar la historia en los datos. Genera ciertas ventajas competitivas.

39 Requerimientos Funcionales de los Sistemas OLAP Construir un Datawarehouse y/o Datamart. Uso de herramientas de Almacenamiento (bases de datos multidimensionales), Herramientas de Extracción y Colección, Herramientas para Reportes de Usuario Final y Herramientas para Análisis Inteligentes.

40 Requerimientos Funcionales de los Sistemas OLAP Un servidor que sea altamente escalable. Un segundo servidor para las herramientas de consulta de datos.

41 Operadores para el manejo de cubos de datos Operadores 1.CUBE 2.ROLLUP 3.DRILLDOWN 4.GROUPING SETS 5.SLICE (Rebanada) 6.PIVOT 7.Dado 8.Ascenso 9.Descenso

42 Utilización de Herramientas para OLAP


Descargar ppt "UNIVERSIDAD LATINA BASES DE DATOS NUEVAS TECNOLOGÍAS."

Presentaciones similares


Anuncios Google