La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Data Warehouse y Almacenamiento

Presentaciones similares


Presentación del tema: "Data Warehouse y Almacenamiento"— Transcripción de la presentación:

1 Data Warehouse y Almacenamiento
Luis Ángel Córdoba M.

2 Que es almacenamiento SAN.
Es un sistema de almacenamiento con una dirección de red propia conectado a la red LAN. Las peticiones de archivo se mapean desde el servidor principal al servidor de archivos NAS. Cuáles son los componente del hardware de almacenamiento SAN . Los componentes primarios de una SAN son: switches, directores, HBAs, Servidores, Ruteadores, Gateways, Matrices de discos y Librerías de cintas. Es un conjunto de elementos que integra el almacenamiento en unidades de cinta, disco y/o CD, software de administración, equipo dedicado y conexiones de redes basadas en fibra óptica. Es un sistema de almacenamiento con una dirección de red propia conectado a la red LAN. Las peticiones de archivo se mapean desde el servidor principal al servidor de archivos NAS.

3 Características del software y de generación de software para almacenamiento SAN
Latencia,  Conectividad,  Distancia,  Velocidad,  Disponibilidad,  Seguridad,  Topología,  ISL Arquitectura  Latencia – Una de las diferencias y principales características de las SAN es que son construidas para minimizar el tiempo de respuesta del medio de transmisión. Conectividad – Permite que múltiples servidores sean conectados al mismo grupo de discos o librerías de cintas, permitiendo que la utilización de los sistemas de almacenamiento y los respaldos sean óptimos. Distancia – Las SAN al ser construidas con fibra óptica heredan los beneficios de ésta, por ejemplo, las SAN pueden tener dispositivos con una separación de hasta 10 Km sin ruteadores. Velocidad – El rendimiento de cualquier sistema de computo dependerá de la velocidad de sus subsistemas, es por ello que las SAN han incrementado su velocidad de transferencia de información, desde 1 Gigabit, hasta actualmente 2 y 4 Gigabits por segundo. Disponibilidad – Una de las ventajas de las SAN es que al tener mayor conectividad, permiten que los servidores y dispositivos de almacenamiento se conecten más de una vez a la SAN, de esta forma, se pueden tener rutas redundantes que a su vez incrementaran la tolerancia a fallos. Seguridad – La seguridad en las SAN ha sido desde el principio un factor fundamental, desde su creación se notó la posibilidad de que un sistema accediera a un dispositivo que no le correspondiera o interfiriera con el flujo de información, es por ello que se ha implementado la tecnología de zonificación, la cual consiste en que un grupo de elementos se aíslen del resto para evitar estos problemas, la zonificación puede llevarse a cabo por hardware, software o ambas, siendo capaz de agrupar por puerto o por WWN (World Wide Name), una técnica adicional se implementa a nivel del dispositivo de almacenamiento que es la Presentación, consiste en hacer que una LUN (Logical Unit Number) sea accesible sólo por una lista predefinida de servidores o nodos (se implementa con los WWN) Componentes – Los componentes primarios de una SAN son: switches, directores, HBAs, Servidores, Ruteadores, Gateways, Matrices de discos y Librerías de cintas. Topología – Cada topología provee distintas capacidades y beneficios las topologías de SAN son: Cascada (cascade) Anillo (ring) Malla (meshed) Núcleo/borde (core/edge) ISL (Inter Switch Link, enlace entre conmutadores) – Actualmente las conexiones entre los switches de SAN se hacen mediante puertos tipo “E” y pueden agruparse para formar una troncal (trunk) que permita mayor flujo de información y tolerancia a fallos. Arquitectura – channel actuales funcionan bajo dos arquitecturas básicas, FC-AL (Fibre Channel Arbitrated Loop) y Switched Fabric, ambos esquemas pueden convivir y ampliar las posibilidades de las SAN. La arquitectura FC-AL puede conectar hasta 127 dispositivos, mientras que switched fabric hasta 16 millones teóricamente.

4 La replicación de datos en SAN y la escalabilidad de usando SAN.
La replicación de datos en SAN, consiste en tener dos cabinas de discos del mismo fabricante que se replican los datos entre si mediante un software que suele estar en el firmware de la controlador Raid o en otro elemento de la red SAN.

5 Data Warehouse Un data warehouse es una colección de datos en la cual se encuentra integrada la información de la Institución y que se usa como soporte para el proceso de toma de decisiones gerenciales.

6 IBM proporciona almacenamiento de datos (Data Warehouse) los cuales permiten el acceso a la información estructurada y datos transaccionales en tiempo real. Los data warehouse que proporcionan un repositorio central y rentable para todos los datos de una empresa, ayudan a controlar el volumen de datos creciente. Gracias a los procesos OLAP( análisis de información almacenada) , permiendole a la empresa generar e impulsar nuevas estrategias documentadas y no empredicciones.

7

8 DATA WAREHOUSING El DW es el lugar donde las personas pueden accesar los datos, los cuales se encuentran integrados a la información institucional o empresarial que usa como soporte en la toma decisiones.

9

10 Características de un Data Warehouse
Orientado a temas Orientado a los temas principales de la organización. La información se clasifica en función de los aspectos que son de interés para la organización. Integrado La integración del Data Warehouse se muestra de diferentes maneras: consistencia en codificación de estructuras, en unidades de medida de las variables, en múltiples fuentes, en convenciones de nombres, en atributos físicos de los datos etc…

11 Características de un Data Warehouse
Variante en el tiempo la información almacenada en el Data Warehouse refleja un histórico de los datos en un horizonte de tiempo mucho más amplio (del orden de años). De esta forma podemos detectar tendencias en el tiempo. No volátil la información es permanente, la actualización del Data Warehouse significa la incorporación de los últimos valores que tomaron las distintas variables contenidas en él, sin ningún tipo de acción sobre lo que ya existía. Los datos más recientes no sustituyen a los precedentes

12 VENTAJAS Proporciona información clave para la toma de decisiones.
Proceso de consultas muy rápido en preguntas predeterminadas, aprovechando las dimensiones definidas en la BD (tiempo, geográficas, etc.). Alta oferta de productos. Independencia de plataforma. Permite todo tipo de consultas no predeterminadas. Alta escalabilidad. Altas prestaciones en los productos punteros.

13 DESVENTAJAS El tratamiento de las consultas no previstas (fuera de sus dimensiones) es muy lento. Aumentar el número de dimensiones supone "explosionar" el tamaño de la base de datos. Falta de estándares. Proceso lento en consultas complejas, en bases de datos muy grandes, si no se cuenta con plataforma paralela y capacidad de consultas paralelizadas.

14 PROPUESTA GRAFICA PARA LA UMB

15 COSTO DE IMPLEMENTACION
RECURSO HUMANO Director del proyecto por la UMB: $85,000,000 por el tiempo de ejecución y puesta en marcha del DW. Incluye el personal correspondiente operativo y ejecutivo. PROVEEDOR DW –CRM-DSS: IBM $180,000,000 Semestrales con soporte PROVEEDOR IPS (FIBRA OPTICA) El proveedor conecta las centrales de la UMB con el proveedor a través de F.O. $14,000,000

16 CONCLUSIONES El desarrollo de la presente actividad me ha permitido afianzar los conocimiento, con relación a los sistemas de almacenamiento como NAS, DAS, SAN y el Data Warehouse. La presente actividad demuestra que el activos mas valioso de las empresas en la actualidad es la información.


Descargar ppt "Data Warehouse y Almacenamiento"

Presentaciones similares


Anuncios Google