La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Prof. Luis Joyanes Aguilar

Presentaciones similares


Presentación del tema: "Prof. Luis Joyanes Aguilar"— Transcripción de la presentación:

1 Prof. Luis Joyanes Aguilar
INGENIERÍA DE ORGANIZACIÓN INDUSTRIAL Inteligencia de Negocios Curso 2007/08 – 2º C Prof. Luis Joyanes Aguilar 1

2 CONTENIDO 0. DE LAS BASES DE DATOS A LA INTELIGENCIA DE NEGOCIOS
1. SISTEMAS DE APOYO A LA DECISIÓN (DSS) 2. INTELIGENCIA DE NEGOCIOS (BI) 3. DATAWAREHOUSE (Almacenes de datos) 4. ANALÍTICA DE LOS NEGOCIOS (OLAP,…) 5. MINERÍA DE DATOS (DM, TM, WM) 6. Groupware, Workflow y BPM APENDICES Página –2–

3 Recordatorio de Bases de Datos
Entidades y atributos Entidad Libro Atributos: Título, Editorial, Autor, Páginas, Ciudad de edición,… Una base de datos relacional organiza los datos en el formato de tablas de dos dimensiones Tabla o entidad: LIBRO Atributos: Campos (columnas) y Filas (registros o tuplas) Base de datos relacionales: Relaciones entre entidades Operaciones típicas en una Base de datos: Quering (consultas) y Reporting (emisión de informes)

4 Uso de Bases de Datos para mejora de la productividad y la toma de decisiones en los negocios y en las organizaciones Las entidades, organizaciones, negocios necesitan las bases de datos para las tareas diarias y transacciones básicas, tales como pago de proveedores, proceso de pedidos, servicios a clientes, pagos a empleados, etc. Pero se necesitan bases de datos más potentes para proporcionar información que ayude a la empresa a gestionar los negocios más eficientemente y ayude a los directivos y empleados a tomar mejores decisiones Si una compañía desea conocer cual es el producto más popular o cual es el cliente más rentable, la respuesta reside en los datos y en como se convierten en conocimiento

5 Sistema de Gestión de Bases de Datos
Es un tipo específico de software para creación, almacenamiento, organización y acceso a datos de una base de datos Microsoft Access es un SGBD para sistemas de escritos DB2, Oracle Database, Microsoft SQL Server,... Son SGBD para computadores grandes y medios. MySQL es SGBD de open-source muy popular (comprada hace unos meses por Sun Microsystems) Oracle Database Lite es un SGBD para dispositivos de computación de mano “handheld”

6 Herramientas para la toma de decisiones
Data Warehouses Data Marts Inteligencia de negocios: OLAP Data mining Text Mining (documentación y gestión de contenidos) Data Mining en la Red: Web Mining

7 Casos prácticos de BI Iberia MySpace
IBM (herramientas de toma de decisiones Web 2.0)

8 Uso de las BBDD en la mejora de las prestaciones de negocio y la toma de decisiones
Los negocios utilizan sus bases de datos para realizar sus transacciones básicas, tales como pago de proveedores, procesos de pedidos , servicio a clientes y pago de empleados Pero también necesitan las bases de datos para proporcionar información que ayuden a la empresa a hacer los negocios más eficientes y ayudar a los directores y ejecutivos a tomar mejores decisiones. Si una empresa desea conocer qué producto es el más popular o quien es el cliente más rentable, la respuesta está en los datos.

9 De las bases de datos a los DW, datamart, BI,..
El análisis de datos de los cliente, p. e., de un gran almacén o de una cadena de restaurantes puede conducir a la conclusión de que para muchos clientes la calidad es más importante que los precios ... Si esto es así, las cadenas pueden introducir nuevas dietas, o nuevas promociones de ventas, etc. En una gran empresa, con grandes bases de datos o grandes sistemas para funciones independientes, tales como fabricación, ventas, contabilidad,.. Se requieren características especiales y se requieren herramientas de análisis de grandes cantidades de datos procedentes de múltiples sistemas

10 ¿Qué es un almacén de datos?
Si se desea información fiable sobre operaciones actuales, tendencia y cambios radicales en la empresa, puede ser difícil conseguir esa información ya que los datos pueden estar en sistemas independientes tales como, ventas, fabricación, contabilidad, etc. Algunos de los datos que se necesitan pueden encontrarse en los sistemas de ventas, y otros en el sistema de fabricación. Muchos de los sistemas pueden son sistemas antiguos (heredados) que utilizan tecnologías de gestión de datos desactualizados o sistemas de archivos cuya información es difícil de acceder por los usuarios, y otros problemas, tendencias, predicciones y son los DW ...

11 ¿Qué es un almacén de datos?
UN DW es una base datos que almacena datos históricos y actuales de interés potencial para los “tomadores” de decisiones en la empresa. Los datos se originan en muchos sistemas de transacciones operaciones, tales como sistemas de ventas, cuentas de clientes , fabricación e incluso datos de transacciones de sitios web. Los DW consolidan y estandarizan la información de diferentes bases de datos operacionales de modo que la información se puede utilizar en la empresa para análisis de la gestión y toma de decisiones Muchas empresas utilizan portales intranet para hacer que la información de los DW estén disponibles para la empresa.

12 Data mart Es un subconjunto de un DW en el que una parte de los datos de una organización se sitúan en bases de datos independientes para una población específica de usuarios. Un data mart normalmente se centra en una única área temática o línea de negocios, de modo que , normalmente, se puede construir más rápidamente y a un menor coste que un DW de una gran empresa P.e. una compañía puede desarrollar data marts de marketing y de ventas,...

13 BI, OLAP, Data Mining Las consultas de las bases de datos tradicionales responden a preguntas tales como “Cuantas unidades del producto de código se vendieron en el mes de febrero de 2008? OLAP, soporta preguntas más complejas tales como “Compara las ventas del producto para planificar las ventas del trimestre y ventas por regiones para los próximos dos años Con DW se consiguen datos corporativos que no se pueden localizar con BD ni con OLAP, tales como encontrar patrones ocultos y relaciones de grandes bases de datos

14 Tipos de información obtenidas de MD
Asociaciones. Son ocurrencias enlazadas a un único evento, Por ejemplo, un estudio de patrones de compra en supermercados puede revelar que, las personas que compran patatas fritas también compran cerveza o coca cola, p.e. un 60%, y que cuando hay una promoción conjunta llegan las ventas al 85%. Esta información puede ayudar a tomar mejores decisiones para aumentar la rentabilidad de una promoción comercial. En secuencias, los sucesos se enlazan en el tiempo. P. e. se puede deducir, que cuando se compra una casa , un nuevo refrigerador y una nueva lavadora se compraran dentro de las dos próximas semanas.

15 Tipos de información obtenidas de MD
Clasificación. Reconoce patrones que describen el grupo al cual pertenece un elemento examinando elementos existentes que han sido clasificados por inferencia de un conjunto de reglas.. P. e. negocios tales como tarjetas de crédito u operadoras de teléfonos que tratan de averiguar porque pierden clientes estables y/o antiguos en la compañía. La clasificación de los clientes puede ayudar a descubrir las características de los clientes , proporcionar modelos de clientes y poner en marcha campañas de clientes para retener a tales clientes.

16 Tipos de información obtenidas de MD
Clustering. Trabaja de modo similar a la clasificación cuando no se ha definido ningún grupo. Una herramienta de minería de datos puede descubrir diferentes agrupamientos en los datos, tales como encontrar grupos de afinidad de tarjetas de crédito o partición de una base de datos en grupos de clientes basados en propiedades demográficas y tipos de inversiones personales Todas estas aplicaciones implican predicciones, las previsiones (forecasting) utilizan predicciones de diferentes modos. Utilizan una serie de valores existentes para planificar los futuros valores. Las previsiones pueden ayudar a encontrar patrones de datos para estimaciones futuras.

17 Bases de datos y Web Los enlaces de bases de datos internas a la Web se realizan de la forma siguiente: Cliente con navegador Web Internet Servidor Web Servidor de aplicaciones Servidor de bases de datos Bases de datos

18 Bases de datos y Web Muchas bases de datos “back-end” no pueden interpretar ordenes escritas en HTML, el servidor pasará estas peticiones de datos al software que traduce ordenes HTML en SQL de modo que ellas pueden ser procesadas por el sistema SGBD con la base de datos. En un entorno Cliente/Servidor, el SGBD reside en un computador dedicado llamado servidor de base de datos. El sistema SGBD recibe las peticiones SQL y proporciona los datos requeridos. La información se transfiere de la base de datos interna de la organización al servidor Web para entregar en forma de una página Web al usuario. El acceso a BD corporativas a través de la Web está generando alta eficiencia y oportunidades de negocio, p. e. proporcionando directorios actualizados de información de cientos de miles de productos industriales, clientes, etc.

19 Gestión de los recursos de datos
Una vez configurada y puesta en marcha una base de datos, se necesita asegurarse de que los datos de los negocios permanecen precisos, fiables y fácilmente disponibles para todo lo que se necesite y ello obliga a : Políticas especiales y procedimientos para la gestión de los datos Establecimiento de una política de información. Especifica las reglas de la organización para compartición, diseminación, adquisición, estandarización, clasificación e inventariado de la información... P.e. una política de información debe especificar cuales miembros del equipo de nomina y del departamento de recursos humanos tienen autorización para cambios de datos sensibles de los empleados, tales como nº de la s.s, salario, etc. El departamento de administración de datos es el responsable de las políticas específicas y los procedimientos de gestión de los datos.

20 Gestión de los recursos de datos
Aseguramiento de la calidad de los datos. Una base de datos bien diseñada y una política de información debe asegurar a los responsables del negocio toda la información que se necesita. Auditoría de la calidad de los datos Limpieza de los datos

21

22 Situación real de las grandes multinacionales del software y posicionamiento actual y en la futura Web 2.0 Sun MicroSystems / MySQL / Oracle Oracle compró en Marzo Hyperion (por millones de dólares), uno de los grandes proveedores de BI … pretende, según los analistas, mejor posicionamiento para introducirse en entornos SAP… Previamente habia comprado J.D. Edwards, PeopleSoft y Siebel. BEA Systems ... Compra de BEA por Oracle Cognos comprado por IBM Business Object comprado por SAP Página –22–

23 FABRICANTES DE SOFWARE DE BI
SAP Business Information Warehouse (SAP BW) permite analizar los datos de las aplicaciones SAP operativas, además de otras aplicaciones empresariales y fuentes de datos externas (p.e. bases de datos, servicios online e Internet) SAP NetWeaver Business Intelligence permite integrar datos a través de la empresa : soporta Data Warehousing, Business Intelligence, Planeación de negocios, Información clave de negocios,.. SAP Enterprise Portal --- Página –23–

24 FABRICANTES DE SOFWARE DE BI
BEA Systems ha apostado por SOA y Web 2.0, y presentado a nivel mundial (en junio pasado) 3 herramientas para Web 2.0: AquaLogic Ensemble, AquaLogic Pagees y Aqua Locig Pathways… Herramientas pensadas para el desarrollo de portales Europa lidera el mercado SOA, ya que sus empresas han apostado desde un principio por esta arquitectura, aunque el desarrollo va más rápido en Estados Unidos Página –24–

25 Mejores prácticas en la gestión de TI
ITIL – adoptada inicialmente por el Reino Unido y Holanda se ha ido extendiendo a muchas naciones, con una gran aceptación… Busca conseguir criterios para medir la rentabilidad, eficacia y calidad del servicio ofrecido a toda la organización por los departamentos de TI Se requiere cada vez más de mejores prácticas de las sociedades (IT Governance) e ITIL es una de las expresiones más importantes En EEUU la aplicación de la Ley Sarbanes-Oxley y en España (y Europa) la Leyes Conthe, Buen Gobierno, … requieren control y asignación de responsabilidades en todo lo referente a información financiera Página –25–

26 Mejores prácticas en la gestión de TI
Expansión de ITIL en el marco de auditoría informática, normas de calidad y de seguridad y en el contexto más amplio de explotación de sistemas La ISO2000, creada en diciembre de 2005, y pendiente de publicación en el BOE como norma expañola localizada El número de certificados ITIL en España se ha duplicado en 2005 y casi triplicado en 2006 frente al año 2004– (En nuestra Facultad de Informática se impartió en Mayo de 2006 a los alumnos de 5º curso de Ingeniería Informática el curso necesario para la certificación y todos los alumnos de Master tienen la oportunidad de seguir dichos cursos) Página –26–

27 Mejores prácticas en la gestión de TI
IT Governance permite maximizar el valor de negocio de las inversiones en TI. Hoy las TI constituyen un elemento crítico de casi cualquier empresa, se ha convertido en un proceso calve y deben ser uno de los focos principales en la generación de valor El IT Governance permite gestionar las TI como un negocio en sí mismo y en consecuencia cualquier organización puede beneficiarse de su implementación …. (estas circunstancias aumentan la importancia de BI como aglutinador de BPM y arquitecturas SOA) Página –27–

28 Mejores prácticas en la gestión de TI
Metodologías y certificaciones ISO para asegurar el desarrollo de los IT Governance de cada organización Metodologías de implantación: COBIT (Control Objectives for Information and related Technology), ITIL (IT Infrastructure Library) Forrester aconseja utilizar COBIT para el control y gobierno TI, ITIL para la entrega y soporte de servicio e ISO para la seguridad Página –28–

29 VOLUMEN DE INFORMACIÓN DIGITAL (IDC)
The Expanding Digital Universe elaborado por la consultora IDC y patrocinado por EMC (Marzo 2007). El número de usuarios de Internet en 1996 era de 48 millones y se ha multiplicado por veinticinco (1.100 millones en 2006 y ascenderán a millones en 2010) y el volumen de información digital seguirá expandiéndose y en el año 2010 será seis veces el actual En 2010 los usuarios individuales son y seguirán siendo los principales agentes que crean y mueven información. En 2010 generarán el 70% de datos en formato digital y por delante de empresas, gobiernos y organizaciones. Página –29–

30 VOLUMEN DE INFORMACIÓN DIGITAL (IDC)-2
Existen 900 millones de ordenadores (computadores) 550 millones de reproductores de música digital 600 millones de teléfonos móviles con cámara 400 millones de cámaras -- Página –30–

31 VOLUMEN DE INFORMACIÓN DIGITAL (IDC)-3
En 2006 se generaron millones de gigas deb información digital (161 exabytes). Equivalente a tres millones de veces la información contenida en todos los libros escritos hasta la fecha Si la información digital se imprimiese en papel permitiría envolver a la Tierra cuatro veces Los contenidos digitales seguirán creciendo y en el se habrán multiplicado por seis (988 exabytes). Increíble crecimiento de la información y de los diferentes tipos de la misma que se generan desde sitios muy distintos Página –31–

32 VOLUMEN DE INFORMACIÓN DIGITAL (IDC)-4
El estudio detecta el próximo aumento de información digital: las imágenes (fotos y vídeos) y el audio (música y telefonía a través de la red) Aparatos digitales Fotos digitales Vídeo digital Internet Banda ancha Economias emergentes Página –32–

33 VOLUMEN DE INFORMACIÓN DIGITAL (IDC)-5
A lo largo de 2007, la cantidad de información generada superará, por primera vez, la capacidad de almacenamiento disponible. El estudio también constata que el 60% de los usuarios de Internet tienen acceso a banda ancha en casa, en el trabajo o en la escuela El número de cuentas de correo-e creció desde 253 millones en 1998 hasta cerca de millones en La previsión para 2010 es alcanzar los millones Página –33–

34 Gestión de la información en las empresas
El estudio concluye que los empleados de una organización gastan 14,5 horas a la semana leyendo y contestando correos electrónicos 13,3 horas creando documentos 9,6 horas buscando información 9.5 oras analizando información Más de 1 ¼ de jornada laboral a gestiones en Internet Página –34–

35 Gestión de la información en las empresas-2
Una empresa con empleados pierde 4,3 millones de euros anualmente sólo en el tiempo que sus empleados necesitan para adaptar la información a las diferentes aplicaciones tecnológicas. Por el contrario, no encontrar a tiempo la información tiene un coste adicional para la misma organización de 4 millones de euros al año. También se augura que el número de transacciones de comercio-e entre las empresas y sus clientes se multiplicará por 100 en cinco años. Página –35–

36 Experimento de Gordon Bell - Microsoft
En 2000 comenzó el siguiente experimento: Se trataba de almacenar toda la información que generaba y recibía (él mismo): los libros que leía y canciones que escuchaba, las conversaciones telefónicas que mantenía, los webs que visitaba,.. La idea idea de Bell era probar que un individuo podría conservar toda su vida en un terabyte (un reproductor digital de ese tamaño contendría unas canciones, 1250 horas de vídeo o fotografías) Durante los 7 años del experimento ha acumulado unos 150 GB, el 15% de lo que tiene disponible para toda su vida Sin embargo al intentar grabar todos los programas de TV que veía, almacenó más del doble de esa cantidad. Eso significa que un TB es suficiente para una vida repleta de texto, pero difícilmente será para una vida audiovisual Página –36–

37 Prof. Luis Joyanes Aguilar
Tema 1. DSS Prof. Luis Joyanes Aguilar 37

38 SISTEMAS DE APOYO A LA DECISIÓN (DSS)
Estado de las organizaciones en un mundo globalizado y tecnológico El entorno del negocio (Factores clave) Mercados Demandas de los consumidores Tecnologías Societal (regulaciones, desregulaciones, políticas, RSC,…) Respuestas de las organizaciones Reactiva, Anticipadora, Adaptable, Proactiva Página –38–

39 TOMA DE DECISIONES EN LA GESTIÓN
La gestión (administración, dirección) es un proceso por el cual los objetivos organizacionales se consiguen utilizando recursos. Los recursos son las entradas y la consecución de los objetivos se visualizan como la salida del proceso El grado de éxito de la organización y de su gestión se suele medir por la ratio de salidas a entradas La ratio es una indicación de la productividad de la organización, que es un reflejo de las prestaciones (rendimiento, desempeño) organizacional y gerencial Página –39–

40 ROLES DE GESTIÓN (Mintzberg 1980)
Se clasifican en tres categorías: Interpersonal Informacional De decisión Para ejecutar los roles, los directivos necesitan información que se entrega en tiempo y modo a los PCs en las oficinas, a los computadores portátiles (móviles), a los PDAs (Asistentes personales digitales), a los teléfonos celulares inteligentes o no, a las redes sociales de las organizaciones, a los blogs, … Normalmente se entrega vía tecnologías Web, Telefonía IP, etc. Página –40–

41 EL PROCESO DE TOMA DE DECISIONES
Aprendizaje a través de la experiencia, tratamiento de pruebas ante errores, intuición, creatividad,… La toma de decisiones suele seguir un proceso de cuatro pasos: Definir el problema Construir un modelo que describa el problema del mundo real Identificar posibles soluciones al problema modelado y evaluar las soluciones Comparar, elegir y recomendar una potencial solución al problema Página –41–

42 Dificultades en los procesos de evaluación
Numerosas alternativas a elegir entre: Tecnologías, servicios de información, motores de búsqueda avanzada, servicios de blogs corporativos o personales, revistas en línea,… Regulaciones de los gobiernos, inestabilidades políticas, cambios en la demanda de los consumidores… producen cada vez más incerctidumbres y dificultad en predecir el futuro Necesidad de tomas decisiones rápidas ante cambio frecuentes e impredecibles Los entornos de negocios se hacen más complejos día a día Página –42–

43 SISTEMAS DE APOYO A LA DECISIÓN COMPUTERIZADOS (Informatizados)
Las aplicaciones informáticas se han desplazados de los sistemas de proceso tradicionales a procesos basados en tecnologías Web Las herramientas de BI, tales como DW, DM, OLAP, dashboards, portales de la web, medios de comunicación electrónicos, etc. son el núcleo fundamental de la gestión moderna Los directivos deben estar enlazados y conectados a sistemas en red (cableados o sin cable) para apoyo en su toma de decisiones importantes Página –43–

44 ¿Porqué utilizar DSS computerizados?
Computaciones rápidas Comunicación y colaboración mejoradas Incrementar la productividad de los miembros de los grupos Mejorar la gestión de los datos Mejorar los grandes almacenes de datos Soporte a la calidad Soporte a la agilidad y flexibilidad Superación de los límites cognitivos en el proceso y almacenamiento de la información. Uso de la Web Soporte en cualquier parte, en cualquier lugar y con cualquier dispositivo Página –44–

45 FASES DE UN PROCESO DE TOMA DE DECISIONES
Inteligencia Búsqueda de condiciones, informes, consultas,--- Diseño Invención, desarrollo, análisis de posibles soluciones Elección Selección de una acción concreta entre las disponibles Implementación Resolución del problema o explotación de la oportunidad Página –45–

46 Etapas de soporte a la decisión
Página –46–

47 Soporte DSS Página –47–

48 Framework para la toma de decisión automatizada
Página –48–

49 Concepto de DSS “Sistemas interactivos basados en computadores, los cuales ayudan a la toma de decisiones utilizando datos y modelos para resolver problemas no estructurados” [Scott-Morton, 1971] “Los DSS asocian los recursos intelectuales de los individuos con las capacidades de los computadores para mejorar la calidad de las decisiones. Es un sistema de soporte basado en computadores para los responsables de las tomas de decisiones y que tratan con problemas semiestructurados” [Keen-Scott Morton, 1978] En general, es cualquier sistema computerizado que ayuda a la toma de decisiones en una organización Página –49–

50 Arquitectura de un DSS de alto nivel
Página –50–

51 Vista esquemática de un DSS
Página –51–

52 REFERENCIAS DSS Resources
[TURBAN et al, 2007] Turban, E., Aronson J.E., Liang T-P. y Sharda, R. Decision Support and Business Intelligence Systems. Eigth Edition. New Jersey: Pearson/Prentice-Hall Special Interest Group on Decision Support, Knowledge and Data Management Systems (SIGDSS) DSS Resources dssresources.com Página –52–

53 RECURSOS Y ENLACES The Data Warehousing Institute DM Review
dw-institute.com DM Review dmreview.com The Olap Report olapreport.com Information Technology Toolbox businessintelligence.ittoolbox.com Business Intelligence Network b-eye-networl.com AIS World isworld.org Página –53–

54 PROVEEDORES DE SOFTWARE
MicroStrategy Microsoft Oracle IBM Hyperion Cognos Exsys SAS Business Object Information Builders SAP Fair Isaac Salesforce (SaAS) .. Página –54–

55 Demos e Información Lista de demos disponibles en sitio Dmreview
Dmreview.com/rg/resources/demos.cfm Información sobre productos, arquitectura y software dsslab.com Página –55–

56 Recursos académicos The Teradata University Network (TUN) Connection
teradataybuniversitynetwork.com Página web de Efraim Turban prenhall.com/turban Harvard Business School Case Collection hbsp.harvard.edu/b01/en/academic/edu_home.jhtml Página –56–

57 Revistas y periódicos Decision Support Systems
CIO Insight (cioinsight.com) Technology Evaluation (technologyevaluation.com) Baseline Magazine (baselinemag.com) Business Intelligence Journal (tdwi.org) Advisor (advisor.com) Oracle Magazine (oracle.com) IBM Systems Journal (ibm.com) Intelligence Enterprise (intelligenceenterprise.com) Business 2.0 (business20.com) Página –57–

58

59 Prof. Luis Joyanes Aguilar
Tema 2. BI Prof. Luis Joyanes Aguilar 59

60 Proceso de creación y uso de inteligencia
Página –60–

61 Evolución de un BI Página –61–

62 Arquitectura de alto nivel de BI
Página –62–

63 ESTRUCTURA Y COMPONENTES DE UN SISTEMA DE BI
El DataWarehouse (Almacen o Bodega de datos) Flujo de datos desde los sistemas operacionales (p.e. CRM, ERP) a un DW que es una base de datos especial o depósito de datos que han sido preparados para aplicaciones de toma de decisiones El DW se construye con metodologías, principalmente metadatos y ETL Los data mars , son depósitos o repositorios de un tema específico o departamental (p.e. marketing o mercadotecnia) Analítica de negocios (OLAP, online analytical processing). Herramientas de software que permiten a los usuarios crear informes y consultas bajo demanda y gestionar análisis de datos Página –63–

64 ESTRUCTURA Y COMPONENTES DE UN SISTEMA DE BI
OLAP Los usuarios pueden analizar diferentes dimensiones de datos multidimensionales, tales como series de tiempo y vistas de análisis de tendencias Los usuarios pueden identificartendencias de rendimientos o prestaciones Para manejar un BA (Analítica de negocios) se necesita software de interactividad que se denomina middleware para acceder al DW. Es considerado infraestructura y es una interfaz del usuario del sistema Página –64–

65 ESTRUCTURA Y COMPONENTES DE UN SISTEMA DE BI
MINERÍA DE DATOS (DATA MINIG) Es una clase de análisis de información de una base de datos que examina patrones ocultos en un grupo de datos que se pueden utilizar para predecir comportamientos futuros El término se utiliza principalmente para describir el software que presenta datos de nuevas maneras ya que no sólo cambia la presentación sino que realmente descubre relaciones desconocidas con anterioridad entre los datos- Este conocimiento se aplica a conseguir objetivos específicos del negocio Estas herramientas se utilizan para reemplazar la inteligencia humana explorando (minando) en grandes masas de datoss para descubrir nuevas correlaciones , patrones y tendencias utilizando tecnologías de reconocimiento de patrones y estadística avanzada Página –65–

66 ESTRUCTURA Y COMPONENTES DE UN SISTEMA DE BI
BPM (Business Performance Management) El componente se basa en la metodología de los cuadro de mando integrales (balanced scorecard) que es un marco de trabajo para definir, implementar y gestiona la estrategia de negocios de una empresa enlazando objetivos con medidas de hecho Es un método para enlazar métricas de alto nivel, tales como información financiera creada por el CFO El objetivo de BPM es optimizar el rendimiento o prestaciones (desempeño) global de una organización El BPM incluye normalmente dashboards (tableros) que proporcionan una visión de las prestaciones corporativas con presentaciones gráficas, similares a los cuadros de mando de los automóviles Página –66–

67 Grandes componentes de Inteligencia de negocios
Página –67–

68 Beneficios de Inteligencia de negocios
Página –68–

69 Prof. Luis Joyanes Aguilar
Tema 3. DataWarehouse. DW Prof. Luis Joyanes Aguilar 69

70 Primeras consideraciones en ALMACENAMIENTO
Necesidades de almacenamiento en las empresas se han incrementado exponencialmente debido, no sólo a la proliferación de Internet, y del correo electrónico sino también como respuesta a un mayor control por parte de las autoridades para conservar ciertos datos de carácter personal y como una forma de salvaguardar información, a lo largo del tiempo de todos los procesos de negocios La consultora IDC pronostica ente 2005 y 2008 el total de la capacidad de almacenamiento empresarial desarrollado anualmente en todo el mundo crecerá en torno al 367%, desde los petabytes hasta los Página –70–

71 ALMACENAMIENTO Predicciones de Gartner (noviembre 2005)
Durante 2008, el almacenamiento de archivos será la mejor forma de obtener costes más bajos de recuperación por encima de cualquier otra inversión A finales de 2007, el 80% de las compañías de Fortune 1000 encriptarán la mayor parte de sus datos críticos Página –71–

72 ALMACENAMIENTO (Sun Microsystems)
Explosivo crecimiento de datos almacenados abre una enorme oportunidad para las soluciones de almacenamiento de Sun. Según la compañía el 37% de los datos almacenados en el mundo se guarda en su plataforma. Jonathan Schwartz, Consejero Delegado de Sun Microsystems, mantiene un blog (firme defensor de los paradigmas web 2.0) porque cree que su relación con los accionistas no se debe limitar a enviar una carta una vez al año a los accionistas. “Los blogs son una forma maravillosa de comunicación y participación” Página –72–

73 Un caso práctico de Almacenamiento de Datos innovador: La Copa Mundial de Futbol 2006
Red de comunicaciones comparable a la de cualquier multinacional Unir 12 estadios, a partir del 5 de mayo; disponen de 34 días hasta el partido inaugural dispositivos en red con una capacidad de almacenamiento de 15 TB (1 TB = GB... Existen ya discos duros portátiles de 1 y 4 TB con conectores USB: Se comercializan ya en grandes almacenes discos USB de 2 TB) Red IP integra datos, voz y vídeo Página –73–

74 Noticias a resaltar Cada segundo se crean en el mundo 390 GB de datos nuevos que se suman a los millones de GB de datos almacenados en el mundo actualmente. Se está pasando de la utilización de productos para resolver situaciones puntuales a la implantación de soluciones de gestión globales El mercado de almacenamiento está tendiendo a ofrecer soluciones integradas que cubran todos los aspectos que una empresa pudiera necesitar en este sentido Página –74–

75 Tendencias: Virtualización
Consolidación del almacenamiento Los backups remotos Replicación a través de la red Seguridad y cifrado de los datos a través de la Red Transición hacia el almacenamiento en red Virtualización del almacenamiento…”nivel de abstracción entre la visión lógica que tiene el servidor de almacenamiento y el almacenamiento físico Virtualización de la Red Virtualización en el servidor Otros en el array de almacenamiento Página –75–

76 TENDENCIAS EN ALMACENAMIENTO portátil
Estándar DVD actual Estándares futuros: Blu-ray de Sony (Al menos 50 GB y puede llegar a 100GB) HD DVD ( 15 GB a 50GB) Seis de los grandes estudios de cine apoyan a Sony Página –76–

77 TENDENCIAS EN ALMACENAMIENTO
Blu-Ray GB o 50 GB HD-DVD máximo 45 GB Toshiba ha comenzado a vender a finales de Marzo, en Japón, los nuevos reproductores HS-DVD (770€); llegará al mercado de EEUU en Abril HD-DVD apoyado por Universal Studios y Warner Brox, así como el DVD-Forum, Intel y Microsoft Blu-Ray apoyado por Sony Twentieth, Apple, HP, Dell, Panasonic, LG, Philips, Pionner, Samsung, TDK, y todos los estudios de cines, excepto los anteriores Toshiba lanzó en julio una gama de grabadoras por 2.466$ Página –77–

78 HD DVD (febrero 07) Toshiba ha anunciado que pondrá a la venta un disco de tecnología HD DVD con 51 GB de capacidad Está. compuesto por tres capas superpuestas, de modo que cada una de las capas puede almacenar 17 GB de capacidad Con esta capacidad se puede llegar a almacenar hasta 7 horas de vídeo en alta definición Página –78–

79 Noticias de Enero/Febrero 2008
En el CES de Las Vegas (Primera quincena de 2008), la Warner y otros estudios de cine se decantan por Blu-Ray Febrero de Toshiba anuncia que abandona el disco HD-DVD, no adopta Blu-Ray y se centra en el DVD estándar Marzo de 2008l Ante los grandes problemas producidos por los dos estándares, avanza el almacenamiento en Red en detrimento de los DVD Marzo de Sony anuncia un nuevo DVD para después de 2010 con más de 10 veces la capacidad de los Blu-Ray ¿Cómo afectarán estas innovaciones a las aplicaciones de BI, especialmente a las PYMES?

80 Algunos datos actuales de memorias flash
Trascend … comercializa memorias (con diseño en su carcasa)… 1GB 2GB 4GB (92,9 €) € la semana pasada en Madrid 16 GB (Noviembre, 06) USB JetFlash 2A, 474€ ( incluye aplicaciones de copia de seguridad, comprensión de archivos y bloqueo del dispositivo por medio de una contraseña Sony (Micro Vault Tiny) Micromemoria (peso de 1,5g y 2,4 mm de espesor) 2GB (93€) JetFlash 210 de transcend (8GB) incorpora un sistema biométrico de reconocimiento de huella dactilar, para garantizar sólo el acceso de su propietario (hasta 10 personas y con zona pública y privada de fábrica) Página –80–

81 La naturaleza y las fuentes de datos
Las personas responsables del proceso de toma de decisiones necesitan datos, información y conocimiento que deben estar integrados y organizados de modo que los haga útiles y eficientes Las herramientas de toma de decisiones y por consiguiente los responsables de dicha toma de decisiones deben poder aplicar herramientas de análisis (procesamiento analítico en línea “OLAP”, minería de datos, etc) de modo que los D+I+C puedan ser utilizados para el mayor beneficio posible. Estas herramientas están incluidas dentro de la BI , Inteligencia Web, Analítica Web, y en general la analítica de los negocios.

82 La naturaleza y las fuentes de datos (2)
Los Sistemas de Información de empresa utilizan: CRM Sistemas de informacion ejecutivos Sistemas ERP, Planificación de recursos empresariales Sistemas ERM, Gestión de recursos empresariales Utilizan SGBD, almacenes de datos, OLAP y minería de datos como fundamentos teóricos y prácticos

83 Recordatoio de GC Datos. Elementos acerca de cosas, eventos, actividades y transacciones se registran, clasifican y almacenan pero no están organizados para transmitir ningún significado especial. Los elementos de datos pueden ser numéricos, alfanuméricos, figuras, sonidos o imágenes. Información. Los datos se han organizado de modo que tengan un significado en un determinado recipiente. Los datos confirman algo que el recipiente conoce o puede tener un valor que revela algo conocido Conocimiento. Consta de elementos datos y/o información organizados y procesados para transmitir experiencia, aprendizaje acumulado aplicables a un problema o actividad actual o futura. El conocimiento es la aplicación de los datos e información a la toma de decisiones

84 Fuentes de datos principales
DATOS INTERNOS Se almacenan en uno o más lugares Los datos son sobre personas, productos, servicios y procesos P.e los datos de los empleados y sus salarios se almacenan normalmente en las bases de datos corporativas Los datos sobre equipos y maquinaria se pueden almacenara en la base de datos del departamento de mantenimiento Los datos de ventas se pueden almacenar en diferentes sitios: departamento de ventas, de contabilidad, presupuestos, ... Están disponibles vía red interna o red intranet de la organización

85 Fuentes de datos principales (2)
DATOS EXTERNOS Existen muchas fuentes externas de datos: Desde datos de bases de datos comerciales a datos recogidos por sensores y satélites Datos disponibles en CDs y DVDs (DVDs Blu-Ray), memorias SD, miniSD, .., en Internet, en películas, en fotografía, música, discursos en vivo,... Informes de los Gobiernos, de las empresas, ... son fuentes de datos externas disponibles hoy día en la Red. Datos externos pueden estar, también, disponibles utilizando GIS, oficinas del censo, oficinas estadísticas. bancos, locales, instituciones de investigación, ... Los datos pueden estar alrededor del mundo La mayoría de los datos externos pueden ser irrelevantes a un sistemas específico de apoyo a la gestión (MSS)

86 Fuentes de datos principales (3)
DATOS PERSONALES Y CONOCIMIENTO La mayoría de los usuarios de un MSS (Sistema de apoyo a la gestión) y empleados corporativos tienen experiencia y conocimiento que se pueden almacenar para un uso futuro. Estos datos incluyen estimaciones objetivas de ventas, opiniones, interpretación de nuevos artículos,.... El conocimiento de las personas, y como capturarlo, gestionarlo y distribuirlo es el tema central de la Gestión del Conocimiento

87 RECOGIDA DE DATOS, PROBLEMAS Y CALIDAD
La necesidad de extraer datos de muchas fuentes internas y externas complica la tarea de construcción de un MSS A veces es necesario capturar datos en bruto En otras ocasiones es recoger datos del cliente a partir de los datos de las empresas o encontrarlos en Internet...blogs de empresas, podcasting, redes sociales, portales de empresa, portales de conocimiento,... Con independencia de cómo se recolecten , los datos deben ser filtrados y validados Una expresión clásica en GIGO (garbage in garbage out) La calidad de los datos es un tema importante

88 RECOGIDA DE DATOS, PROBLEMAS Y CALIDAD (2)
Métodos para recolección de datos en bruto Los datos pueden ser recogidos manualmente o por instrumentos y sensores P.e. uso de cámaras de vídeo, uso de cuestionarios, entrevistas,... Método de recogida de datos de las PDAs, envío por Internet, bluetooth, RFID, --- Algunos métodos implican captura física de datos mediante tecnologías tales como código de barras o RFID Dispositivos biométricos recogen datos del mundo real ... (DW y DM)

89 Problemas con los datos
Todos los sistemas informáticos dependen de los datos. La calidad e integridad de los datos son críticos para evitar que el sistema MMS evite el síndrome GIGO Los datos deben estar disponibles en el sistema o el sistema debe incluir un subsistema de adquisición de datos Los problemas de los datos DSS se resumen en la Tabla siguiente junto con algunas posibles soluciones Si se anticipan problemas se pueden estimar soluciones de coste

90 Problemas con los datos
Algunos problemas importantes con posibles soluciones: Datos no correctos Desarrollo de un método sistemático para introducir datos Automatizar datos de entrada Introducir controles de calidad en la generación de los datos Establecer programas apropiados de seguridad Los datos no están a tiempo (no son oportunos) Modificar el sistema de generación de daos Utilizar la Web para obtener datos “frescos” (recientes, actualizados) Los datos no se han medido o indexado adecuadamente Utilizar un data warehouse Utilizar motores de búsqueda

91 Calidad de los datos La calidad de los datos en un tema muy importante ya que la calidad determina la utilidad de los datos así como la calidad en la toma de decisiones basadas en ellos Los datos de las bases de datos organizacionales son, con frecuencia, imprecisos, incompletos o ambiguos Los daños económicos y sociales de pobre calidad suponen perdidas millonarias El Data Warehousing Institute (TDWI, ofrece estadísticas y encuestas importantes La mala calidad de los datos puede retrasar la implementación de un almacén de datos o un data mart en periodos de seis a doce meses La CD es importante, especialmente, en CRM, ERP, ... y otros SSII

92 Integridad de los datos
Los sistemas de ficheros antiguos pueden carecer de integridad Un cambio hecho en el fichero en un determinado sitio puede no haberse hecho tambien en otro lugar o departamento relacionado El resultado, datos en conflicto Muy importante en entornos colaborativos tales como Lotus Note, Google Hoja de cálculo, Groove de Microsoft

93 ACCESO E INTEGRACIÓN DE DATPOS
La toma de decisiones requiere el acceso a múltiples fuentes de datos que deben estar integrados Antes de los DW y BI , proveer el acceso a fuentes de datos era un proceso importante y laborioso... Incluso las modernas herramientas basadas en web para gestión de datos requieren de especialistas en bases de datos y en DW Los recursos de datos de las empresas pueden adoptar diferentes formatos: Bases de datos relacionales, documentos XML; mensajes de Intercambio Electrónico de datos (EDI), registros COBOL, etc. La integración de datos adecuadamente procedentes de fuentes dispares es difícil

94 Integración de datos vía XML
XML se ha convertido en el lenguaje estándar para integración de bases de datos y transferencias de datos Un porcentaje muy alto, superior al 50-60% de todas las transacciones de e-commerce se producen sobre servidores XML XML también es el lenguaje de datos y la base fundamental para AJAX y aplicaciones Web 2.0 Existe una gran oferta de software de integración de datos. Los desarrolladores de software de gestión y captura de datos están creciendo en el uso de XML para transportar datos de fuentes a destionos

95 Servicios de bases de datos comerciales y Web/Internet
La Internet/Web es una fuente importante de datos y es el proveedor más sobresaliente de datos externos en muchas situaciones de toma de decisiones Los servicios de bases de datos online (comerciales ) venden acceso a bases datos especializadas. P.e. los datos GIS deben ser precisos y tener actualizaciones disponibles regularmente La recolección de datos de múltiples fuentes de datos externos pueden ser complicada (procedencia diferentes IBM, Orcale, S_ybase, mySQL, ...)

96 Sistemas y bases de datos corporativas y de la Web
Los desarrollo en Sistemas de Gestión Documental (DMS) y sistemas de gestión de contenidos (CMS) incluyen el uso de navegadores por los empleados y clientes para accedes a información vital Los temas críticos se han vuelto más críticos en los sistemas basados en Web Sistemas de software cooperativos Groove de Office Tratamiento de texto y hojas de cálculo de Gmail Lotus/Notes Domino de IBM Computación colaborativa en la forma de groupware

97 ORGANIZACIÓN Y ESTRUCTURAS DE BBDD
Bases de datos relacionales (DBMS) Bases de datos jerárquicas Bases de datos en Red Bases de datos orientadas a objetos Bases de datos multimedia Bases de datos documentales Bases de datos fotográficas y de imágenes en 3D Bases de datos inteligentes (basadas en agentes inteligentes de la Web),,, Los agentes inteligentes pueden mejorar las búsquedas en bases de datos, especialmente en DW.. P.e. Preferencias del usuario (amazon) y mejora de las capacidades de búsqueda para anticipar necesidades futuras del usuario

98 DATA WAREHOUSING Un DW se puede utilizar para apoyar la toma de decisiones, analizar grandes cantidades de datos de diferentes fuentes para proporcionar resultados rápidos en el proceso crítico de toma de decisiones Un DW comienza con la separación física de los entornos operacionales y de toma de decisiones. En el corazón de muchas cias reside un almacen de datos operacionales, derivados normalmente de sistemas OLTP (procesamiento de transacciones en línea), tales como aplicaciones de pedidos en puntos de entrada. Muchas sistemas OLTP heredados se implementaron, principalmente en COBOL (especialmente la banca), operan todavia con sistemas CICS (customer information control systems)

99 Características de un Data Warehousing
Orientado a temas. Un DW difiere de una BD operacional en que la mayoría de las BD operacionales tienen una orientación al producto , mientras que un DW proporciona una visión más completa de la organización Integrado. Los datos integrados resuelven significados inconsistentes y proporcionan terminología uniforme de la organización. También, los formatos de datos y tiempo varían alrededor del mundo Variable con el tiempo. Los datos se mantienen grandes cantidades de tiempo, 5, 10 o más años y se utilizan para tendencias, previsiones y comparaciones. El tiempo es una dimensión importante que deben soportar todos los DW. Los datos para análisis de mútliples fuentes contienen puntos temporales: (p.e. vistas diarias, semanales, mensuales)

100 Características de un Data Warehousing (2)
Resúmenes. Los datos operacionales se agregan, cuando sean necesarios, en forma de resúmenes No normalizados. Los datos en un DW no están normalizados generalmente y pueden ser altamente redundantews Fuentes. Todos los datos están presentes; tanto internos como externos No volátiles. Una vez introducidos en el DW, los datos son de sólo lectura, no se pueden modificar o actualizar. Los datos obsoletos se descartan y los cambios se registran como nuevos datos. Se necesitan grandes cantidades de espacio libre (para crecimiento de los datos) . Metadatos. Se incluyen metadatos (definidos como datos about data)

101 Framework y vistas de un almacen de datos
Página –101–

102 Arquitectura de un almacen de datos tricapa
Página –102–

103 Arquitectura de un almacén de datos bicapa
Página –103–

104 Arquitectura de una bodega de datos basada en Web
Página –104–

105

106 El proceso ETL Página –106–

107 Tema 4. Analítica de los negocios (OLAP)
107 107

108 OLAP El término online analytical processing se refiere a una variedad de actividades normalmente ejecutadas por usuarios finales en sistemas online NO existe acuerdo universal en cuales actividades son consideradas OLAP Normalmente OLAP incluye actividades tales como generación y respuestas de consultas, solicitud de informes y grafos ad hoc y ejecución de los mismos, análisis estadísticos modernos, y construcción de presentaciones visuales También se puede considerar el análisis multidimensionales, ESS y datamining como OLAP

109 OLAP Esencialmente, los productos OLAP proporcionan modelado, análisis y características de visualización, para grandes conjuntos de datos, o bien sistemas de gestión de bases de datos, o más frecuentemente, almacenes de datos (data warehouses) y proporcional una visión conceptual de los datos

110 OLAP versus OLTP Durante muchos años, las TI se concentraron en la construcción de sistemas de misión crítica que soportaran principalmente procesos de transacciones corporativas. Tales sistemas debían de ser virtualmente tolerantes a fallos y proporcionar ejecución eficiente y respuestas rápidas Una solución efectiva se proporcionó con los OLTP (online transaction processing) que se centraron en actividades repetitivas y en rutinas, utilizando un entorno de bases de datos relaciones distribuidas. Los desarrollos últimos en estas áreas utilizaban ERP, SCM y CRM, e integración con tecnologías basadas en Web e intranets. Se crearon muchas herramientas –p.e. Informix Dynamixc Server- para desarrollar aplicaciones OLTP

111 OLAP versus OLTP OLTP se centra en procesamiento de transacciones repetitivas en grandes cantidades y realizando manipulaciones sencillas OLAP implica exámenes de muchos datos (normalmente muchos millones o miles de millones de datos) en relaciones complejas Además de respuestas a consultas de usuarios, OLAP puede analizar estas relaciones y buscar patrones, tendencias y excepciones En otras palabras OLAP es un método directo de apoyo a la decisón

112 OLAP versus OLTP Una consulta típica OLAP puede acceder a bases de datos de ventas multigigabyte o terabyte de muchos años con el objeto de encontrar todos las ventas de productos en cada región para cada tipo de producto. Despues de revisar los resultados, un analista puede refinar a continuación la consulta para encontrar volúmenes de ventas para cada canal de ventas dentro de una región o dentro de ciertas clasificaciones de productos Como última etapa, el analista puede realizar comparaciones anuales, cuatrimestrales,..para cada canal de ventas.

113 OLAP versus OLTP Una lista de herramientas OLAP puede consultar en baseline.com y en revistas especializadas como PCWeek, DM Review, Intelligent Entrerprise y Software Review Los principales vendedores de estas herramientas incluyen BusinessObjects, Computer Associates, Cognos, Hyperion, Information Builder, Microsoft, Microstrategy, Oracle, SAS Insititute, SPSS,

114 Tipos de OLAP OLAP multidimensional (MOLAP). OLAP se implementa mediante una base de datos multidimensional (o almacenes de datos). Los datos se organizan en una estructura tipo cubo o cubo de datos que el usuario puede rotar. Es muy adecuado para resúmenes e informes financieros OLAP relacional (ROLAP) OLAP relacional (ROLAP). Se implementa con una base de datos relacional. Utilizando sentencias complejas de SQL frente a tablas relacionales, ROLAP puede crear también vistas multidimensionales pero no estructura cubo Las herramientas OLAP relacional extraen datos de las bases de datos relacionales OLAP HÍBRIDA. Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional

115 Tipos de OLAP (2) Database OLAP y Web OLAP (DOLAP y WOLAP)
Database OLAP se refiere a un SGBDR que está diseñado para estructuras OLPA host y realizar cálculos OLAP. Web OLAP se refiere a los datos OLAP que son accesibles desde un navegador Web Desktop OLAP. Las versiones Web se mueven de procesamiento de escritorio a un servidor intermedio, que aumenta la escalabilidad, sin embargo, pero permanece la funcionalidad, al menos, comparable a la de la versión de escritorio (webTop)

116 Prof. Luis Joyanes Aguilar
Tema 5. Minería de datos (DM, TM, WM) Prof. Luis Joyanes Aguilar 116

117 CONCEPTOS Y CARACTERÍSTICAS DM
El término se utilizó originalmente para describir el proceso a través del cual se identificaban patrones no descubiertos con anterioridad. Muchas de las técnicas utilizadas en minería de datos tienen sus raíces en el análisis estadístico tradicional y en inteligencia artificial Disciplinas tales como astronomía, sistemas de información geográfica GIS; física nuclear , acumulan grandes cantidades de datos. Los datos en Internet están creciendo en volumen y complejidad en todo el mundo Los investigadores médicos utilizan técnicas de MD para descubrir nuevos medicamentos y diagnósticos de enfermedades Página –117–

118 CONCEPTOS Y CARACTERÍSTICAS DM
DM se utiliza para describir descubrimiento de conocimiento en bases de datos (KDD) La MD es un proceso que utiliza técnicas estadísticas, matemáticas, inteligencia artificia y aprendizaje electrónico para extraer e identificar información útil y conocimiento posterior de grandes bases de datos MD es el proceso de encontrar patrones matemáticos a partir de grandes cantidades de datos. Estos patrones pueden ser reglas, afinidades, correlaciones, tendencias o modelos de predicción Página –118–

119 ¿cómo funciona la MD? La MD descubre información dentro de almacenes de datos que consultas e informes no pueden revelar eficientemente Los métodos más utilizar para identificar patrones en datos Modelos simples (p.e consultas basadas en SQL, OLAP, juicio humano) Modelos intermedios (p.e. regresiones, árboles de decisión, clustering) Modelos complejos (p.e. redes neuronales, otras reglas de inducción) Página –119–

120 Minería de Datos (Data Mining)
Recordatorio de BI: Los sistemas de BI se clasificaron en dos tipos diferentes en cuanto al objetivo que consiguen pero que no eran incompatibles: Sistemas multidimensionales basados en la verificación (consultas de base de datos, métodos gráficos estadísticos o los multidimensionales Sistemas basados en el Descubrimiento (Minería de Datos…) Un Sistema de MD es un sistema capaz de encontrar información y conocimiento: Oculto y no obvio En grandes volúmenes de datos De una forma automatizada …. Página –120– 120

121 Conceptos de Minería de Datos
Proceso automatizado de descubrir información desconocida, en una forma que se pueda comprender, a partir de grandes volúmenes de datos y que sean de utilidad para la toma de decisiones críticas. Conjunto de diferentes técnicas analíticas que examinan o buscan patrones en los datos de una base de datos o de un almacén de datos, o buscan modelar el comportamiento de los clientes… Los sitios Web de los clientes pueden ser “minados” para desarrollar perfiles de clientes o de visitantes Página –121– 121

122 Conceptos de Minería de Datos (2)
Los puntos críticos para definir un sistema de MD Ser capaz de descubrir información oculta Esta información debe ser de gran utilidad para tomar decisiones importantes. La información se obtiene de grandes volúmenes de datos, donde hay mucha información. Este conocimiento debe presentarse en una forma que se pueda entender sin excesivo esfuerzo. Algoritmos Matemáticos, Redes Neuronales Árboles de decisión …. Página –122– 122

123 Conceptos de Minería de Datos (3)
El Objetivo principal de la MD es la extracción de conocimiento de las bases de datos Este conocimiento se expresa en forma de patrones y reglas de comportamiento, aplicables a las ocurrencias de entidad que componen una base de datos, así como a los atributos que caracterizan a estos registros. A partir de estas reglas, se pueden realizar predicciones que sirven de base para toma de decisiones empresariales (fundamentalmente en situaciones de incertidumbre) Página –123– 123

124 Ventajas de la Minería de Datos frente a los Métodos Estadísticos Tradicionales
La MD trabaja sobre la totalidad de los datos y no con una muestra Con la MD se accede directamente a las bases de datos Las técnicas usadas en la MD no usan variables aleatorias El tiempo de cálculo es muy proporcional al número de datos que se analizan En la práctica no existen límites en el volumen de datos que se analizan Página –124– 124

125 Ventajas de la Minería de Datos frente a los Métodos Estadísticos Tradicionales
Se necesita una formación básica para el análisis de los resultados El grado de información y conocimiento que se consigue con la Minería de Datos es muy superior al que pueden ofrecer los métodos clásicos estadísticos… El análisis estadístico nos muestra tendencias de la globalidad, perdiendo el detalle, normalmente. Con la MD encontramos relaciones entre la totalidad de las variables. Página –125– 125

126 Aplicaciones de MD Entidades financieras… para predecir el riesgo existente en la concesión de créditos a clientes Las Cias de Telecomunicaciones y de Tarjeta de Crédito… para detectar operaciones fraudulentas (a partir de operaciones fraudulentas detectadas y de todas sus características) Detectar clientes cuyo perfil es más interesante de cara concentrar su esfuerzo en… Realizar predicciones de sucesos naturales, catástrofes, meteorología, etc En Medicina, detección de tumores o a la clasificación de los ya detectados En Turismo, realizar predicciones sobre grupos de interes Página –126– 126

127 Minería de datos en la Web
La Web desde la perspectiva de DM ¿Porqué la Web? Fuentes de datos de la Web ¿Porqué la minería de datos Web? Los datos de la Web se pueden mejorar de otras fuentes disponibles ¿Qué es Minería Web? Sinónimo de “Knowledge Discovery in Database, KDD” Página –127– 127

128 Estrategias de minería
Trabajando con datos de la Web: Identificación Captura Análisis sintáctico o gramatical (parsing) Mejora (enhancing) Análisis o analizador Actuaciones Página –128– 128

129 ALGORITMOS DE MD Clasificación Clustering Asociación
Árboles de decisión, redes neuronales, evaluación de riesgos, reglas Clustering Redes neuronales, estadísticas, optimización Asociación Estadística, teoría de conjuntos Descubrimiento de secuencias También se utilizan otras herramientas de análisis de datos tales como análisis de regresión y series de tiempo Página –129–

130 HERRAMIENTAS Y TÉCNICAS DE MD
Métodos estadísticos Árboles de decisión Razonamiento basado en casos Computación neuronal Agentes inteligentes Algoritmos genéticos Visualización de datos Reglas de inducción Página –130–

131 MINERÍA DE TEXTOS Es la aplicación de la MD a archivos de textos no estructurados o poco estructurados La MD aprovecha la ventaja de la infraestructura de datos almacenados para extraer información adicional útil P.e un analista puede descubrir aplicando MD a una base de datos de clientes que todas las personas que compran el producto A también comprar B y C tres o seis meses más tarde, … La minería de textos actúa con información poco estructurada Los documentos, raramente, tiene una infraestructura interna fuerte y cuando sucede, se centra en el formato del documento más que en el contenido del documento. Página –131–

132 MINERÍA DE TEXTOS (2) La MT ayuda a las organizaciones a:
Encontrar el contenido de documentos “oculto”, incluyendo relaciones adicionales útiles Relacionar documentos a través de estados anteriores imprevistos (p.e. descubrir que los clientes de dos divisiones diferentes de productos tienen las mismas características. Agrupar documentos por temas comunes (p.e. todos los clientes de una aseguradora que tienen las mismas quejas y cancelan sus pólizas por estas razones) La MT no es lo mismo que un motor de búsqueda en la Web. En la búsqueda se intenta encontrar lo que otros han preparado. Con MT se descubren nuevos patrones, “minas” de conocimiento, que pueden no ser evidentes o conocidos

133 MINERÍA DE TEXTOS (3) Las organizaciones, de esta década, reconocen que una fuente competitiva importante es el conocimiento no estructurado contenido en los almacenes de conocimiento de las organizaciones, almacenados en formatos de: Documentos Memos Correos-e, faxes, chat Políticas y procedimientos organizativos Patentes Propiedad intelectual Archivos de audio, MP3, vídeo, .. Reuniones Comisiones de trabajo,--- Toda esta información textual de modo que las herramientas de minería de datos predictivas pueden ayudar a la organización a generar valor real de su depósito necesita ser codificada y extraída (repository)

134 Tipos de Minería de Texto
Minería de texto, se utiliza, en algunos ambientes de negocios como un término genérico para implicar todo tipo de procesamiento de texto. Tres especialidades se pueden considerar han emergido en este campo Recuperación de la Información (consulta de texto, encontrar texto y y presentación de información de texto) Extracción de la información ...( Procesamiento de lenguaje natural y lingüística computacional se utilizan para analizar y procesar texto, ... Programas que proporcionan automáticamente resúmenes de documentos) ç Resúmenes de información. recupera o colecciona documentos de un número de nuevos sitios, crea cluster bados en temas y resume cada cluster. UNA DE LAS APLICACIONES MÁS GRANDES DE MT ES LA EXTRACCIÓN DE INFORMACIÓN EN CIENCIAS BIOLÓGICAS

135 ¿Cómo minar texto? La extracción de términos es el formato más básico de MT Se convierte “mapea” la información de datos no estructurados a formato estructurado. Se utiliza un vector de características o listado ponderado de palabras. Se listan las palabras más importantes de un texto, junto con una medida de su importancia relativa Eliminar palabras utilizadas frecuentemente (el, la, los,..) Reemplazar palabras con sus semillas o raíces (eliminar plurales, diferentes conjugaciones,…) Considerar sinónimos y frases (p.e. estudiante y pupilo, maestro y profesor, se pueden agrupar juntos Calcular los pesos de los términos restantes Página –135–

136 ¿Cómo minar texto? (2) Calcular los pesos de los términos restantes. El método más común es calcular la frecuencia de aparición de la palabra. Existen dos medidas típicas: el término frecuencia, o factor tf, mide el número real de veces que una palabra aparece en un documento, y la frecuencia inversa del documento, factor fid, indica el número de veces que la palabra aparece en todos los documentos de un conjunto. El razonamiento es que un factor tf grande aumenta el peso, mientas que un factor grande de fid lo disminuye ya que los términos que aparecen más frecuentemente en todos los documentos serán palabras comunes en la industria y no se consideraran importantes

137 Herramientas de minería de textos
Sistema para manipulación de documentos en formatos diferentes (texto completo, formatos de tratamiento de texto.. Word, Google;PDF; ) desde muchas fuentes diferentes (ficheros, Web, s, fax,...) Componentes utilizados para procesar estos documentos y crear archivos de datos que puedan ser minados ... “divisores de frases, analizadores de textos, ... ) Herramientas de minería de datos tales como algoritmos de cluster, algoritmos clasificadores, algoritmos de búsqueda, ...

138 Herramientas de minería de textos (2)
“Frameworks open source” para las tareas anteriores gate.ac.uk (University of Sheffield, UK) UIMA, ... Research.ibm.com/UIMA Herramientas populares de minería de textos: SAS Text Miner (sas.com) IBM Intelligent Miner for Text (ibm.com) SPSSLexiquest (spss.com) Insightful Miner for Text (insightful.com) Megaputer Intelligence TextAnalyst (megaputer.com) StatSoft Data Miner (statsoft.com)

139 Estructura de la Web La WWW consta de páginas conectadas por enlaces (links) Una página consta normalmente de múltiples elementos de contenido, tales como texto, imágenes, audio, enlaces a otras páginas Un servidor Web proporciona acceso a cada uno de esos elementos La representación utilizada para minería de estructura es un grafo (realmente un grafo dirigido ya que los enlaces van de una dirección de una página a otra El grafo ideal mapeará todos los enlaces que conectas a todos los dcumentos de la Web completa

140 Estructura de la Web (2) En el lenguaje matemático, la WWW, es un grafo dirigido. Cada página es un nodo de este grafo y cada enlace es un arco. El grafo es dirigido porque un enlace de la página A a la página B no implica un enlace correspondiente de la página B a la página A. P.e. un grafo que representa un sitio Demo puede tener cada página que incluya un enlace de retorno a la página principal. La mayoría de los enlace permanecen dentro de la misma página , pero la página Demo3 , p.e, puede incluir enlaces a páginas de sitios (home) tales como Demo1 y Demo2

141 Estructura de la Web (3) Conteo de las citaciones
En el mundo académico, no basta con la publicación de un artículo o libro en una revista y que haya sido revisado entre pares , sino que es muy importante que éste sea La principal evidencia de la utilidad de un artículo o libro es el número de veces que es referenciado o citado a su vez en la bibliografía de otros artículos o libros. Autores específicos se convierten en autoridades en una materia en función del números de citaciones a dicho trabajo La estructura global de la web funciona de igual manera, teniendo presente los enlaces que se realizan sobre la página web concreta Sitios web de referencia : Alexa, ComScore, Nielsen NetRating, ...

142 Minería Web Se puede definir como el descubrimiento y análisis de basadas en información interesante y útil de la Web, acerca de la Web y normalmente con herramientas Web La Web es quizás el depósito de datos/textos más grandes y la cantidad de información en la Web crece día a día Información interesante en la “home page” que se enlaza con otras páginas, hiperenlaces, recorrido de las navegaciones, etc- Se clasifica en :. Minería de contenidos, Minería de estructuras y Minería de uso Página –142–

143 Minería Web Web Mining tiene el problema que trabaja con datos desestructurados, lo que no permite utilizar los algoritmos de Data Mining. Se trata de documentos de texto libre (correos-e, faxes, chat, boletines, ..., audio, vídeo) que pueden incluir ficheros de todo tipo. Más aún, si se trata de páginas personales ( o blogs) que incluyen información temáticamente variada y lo que se pretende son análisis semánticos y textuales.

144 Minería Web Definición de WM: “Extracción de información latente a través de la W3”... Abarca estudios de contextos, enlaces para la mejora de relevancia. “Es el conjunto de técnicas para la recuperación de información en grandes espacios hipertextuales desestructurados y que se centran más en la información incluida y latente en los hiperenlaces y en la estructura del documento que en lo que actualmente se entiende como contenido textual de las páginas web”.

145 Minería Web El término WM se utiliza de tres formas:
“Describir el proceso de descubrimiento de recursos informativos y/o documentales de todos los existentes en la W3” El análisis de accesos a la W3 u otras formas de visualización y acceso de los usuarios a la información web. El proceso de inferencia, detección y representación de estructuras informativas creadas por las relaciones que forman las propias fuentes web.

146 Minería Web Estructura del WM:
Análisis de la topología de enlaces mediante técnicas cuantitativas Análisis estadístico del texto o del contenido semántico (text mining) mediante análisis de concurrencia, reconocimiento de estructuras Análisis de los informes sobre el número de enlaces por usuario, máquina (uso de la web mining) Diseño de interfaz de usuario. Técnicas de visualización (árboles hiperbólicos, mapas auto-organizativos a través de redes neuronales, ...)

147 Tipos de minería en Web Página –147– 147

148 Tipos de minería Web (2) Minería de contenido. Se refiere a la extracción de información útil de las páginas Web Minería de estructura. Se refiere al desarrollo de información útil de los enlaces incluidos en los documentos Web Minería de uso. Se refiere a la extracción útil de los datos que están siendo generados a través de las visitas a páginas web, transacciones, etc. Página –148–

149 Tipos de minería Web (3) Minería de contenido. Es el proceso de extraer información útil del texto, imágenes y otras formas de contenido incluido en las páginas Web ¿qué páginas están escritas en alemán, en español,..? Los motores de búsqueda , agentes inteligentes, y motores de recomendación emplean minería de contenido para ayudar a los usuarios a encontrar necesidades reales en la Web? Los documentos pueden ser extraídos en algún formato legible por la máquina de modo que las técnicas automatizadas puedan generar alguna información acerca de las páginas Web.

150 Tipos de minería Web (4) Los crawlers (arañas, orugas) se utilizan para leer automáticamente en el contenido de un sitio web ... “Programas que visitan sitios Web y recogen información de acuerdo a alguno de los criterios generales. Luego la información es indexada para posteriormente ppoder ser utilizada por varios usuarios La información automatizada puede incluir características de documentos similares a los utilizados en minería de texto, pero también pueden incluir conceptos adicionales tales como jerarquía de documentos. La minería web de contenido se puede utilizar también para mejorar los resultados producidos por los motores de búsqueda

151 Caso práctico de Web mining
Un sistema de visualización puede tomar los resultados de una búsqueda y a partir de un motor de búsqueda tal como Google, lee los 100 documentos top, agrupa estos documentos mediante procesos con la herramienta Intelligent Text Miner, y a continuación presenta los resultados en un formato gráfico basado en vistas diferentes.

152 Tipos de minería Web (5) Minería de estructuras. Es el proceso de extracción de información útil de la topología de la Web- los enlaces entre páginas. Qué páginas son los destinos de enlaces desde mucha otras magnas? Qué páginas apuntas a muchas otras. ¿Qué colecciones de páginas forman islas Esta información ese útil para determinar, p. e. la popularidad de un documento en motores como Google, en el algoritmo page-rank De igual forma que los enlaces que van a un documento pueden indicar la popularidad de los documentos, los enlaces dentro del documento pueden incluir la profundidad de la cobertura de un tema

153 Tipos de minería Web (6) Mecanismos hubs y authorities (algoritmo de Kleinberg) Hubs son páginas que apuntan a muchas autoridades en el campos Authorities pages, son aquellas que están enlazadas por muchos hubs Se trata de diferenciar entre “autoridad” y mera popularidad Una buena comprensión de la estructura de un sitio Web es útil para determinar cuales páginas deben ser añadidas a una colección de sitios Web. Una duplicación significativas de enlaces Web en una página puede sugerir que no se necesita enlazar a dos sitios diferentes. .

154 Tipos de minería Web (7) Mineria de estructura proporciona información útil de los enlaces incluidos en los documentos Web. Esta información puede ser útil para determinar la popularidad de un documento, elemento clave del algoritmo de page-rank de motores de búsqueda tales como Google. Identifica mecanismos para encontrar “hubs” y “autoridades” a través del análisis de hiperenlaces. Hubs son páginas que apuntan a muchas autoridades del campo. Páginas autoridad son aquellas que están enlazadas por muchos hubs.

155 Tipos de minería Web (8) Minería de uso, se refiere a extraer información útil de los datos que están siendo generados a través de visitas a la página web, transacciones, etc. Existen al menos tres tipos de datos que son generados a través de visitas a una página web: Datos generados automáticamente y almacenados en el servidor a traves de logs de acceso, log referrer, log agent, y cookies del lado del cliente Perfiles de usuario Metadatos tales como atributos de páginas, atributos de contenidos, y datos de uso

156 Tipos de minería Web (9) Minería de uso, es el proceso de extracción de información en cómo las personas que recorren esos enlaces con sus navegadores hacen uso de ellos. ¿Qué páginas visitan? ¿cuánto tiempo permanecen en cada página? ¿cuántos hacen clic en la siguiente? ¿qué caminos conducen a la salida? ¿Al contador de páginas?

157 Tipos de minería Web (10) Clickstream analysis
Análisis de la información recogida de los servidores Web ayuda a comprender el comportamiento del usuario Utilizando técnicas de minerías de datos, una compañía puede poder discernir patrones interesantes a partir del análisis de clics. P.e. puede aprender que 70% de los visitantes de Madrid que buscan “hoteles en Madrid” también buscan “el museo del Prado” o “comer en Casa Lucio”. Esta información puede ser útil para decidir donde colocar publicidad en línea AC ouede ser útil para conocer cuando los visitantes acceden a un sitio: P.e. si se conoce que el 70% e las descargas de software de su sitio ocurren entre las 8 y 12 pm hora española, puede planear tener mejor apoyo al cliente y mejores anchos de banda en esas horas, pensar que son clientes americanos, etc.

158 Tipos de minería Web (11) Clickstream analysis
Ejemplos de uso de de Web Mining: Determinar el valor del tiempo de vida de los clientes Diseñar estrategia de marketing cruzado de productos Evaluar campañas promocionales Comportamiento de grupos de usuarios badados en patrones de acceso Predecir compartamiento de usuario basado en regalas aprendidas con anterioridad y perfiles de usuario Presentar información dinámica a usuarios basada en sus intereses y perfiles

159 Tipos de minería Web (Amazon)
Amazon proporciona un magnífico ejemplo de cómo el uso de la Web se puede potenciar dinámicamente Un usuario registrado que vuelve a visitar amazon.com es saludado por su nombre Es una tarea simple que implica reconocer al usuario leyendo un cookie (p.e. un pequeño archivo de texto escrito por un sitio web en el computador del visitante) También presenta al usuario una elección de productos de un almacén personalizado, basado en compras anteriores y en un análisis de asociación de usuarios similares “Godl Box” para ahorro de tiempo en visitas y compras Otras recomendacione y software para análisis de páginas Web Kdnuggets.com/software/web-mining.html

160 Software de minería de uso
ClickTracks clicktracks.com Se pueden mostrar patrones de visitantes en el sitio Web LiveStats from DeepMetrix deepmetrix.com Análisis de log en tiempo real, demos en vivo del sitio Megaputer WebAnalyst megaputer.com/products/wm.php3 Capacidad de minería de datos y de texto MicroStrategy Web Traffic Analysis Module microstrategy.com/Solutions/Applications/WTAM Detalles de tráfico, análisis de contenido informes de análisis de visitantes

161 Software de minería de uso (2)
SAS Web Analytics sas.com/solutions/webanalytics Analiza tráfico de sitios Web SPSS Web Mmining for Clementine spss.com/web_minig_for_clementine Extracción de eventos Web WebTrends webtrends.com Minería de datos de información de tráfico en la Web Salfordsystems.comalfordsystems.com+

162 Ejemplo de personalización utilizando minería de uso en Web
Página –162–

163 Referencias Web Teradata University DM Review SAS SPSS Teradata
Teradatastudentnetwork.com DM Review Dmreview.com SAS Sas.com (buscar whitepaper of applications) SPSS Spss.com (buscar whitepaper of applications) Teradata Teradata.com (buscar whitepaper of applications) Kdnuggests Kdnuggest.com (buscar información de softwrare y paquetes de aplicación)

164 Bibliografía LINOFF, Gordon Y berry, Michael. (2002) Mining the Web. New York: Wiley GARCIA SANTIAGO, Lola. (2003) Extraer y visualizar información en Internet: el Web Mining. Madrid: Ediciones Trea CHAKARABARTI, Soumen. (2003) Mining the Web: Discovering Knowledge from Hypertext Data. Boston: Morgan Kaufmann. [TURBAN et al, 2007] Turban, E., Aronson J.E., Liang T-P. y Sharda, R. Decision Support and Business Intelligence Systems. Eigth Edition. New Jersey: Pearson/Prentice-Hall

165 Prof. Luis Joyanes Aguilar
Tema 5. SOA y BPM Prof. Luis Joyanes Aguilar 165

166 TECNOLOGÍAS EMERGENTES EN LA PRÓXIMA década … Gartner … Agosto 06
Las tecnologías Web 2.0 y los modelos de negocio dominan las tecnologías emergentes junto con la Web del Mundo real y la Arquitectura de aplicaciones: Web 2.0 Web del mundo real Arquitectura de aplicaciones Página –166–

167 Tecnologías y modelos de negocio Web 2.0
Análisis de redes sociales (SNA, Social Network Analysis) Uso de información y conocimiento de muchas personas y sus redes personales Ajax Inteligencia colectiva Producción de contenido intelectual (código, documentos, indexación y decisiones) Mashups Proporciona mejoras crecientes para procesos establecidos que producen aumento de ingresos o ahorros de costes para la empresa Página –167–

168 Arquitecturas de aplicaciones
Arquitecturas controladas por eventos (EDA) Arquitecturas controladas por modelos (MDA) Web semántica corporativa Arquitecturas orientadas a servicios (SOA) Página –168–

169 APLICACIONES NOTABLES DE SOA
SOA mejorará la interoperabilidad del sector sanitario SOA transformará el desarrollo de aplicaciones en las Administraciones Públicas --- La mayoría de las grandes empresas europeas han iniciado alguna clase de iniciativa SOA IDC prevé un gasto en este tipo de tecnologías (SOA) cercano a los millones de dólares en 2009 El binomio BPM/SOA será clave en el desarrollo empresarial de los próximos años Página –169–

170 TECNOLOGÍAS QUE EXPLOTARÁN EN 2007
Social Networking Web Sevices / SOA AJAX SEGURIDAD BPM/ GESTIÓN DE DOCUMENTOS y ECM OFFICE 2.0 Enterprise Web 2.0 Enterprise 2.0 Página –170–

171 TECNOLOGÍAS PARA SOBREVIVIR EN LOS PRÓXIMOS CINCO AÑOS
Las compañías necesitarán comprender, abrazar e implementar tecnologías y soluciones de empresa web 2.0 Hoy los empleados, socios y clientes esperan más acceso a información y un formato fácil y personalizable (a medida) Las empresas necesitan considerar lo que hacen hoy para cumplir las necesidades actuales y establecer los fundamentos del futuro Página –171–

172 APLICACIONES DE EMPRESA Web 2.0
Aplicaciones persistentes Determinadas aplicaciones no necesitan ser modificadas. p.e Outlook y Office de Microsoft, o sus equivalentes de Google, Sun Aplicaciones Web continuas Pueden ser entregadas aisladamente en la empresa.. Modelo SaaS (Software as a Service) Aplicaciones sintetizadas SOA, EAI, ESB (Enterprise Service Bus), mash-ups Página –172–

173 ENTERPRISE Web 2.0 (EW2.0) Hoy, usuarios, clientes y empleados esperan obtener información en cualquier momento y trabajar en cualquier lugar del mundo Esto implica aplicaciones y servicios deben estar disponibles en tantos lugares como sea posible El apellido 2.0 significa como las organizaciones se comunicarán con los clientes y los socios en los negocios ahora y en el futuro Para muchas empresas puede significar la incorporación de tecnologías 2.0 “estar o no estar en el negocio en cinco años” Página –173–

174 ENTERPRISE Web 2.0 (EW2.0) (II)
Muchas empresas han comenzado a evolucionar e implementar SOA y BPM Las tecnologías SOA/BPM se pueden considerar evolutivas Las tecnologías Web 2.0 se podrían considerar “revolucionarias” Página –174–

175 ENTERPRISE Web 2.0 (EW2.0) (II)
EW 2.0 es mucho más que entregar aplicar web y proporcionar portales de colaboración Son tres áreas importantes: Aplicaciones e integración de aplicaciones Conectividad (Internet, wireless, netwok) Tecnologías end-point tales como “portátiles” (laptops) y PDA,s Página –175–

176 APLICACIONES E INTEGRACIÓN DE APLICACIONES EW2.0
EAI, SOA, BPM Herramientas Backbase, Nexaweb, JaclBe, Adobe, Crosscheck Systems Empresas Web 2.0 Wikis Mash-ups Search-Google Yahoo Ask.com Gigablast .. Página –176–

177 Conectividad Los usuarios actuales demandan acceso a información en cualquier momento y en cualquier lugar. Estas demandas se incrementarán en los próximos años Se esperan soluciones y tecnologías “always-on” Los departamentos de TI necesitarán conocer e implementar la conexión correctar y accesos a redes con éxito con EW2.0. Esto requiere tecnologías y temas de seguridad y soluciones Página –177–

178 Dispositivos de usuario-final
Los dispositivos de acceso deben proporcionar el vehículo para empleados, clientes y socios para acceder a información y aplicaciones en cualquier parte del mundo. El cómo utilicen y estandaricen las compañías estas tecnologías será crítico para su éxito Las empresas deben decidir cuando construir aplicaciones y cuando comprar aplicaciones web externas Las empresas necesitan un marco de trabajo para ayudar a definir objetivos organizativos pertenecientes a EW2.0 Con estos objetivos las empresas pueden listar y priorizar aplicaciones Página –178–

179 Algunos desarrollos BPMS-Web 2.0
Los editores de software de BPM y SOA y los blogs dedicados a BPM proliferan y crecen a gran velocidad Implementación potenciada por AJAX del estándar Xforms desarrollado por W3C … Tecnología Intalio/BPMS 4.0 creada por Orbeon y Open Source, una de las primeras soluciones BPM para adoptar un modelo Web 2.0 para interfaces de usuario de workflow Sugerencias para usar BPM en integración múltiple de servicios Web 2.0 (Samdy Kemsley): RSS Feeds Weblogs y Wikis Calendarios “Online Hojas de Cálculo Online” (Zoho Sheet) Página –179–

180 Algunos desarrollos BPMS-Web 2.0
Una de las grandes aportaciones de Web 2.0 son las aplicaciones mashups. Por ejemplo: Integrar en una interfaz de workflow de aplicaciones de gestión de dossiers de vistas aereas de edificios proporcionados por Google Maps; la vista de una carrertera o de un cruce de carreteras donde ha tenido lugar un accidente de circulación Otra posibilidad, añadir una carta en la cual el lugar de residencia de los clientes o socios de una empresa a fin de localizar gupos de interes para lanzar campañas comerciales o de marketing especializado Servicios de geolocalización, asignación de recursos locales en enlace con un motor de reglas (logística y soporte al cliente, gestión de lotas técnicas,..) Interfaces nativos BPM más intuitivos de utilizar.. Las tecnologías Ajax permiten enriquecer estos interfaces nativos simplificando las tareas de los usuarios Página –180–

181 Aplicando conceptos Web 2.0 a BPM
Barreras pequeñas (low-barrier), disponible en cualquier parte, mashups de procesos de negocios basados en Web (Ajax y RIAs con estructuras granulares URL) Permitir a los usuarios de negocios estructurar información y contenido de los negocios (folksonomías vs taxonomías) Gestión y mantenimiento de procesos de negocios por los usuarios finales que utilizan los procesos de negocios como servicios web convirtiendo al proceso de negocio en una plataforma reutilizable Página –181–

182 Aplicando conceptos Web 2.0 a BPM
Servicios de procesos de negocios basados en estándares portables y reconocidos tanto como sea posible (OpenAjax, RSS, REST, SOAP, BPEL,…) Colaboración estilo Web 2.0 (edición estilo wiki, publicaciones estilo blog, red social “social networking “) Página –182–

183 Unas propuestas de futuro en SOA
Recordemos que adoptar una inciativa SOA significa no sólo desarrollar Servicios Web sino también introducir elementos de explotación de los recursos como pueden ser herramientas de BPM, gobernabilidad, monitorización,etc. La popularización de los conocidos Mashups como composición de aplicaciones utilizables a través de un navegador de Internet, ha dado lugar al concepto de WOA (Arquitecturas Orientadas a Web) y el uso de protocolos y tecnologías como HTTP, XML, REST o JSON Además la Web 2.0 ofrece una forma de transformar aplicaciones en auténticas Plataformas de Red a través de Internet Página –183–

184 Unas propuestas de futuro en SOA
Desarrollar servicios consumibles a través del navegador de Internet (Explorer 7, Mozilla 2.0) Considerar el desarrollo de servicios para sindicación (RSS y ATOM) Desarrollar los servicios teniendo presente los links que los localizan Utilizar AJAX como espina dorsal de SOA (casos de SAP, BEA Systems, …) Habilitar a los usuarios de Internet como consumidores de los servicios Considerar JSON(JavaScript Object Notation) como una opción a los servicios Considerar un SOA Universal (Global SOA) debido la Web 2.0, sindicación de contenidos, mashups,… Página –184–

185 Prof. Luis Joyanes Aguilar
Tema 8. La inteligencia colectiva (colaborativa) “Implantación de SOA/BPM como ejes de NI en la Web 2.0 al servicio de los negocios y la educación” Prof. Luis Joyanes Aguilar 185

186 Prof. Luis Joyanes Aguilar
CONCLUSIONES Prof. Luis Joyanes Aguilar 186

187 TENDENCIAS TIC , IDC, COMPUTERwORLD, 1 DE FEBRERO 2007
En hardware aparecerá la Virtualización 2.0 El segmento del software estará marcado por el crecimiento del software como servicio (Saas)--- Caso de Salesforce respuestas de IBM, Oracle, HP, … Los pioneros, Salesforce, junto con Google, marcan la pauta- Ha obligado a Microsoft a reconsiderar su estrategia de ventas. “La sustitución del modelo tradicional de adquisición de software por licencias hacia el modelo de pago por uso seguirá acrecentándose” Página –187–

188 TENDENCIAS TIC (2) El software seguirá una senda de transformación de sus modelos de comercialización, convirtiéndose definitivamente en un servicio, como lo pueden ser la luz o el agua, y su precio bajará El peso del Software libre (código abierto) será significativo, aunque tendrá matices a considerar Las empresas tenderán hacia entornos mixtos, con aplicaciones propietarias y en código abierto. Un factor clave será la interoperabilidad de los sistemas mediante la sincronización de los procesos de negocio y de los TI a través de múltiples plataformas Página –188–

189 Tendencias TIC (3) Cada vez tiene mas peso el usuario de negocio, la necesidad de control de gestión y el rendimiento, sin olvidar los índices relativos al ROI El futuro vendrá marcado por una creciente demanda de soluciones de BI que facilitarán la integración de todos los datos de la organización convirtiéndolos en información almacenada y gestionable 2007 quedará registrado como el año de la consolidación de las Arquitecturas Orientadas a Servicios Página –189–

190 En noviembre se celebró SIMO 2007 (La feria de la informática en España --- La más importante en Europa despues de CEBITT –Hannover “Marzo 08) A finales de Julio se presentó SIMO 2007 que se centrará en la edición de este año en: Empresa (SOA, BPM y BI como ejes fundamentales: SIMO Empresa ) Conocimiento (SIMO Conocimiento) Web 2.0 (SIMO Web 2.0)… se celebrará la Web 2.0 European Conference, en colaboración con Kiwi World Live Web … Análisis de lo que ofrecen las Redes Sociales para la empresa Página –190–

191 Enterprise 2.0 “La gente se está comunicando por medio de blogs, chats, vídeo y otras herramientas que ofrece la Web 2.0 al margen de los departamentos de TI de las empresas. Y ha llegado el momento de que los departamentos de TI tomen las riendas de esta tendencia” [John Chambers, CEO de Cisco System] CommunicacionesWorld, Julio-Agosto 2007 Aunque con retornos de inversión difícilmente palpables y justificables, como sucede con muchas tecnologías, que ayudan a mejorar la productividad, y hay quien considera no aportan valor al negocio (véanse casos de MySpace, YouTube o Second Life) no es una moda pasajera Página –191–

192 Enterprise 2.0 El pasado Junio, el Banco de Sabadell –uno de los grandes bancos financieros de España- anunció la firma de un acuerdo con IBM para incorporar las tecnologías Web 2.0 al sector financiero. A nivel internacional, firmas de todos los segmentos de la industria, como Cysco Systems, Dell, Microsoft, Citrix, BNP, Toyota, Boeing o DuPont, entre otras muchas, siguen la tendencia de incorporar tecnologías Web 2.0 IBM ha anunciado Lotus Connections “un producto de inteligencia colectiva” que lleva el software social a los negocios para ayudarles a innovar Página –192–

193 Enterprise 2.0 IBM anunció en Junio de 2007 la filosofía “Web 2.0 Goes tu Work” de la compañía que giran alrededor de tres componentes clave: Economic Impact, Community Value y Enabling Technologies. BEA Systems, el fabricante de software de infraestructura empresarial ha presentado tres nuevos productos “diseñados para acercar la Web 2.0” y “la informática social” a la empresa: BEA AquaLogic Pages, BEA Aqualogic Ensemble y BEA AquaLogicPathways. SAP ha presentado NetWeaver para desarrollar soluciones orientadas a servicios a gran escala en entornos Web 2.0 (tecnologías AJAX) Página –193–

194 Enterprise 2.0 “Service Oriented Architecture for Dummies”
refleja la unión de la Web 2.0 y la SOA universal “La unión de Web 2.0 y SOA marca una revolución cultural” [Judith Hurwitz, coautor] “El valor de SOA en Enterprise 2.0 es que permite solucionar los aspectos de integración y de gobierno que no son aplicable al uso de Web 2.0 en Internet--- SOA tambien es de gran utilidad para acercar los beneficios de la Web 2.0 a los trabajadores móviles y teletrabajadores que acceden a ellos a través de PDA o Blackberry” [Monte Kluemper, BEA Systems” Página –194–

195 Enterprise 2.0 (Los mashups empresariales)
Mashup “una superposición o combinación de elementos de información, utilizando por ejemplo las API “Application Programming Interfaces”” Los mashups se han convertido en uno de los pilares de la Web 2.0 gracias a su sencillez y a su fácil acceso para desarrolladores y usuarios. Sin embargo, las compañías de Internet han sido las primeras en descubrir sus beneficios En dos años se convertirán en una tecnología muy habitual de Internet Las compañías se aprovechan de la creatividad e innovación de los usuarios Página –195–

196 Comentarios y preguntas
Luis Joyanes Aguilar (PORTAL DE CONOCIMIENTO Y TECNOLOGÍA de McGraw-Hill) Tno: Fax: Facultad de Informática Universidad Pontificia de Salamanca campus Madrid Página –196– 196

197 Referencias Web What is Web 2.0 (en inglés, 30-09-2005)
What is Web 2.0 (en español) //sociedaddelainformacion.telefonica.es/jsp/articulos/detalle.jsp?elem=2146 Blog Web 2.0 de Dion Hincheliffe //web2.wsj2.com SOAWebServices Journal Introducting Ajax and OpenAjax Página –197–

198 Referencias Web Web 2.0 and BPM Office 2.0 Podcast Jam
Sandy Kemsley, Kemsley Design Ltd. Process 2006, London Office 2.0 Podcast Jam Sandy Kemsley: Web 2.0 and Business Process Management ( Página –198–

199 Referencias Web Club-BPM club-bpm.com
Business Process Management Initiative Business Process Management Group Workflow Management Coalition The Business Process Management Supersite BPM Bulletin Página –199–

200 Referencias Web OpenAjax Alliance OpenAjax BPMS
OpenAjax BPMS iitgroup.com/BPMS2007 BRMS (Business Reglas Management Systems) Página –200–

201 Referencias Web IT/Redux
//itredux.com/blog/2006/02/07/web-20-meets-bpm-20/ Dion Hinchcliffe:Blog Web 2.0, //web2.wsj2.com Dion Hinchcliffe: Leveraging Web 2.0 for business growth //blogs.zdnet.com/Hinchcliffe/?p=42 Intelligent Enterprise Business 2.0 Página –201–

202 BIBLIOGRAFÍA Mendez del Río, Luis. Más allá del Businnes Intelligence. Barcelona: Gestión 2000, 2006 Judith Hurwitz . “Service Oriented Architecture for Dummies”, 2007 Juan José Moreno y Luis Joyanes. Handbook of BPM / Workflow, CRC Press : USA, 2006 Juan José Moreno y Luis Joyanes. Handbook of BPM / Workflow, CRC Press: USA, 2007 Joyanes, Luis. Web 2.0 y Redes Sociales. México DF: McGraw-Hill, 2007 (en preparación) Página –202–

203 CASOS PRÁCTICOS Más allá del Business Intelligence, Luis Mendez del Río, Gestión 2000, 2006 Iberia
Situación real en la primera década del 2000 Ranking de los mejores 100 clientes... Distintos en cada una de las áreas de contacto con el cliente Herramienta de fidelización: Tarjeta Iberia Plus Categorías: normal, plata, oro, platino Acceso a servicios extra y a un trato preferencial El cliente Iberia Plus era un auténtico VIP para la Cía. El sistema no ofrecía el máximo de sus posibilidades. Iberia quería conocer mejor a sus clientes: Quería saber cuales eran los verdaderamente rentables

204 Caso práctico: Iberia Desconocía los que estaban a punto de dejar de volar en sus aviones No se tenían registros si sus clientes eran particulares o viajaban por cuenta de su empresa No constaba si al llegar a Barajas un viajero procedente de Buenos Aires era cliente VIP en Argentina o no Iberia no sabía cómo hacer llegar esa información a los puntos calientes de la compañía, aquellos que están en contacto con los viajeros, para obtener las máximas ventajas competitivas. Se necesitaba optimizar los ingresos de los clientes más fieles

205 Caso práctico: Iberia Se tomaron importantes decisiones comerciales... Duplicar los puntos a los titulares de Iberia Plus en el Puente Áereo No proporcionó rentabilidad a la Cia por su alto cose La estrategia comercial de Iberia pasaba por el impacto directo, no sobre los clientes habituales, sino sobre los rentables Había que identificar claramente a esos clientes rentables y establecer campañas eficientes para fidelizarlos al máximo y evitar su fuga a otras Cías (caso de Spanair, Air Europa, ... ) Grado de satisfacción de los servicios que recibían de la compañía, Atención postventa diversificada, a los clientes no se les contestaba con rapidez a las reclamaciones... Atención al Cliente en Iberia deficitaria

206 Caso práctico: Iberia Iberia necesitaba conocer todo sobre la generación de ingresos por parte de sus clientes. Quienes eran, dónde estaban los más rentables y si estaban satisfechos con la compañía Se tomó la decisión de implantar una solución de CRM para conocer el valor de los clientes en cualquier momento de contacto, compra de billete, solicitud de información o servicio, etc. En Febrero de 2002 se decide generar un sistema que genere inteligencia de negocio para la toma de decisiones.

207 Caso práctico: Iberia La inteligencia se debe centrar en dar respuesta a tres preguntas esenciales ¿quiénes son los mejores clientes? ¿Cuáles de los servicios que se les puede ofrecer valoran más positivamente? ¿En qué momento del contacto con el cliente pueden ofrecerse? La solución CRM y la experiencia de negocio de los directivos de Iberia junto con la recopilación y procesado de los clientes titulares de la Tarjeta Iberia Plus condujo a obtener... Nivel de gasto en vuelos de cada viajero, frecuencia de los viajes, destinos, información solicitada, reclamaciones, nivel de satisfacción, et...Se trataba de tener una imagen clara de cada cliente.

208 Caso práctico: Iberia Segmentación activa El CRM trató de clasificar a los clientes de Iberia Plus agrupándoles en segmentos diferenciados, según sus pautas de consumo; coincidencia en las rutas, frecuencia de los viajes, forma de pago, si eran clientes de negocios o privados, si utilizaban Internet o presencial, si compraban directamente o a través de agencia, si se les había perdido alguna vez el equipaje, si reclamaban por impuntualidad u otras deficiencias, etc. En 2004 y siguientes se organizan campañas de marketing para esos segmentos de viajeros previamente definidos... (18 en 2004)

209 Caso práctico: Iberia ¿Cómo han sido las campañas?
¿Qué inteligencia estratégica se ha obtenido de la recopilación y análisis de los datos de negocio? Localizar los clientes que perteneciendo a la categoría “plata” eran susceptibles de ser ascendidos a la categoría superior si adquirían vuelos en un plazo determinado Campañas frecuentes con ofertas de puntos en vuelos nacionales e internacionales... Estímulos en forma de puntos Identificar a los clientes que por haber disminuido su nivel de vuelos estaban a punto de perder la categoría

210 Caso práctico: Iberia ¿Cómo estimular la fidelidad?
Mantener la fidelidad de todos sus clientes y en especial de los más rentables era vital para Iberia Una vez identificados sus clientes más rentables, era el momento de centralizar en ellos una serie de acciones uy definidas para evitar tentaciones de fuga a otras compañías A los clientes importantes se les ofreció participar en eventos relacionados directa o indirectamente con Iberia, invitaciones a pruebas deportivas, ferias, actuaciones musicales, etc.

211 La Caixa El poder de 6 terabytes de información de clientes
La Caixa cuenta con una base de clientes que supera los 9 millones de clientes. En sus sucursales repartidas (datos de 2005) por toda España que se realizan 9 millones de operaciones de venta de nuevos productos en 6 millones de acta de venta diferentes La Caixa tiene en su base de datos un volumen de información significativa sobre sus clientes de más de 6 terabytes, el activo más preciado La comunicación se personaliza Los abandonos se pueden detectar Inteligencia rentable ... Tiene un plan de marketing para cada cliente

212 Caso práctico: Iberia Si hay algo que produce evidente satisfacción en un cliente de líneas aéreas es ser trasladado, cuando hay plazas disponibles, a un asiento de clase superior por iniciativa directa de la persona que le atiende al facturar su equipaje... O ya dentro de la sala de embarque? Pasar de turista a preferente o business class sin pedirlo expresamente produce un sentimiento de trato especial y diferencia en el viaje, afianzando la relación con la cia que le ofrece ese trato. Hasta ese momento, la decisión de pasar a un cliente a una clase superior dependía de la discrecionalidad del empleado de facturación o un complicado proceso de autorización que eliminaba la inmediatez

213 Caso práctico: Iberia La inteligencia de negocio de Iberia permite que cuando un cliente con tarjeta Iberia Plus factura en el mostrador de facturación aparezcan en pantalla los datos clave del cliente, que informan al instante y a la persona que está atendiendo al pasajero sobre la conveniencia de realizar un cambio gratuito de clase y los mecanismos para una autorización automática. Iberia decide en función de sus propias necesidades de fidelización de clientes, no de forma aleatoria y sin sentido, sino con un fin comercial muy determinado. Potenciar nuevos procesos de negocio Un sistema rentable

214 Prof. Luis Joyanes Aguilar
INGENIERÍA DE ORGANIZACIÓN INDUSTRIAL Inteligencia de Negocios Grupware, Workflow y BPM Curso 2007/08 – 2º C Prof. Luis Joyanes Aguilar 214 214

215 Tecnologías informáticas colaborativas y Sistemas de Apoyo al Grupo (GSS)
Groupwork (Trabajo en grupo) Groupwork con sistemas informáticos Sistemas de apoyo a grupos (GSS) Groupware (Trabajo en grupo..soportan trabajo en grupo) Marco de trabajo Tiempo/Lugar Herramientas para apoyo indirecto a la toma de decisión Herramientas de groupware Herramientas de colaboración en tiempo real Soporte de comunicaciones asincronas Suites (paquetes integrados) de groupware integradas GSS y GDSS Herramientas colaborativas emergentes: De VozIP a Wikis

216 Groupwork Gerentes, directivos,.. Continuamente toman decisiones, diseñan y fabrican productos, desarrollan políticas y estrategias de empresas y negocios, diseñan software, etc. Cuando las personas trabajan en grupo, se dice que hacen trabajo en grupo (groupwork). Groupwork se refiere al trabajo realizado por dos o más personas Características del trabajo en grupo El proceso de toma de decisiones en grupo Los beneficios y las limitaciones del trabajo en grupo

217 Soporte del groupwork con sistemas informáticos
Cuando las personas trabajan en equipo, especialmente cuando los miembros del equipo están en diferentes posiciones y pueden trabajar en diferentes momentos, necesitan comunicarse, colaborar y acceder a un conjunto diverso de fuentes de información en múltiples formatos. Estas características hacen las reuniones, especialmente las virtuales, complejas y con grandes riesgos de pérdida en eficacia en tiempo. Se requieren procesos para conducir las reuniones. Los sistemas informáticos ayudan Se requieren en ocasiones equipos virtuales, expertos externos y mejora en el proceso de toma de decisiones Casi todas las organizaciones, pequeñas y grandes, están utilizando herramientas y métodos para apoyo a las personas que trabajan en equipos o grupos.

218 Visión de conjunto de un GSS
Para que los grupos colaboren eficazmente se requieren métodos y tecnologías de comunicación apropiados. Internet y las redes intranet y extranet son infraestructuras requeridas para comunicación en la colaboración La Web soporta la toma de decisiones y facilita las herramientas de colaboración y el acceso a datos, información y conocimiento desde dentro y fuera de la organización Los sistemas de apoyo a la decisión son soportados por una intranet. Las personas trabajan con herramientas de Internet y con portales de información de empresas, y aplicaciones específicas que gestionan listas de direcciones, , acceso a herramientas y distribución de software Las herramientas informáticas que ayudan al trabajo en grupo se denominan groupware (traducido también por Trabajo en Grupo)

219 Groupware Herramientas informáticas desarrolladas para soportar trabajo en grupo. Las herramientas de trabajo en grupo pueden apoyar a la toma de decisiones directa o indirectamente. P.e. generación de soluciones creativas a problemas es un apoyo directo; programas de correo-e, salas de chats, mensajería instantánea y teleconferencias proporcionan apoyo indirecto. Las herramientas de trabajo en grupo proporcionan mecanismos a los miembros del equipo para compartir opiniones, datos, información, conocimiento y otros recursos

220 Marco de trabajo Tiempo/Lugar
La eficacia de una tecnología informática de colaboración depende de la posición (ubicación) de los miembros del grupo y el momento en que la información compartida se envía y recibe. Comunicación síncrona (en tiempo real). La información se envía y recibe casi simultáneamente (ejemplos: teléfonos, MI, reuniones presenciales) Comunicación asíncrona sucede cuanso el receptor obtiene la información en un momento diferente de cuando se envía, tal como un correo-e. Los emisores y receptores pueden estar en la misma o diferente ubicación

221 Marco de trabajo Tiempo/Lugar
DeSanctis y Gallupe propusieron en 1987 el marco de trabajo para clasificar las tecnologías de apoyo a la comunicación. La comunicación se dividió en cuatro celdas junto con las dimensiones tiempo y lugar: Mismo momento / mismo lugar … reuniones cara a cara Mismo momento / diferente lugar … videoconferencia Diferente momento / mismo lugar ,,, , videoconferencia en difererido, sistemas de gestión de flujo de trabajo Diferente momento/ difernte lugar (cualquier momento, cualquier lugar) … los miembros del equipo están viajando, hay conflictos de agendas, trabajan en diferentes zonas horarias; correo-e, sistemas de flujo de trabajo, videoconferencias con grabaciones en memoria

222 Herramientas para apoyo indirecto en toma de decisiones
Herramientas de groupware: … Herramientas en Microsoft Windows y Office 2007… Otros productos que soportan colaboración y tareas de conferencia en [TURBAN 07: 444] Herramientas sincronas (las comunicaciones se hacen tiempo real): Conferencias Web, MI, VozIP Herramientas asíncronas (las comunicaciones y la colaboración se hace por los participantes en diferentes momentos). Correo-e, wikilogs, espacios de trabajo en línea (groove.net) Sistemas de reunión virtual (p.e. herramientas de webex.com y gotomeeting.com)

223 Herramientas para apoyo indirecto en toma de decisiones
HERRAMIENTAS DE COLABÓRACIÓN EN TIEMPO REAL. Herramientas de soporte de comunicaciones sincronas de información gráfica y de texto. Se utilizan para formación a distancia, demostraciones de producto, soporte a clientes, comercio-e, aplicaciones de ventas, videostreaming Vendedores de herramientas: WebEx

224 Herramientas para apoyo indirecto en toma de decisiones
HERRAMIENTAS DE COLABÓRACIÓN EN TIEMPO REAL Teleconferencias Video-teleconferencias Web-conferencias Pizarras electrónicas interactivas Compartición de pantallas (groove.net ofrece características de compartición de pantallas, facilitando la creación y edición de documentos en un PC) Vídeo instantáneo (al estilo de la mensajería instantánea: MI y VoIP)… Telefonía móvil IP, HSDPA,.. (cuworld.com)

225 Herramientas para apoyo indirecto en toma de decisiones
SOPORTE DE COMUNICACIONES ASINCRONAS Soportadas principalmente por: correo-e y mensajería SMS, MMS, … Blogs Wikis Podcasting Boletines on-linea Portales interactivos Workflow Espacios de trabajo en línea: pantallas en línea que permiten a los usuarios compartir documentos, ficheros, planes de proyectos, calendarios, etc. en el mismo lugar en línea y sin necesidad de ser en el mismo momento: Groove, SharePoint,..

226 Suites integradas de Groupware
Diferentes productos se integran en un único sistema (p.e polycom.com) Groupware normalmente contiene propiedades de: brainstorming electrónica, conferencias o reuniones electrónicas, resolución de conflictos, calendarios, planificaciones, videoconferencias, compartición de documentos, etc Lotus Notes/Domino (ibm.com/software/lotus) Microsoft NetMeeting y Live Meeting Redes Groove de Microsoft (Groove Virtual Office, groove.net) WebEx Meeting Center (webex.com)…pago por uso

227 Tecnologías de colaboración emergentes
Voz sobre IP (VoIP) Sistemas de comunicación que transmiten llamadas de voz sobre redes basadas en el protocolo IP. Las corporaciones están cambiando sus sistemas de teléfonos tradicionales a estándares de Internet par reducir costes y potenciar la eficiencia (Caso: Telefónica I+D sólo utiliza telefonía IP incluso dentro del mismo edificio y planta)… (telefonía gratuita en pc-telephone.com) Beneficios de la VoIP para el negocio y para el usuario (véase informe en Siemens Communication: communications.USA.Siemens.com)

228 Tecnologías de colaboración emergentes
Workflow colaborativo. Productos de software que direccionan tipos de procesos colaborativos y orientados a proyectos. El objetivo de estas herramientas es potenciar el conocimiento de los trabajadores. El objetivo de una solución empresarial para workflow colaborativo está en permitir a los trabajadores comunicarse, negociar y colaborar dentro de un entorno integrado Vendedores de aplicaciones de flujo de trabajo colaborativas: Lotus, EpicData, FileNet y Action technologies

229 Tecnologías de colaboración emergentes
WIKIS (wiki.org) Un Wiki es una pieza de software de servidor disponible en un sitio Web que permite a los usuarios crear y editar libremente contenidos de páginas Web, utilizando cualquier navegador Web. Un wiki soporta hiperenlaces y tiene una sintaxis de texto sencilla para creación de nuevas páginas y enlaces cruzados entre páginas internas en la navegación. Es especialmente idóneo para escritura colaborativa Wiki, se refiere al softwre colaborativo que facilita la operación de un sitio Web wiki.

230 Tecnologías de colaboración emergentes
WIKIS Los wikis se presentan en muchas formas y formatos, uno de ellos es un wikilog. Un wikilog (wikiblog) es una extensión de un blog, que se crea –normalmente- por un individuo (o un pequeño grupo) y puede tener un tablero o pizarra de discusión. Un wikilog es, esencialmente, un blog que permite a cualquier persona participar como un “igual” (peer). Cualquiera puede añadir, borrar o cambiar contenidos. La creación de un wikilog es un proceso colaborativo (más detalles: usemod.com/cgbin/mb.pl?Wikilog)

231 Tecnologías de colaboración emergentes
HUBs de COLABORACIÓN Un modelo de negocio-e B2B, hub de colaboración, que se utiliza por los miembros de una cadena de suministros para mejorar la eficacia entre compañías de fabricación, sus proveedores, … para conseguir reducir inventarios, mejora en la flexibilidad y aumentar la transparencia de la cadena de suministro mediante Internet REDES COLABORATIVAS . Los socios (partners) en negocios de logística, en cualquier punto de una red pueden interactuar unos con otros, directamente, ,,, logility.com PORTALES CORPORATIVOS (de empresas)

232 Groupware . Trabajo en grupo
La finalidad de la tecnología de trabajo en grupo es proporcionar soporte al trabajo de oficina, organización, considerando a éstas como entidades análogas, sólo que el término oficina enfatiza la visión interna de la organización, es decir, el trabajo documental. Este trabajo se desarrolla en su mayor parte de forma cooperativa, por lo que los integrantes de la oficina forman grupos que requieren de una estructura concreta para llevar a término sus cometidos El groupware facilita la interconexión de los participantes de los diferentes grupos al proporcionar la infraestructura tecnológica necesaria para la colaboración, todo ello mediante una serie de herramientas informáticas que se articulan en torno a tres ejes principales de acción: Comunicación, Colaboración y Coordinación

233 Groupware Es una tecnología orientada a grupos; una tecnología que permite a grupos de usuarios trabajar juntos en un entorno de colaboración. Se conoce también como sistemas de automatización de oficinas. La tecnología groupware se ocupa de la colaboración entre personas, abarcando así la complejidad de las interacciones humanas. Proporciona herramientas para solventar problemas sobre colaboración en la organización, tales como los sistemas de apoyo a las decisiones en grupo, sistemas workflow, mensajería electrónica, etc. que se integran con el resto de tecologías que actúan en la organización

234 Groupware . Software colaborativo
Son herramientas, conjunto de programas informáticos, que integran el trabajo en un solo proyecto con muchos usuarios concurrentes que encuentran en diversas estaciones de trabajo, conectadas a través de una red (Internet o intranet) Un programa típico es Lotus de IBM, con la aplicación Lotus Notes relacionado con un servidor Lotus domino Server. El programa que utiliza Wikipedia es un programa informático colaborativo. MS Exchange de Microsoft En líneas generales se considera groupware al software que permite a los usuarios trabajar en grupo

235 Groupware . Software colaborativo
El Groupware se considera fundamentalmente un entorno que integra diversas funciones esenciales para desarrollar el trabajo de diferentes grupos de usuarios. La finalidad del GW es mejorar las funciones de comunicación, colaboración y coordinación de los procesos de la organización para que éstos se realicen de una forma más eficientes, es decir solucionar la problemática del trabajo corporativo

236 Groupware . Software colaborativo
El GW o software colaborativo se puede dividir en tres categorías. Comunicación. Envío de información entre usuarios Colaboración. Basada en el uso compartido de la información. Coordinación. Mediante la integración de la comunicación y la colaboración en un mismo entorno que posibilite un desarrollo más eficiente de los procesos de la organización

237 Groupware . Software colaborativo: Comunicación
Utilización de productos software para el envío entre usuarios de información relacionada con los procesos de la organización (aunque también puede tratarse de información personal) ya que estos se encuentran en un entorno de trabajo en grupo: Estas herramientas de comunicación electrónica envían mensajes, archivos, datos o documentos entre personas y facilitan la compartición de información: (groupware asíncrono) Correo-e Correo de voz Faxing Voice mail Wikis Publicación en web Videoconferencias Chat Redes sociales Mensajería electrónica

238 Groupware . Herramientas de conferencia
Facilitan la colaboración de forma interactiva (colaboración síncrona) Forum de Internet- plataformas de inteernet para facilitar y gestionar mensajes de texto en línea Chat online .plataformas de discusión virtual para facilitar y gestionar mensajes de texto en tiempo real Mensajería instantánea Telefonía Videoconferencia- PCs en red comparten vídeo y señales de audio… sistemas de apoyo a la decisión Compartición de aplicaciones –los usuarios pueden acceder a un documento o apliación compartida en tiempo real

239 Groupware- herramientas colaborativas de gestión (coordinación)
Las herramientas colaborativas de gestión facilitan y gestionan actividades de grupo. Calendarios electrónico (software de gestión) para planificar eventos y notificar automáticamente notificaciones y recordatorios a los participantes “Agenda electrónica” PDAs, teléfonos inteligentes, …. Sistemas de workflow. Gestión colaborativa de tareas y documentos dentro de un proceso de negocios basado en el conocimiento Sistemas de Gestión del conocimiento – recoger, organizar, gestionar y compartir diferentes tipos de información

240 Groupware- herramientas colaborativas de gestión
Sistemas de gestión de proyectos Herramientas de predicciones Sistemas de software social –organizan relaciones sociales de grupos Hojas de cálculo en línea – colaboran y comparten datos e información estructurada Procesadores de texto en línea (Google Docs, Groove de Microsoft,…) Software colaborativo: UseModWiki, Scoop, Commonware, sistemas de escritorio (CVS o RCS)

241 Herramientas de colaboración. Paul Taylor, Financial Times (ft
Herramientas de colaboración. Paul Taylor, Financial Times (ft.com, 22 y 23 de mayo 2008) Nuevos servicios de software basado en navegador, y diseñado para ayudar a planificar reuniones. Los estudios de mercado sugieren que la mayoría de las reuniones de negocio se hacen con personas externas a las empresas organizadoras y la preparación de una reunión con un contacto externo normalmente lleva los intercambios de siete o más correos-e Los planificadores de reuniones están diseñados para hacer más rápidas y fáciles la organización de reuniones con otras personas, bien sea internas o externas a la compañía, en ocasiones, amigos y conocidos. Paul Taylor recomienda las siguientes herramientas.

242 Herramientas de colaboración. Paul Taylor, Financial Times (ft
Herramientas de colaboración. Paul Taylor, Financial Times (ft.com, 22 y 23 de mayo 2008) TimeBridge TimeDriver Jiffle Calgoo (ideal para amgios, familiares y colegas) Tungle (favorita de Paul Taylor)

243 Herramientas de colaboración. Paul Taylor, Financial Times (ft
Herramientas de colaboración. Paul Taylor, Financial Times (ft.com, 22 y 23 de mayo 2008) ¿Cómo puedo compartir mi calendario con colegas en el trabajo? Algunos programas corporativos como Microsoft Exchange y Lotus Domino permiten compartir sus calendarios Compartir calendarios con amigos o familiares externos a la compañía… GRATUITOS Google Calendar Yahoo Calendar CalendarHub ( Otros servicios basados en Web que permite compartir calendarios (30 Boxes) (Airset) (Trumba)

244 Herramientas de colaboración. Paul Taylor, Financial Times (ft
Herramientas de colaboración. Paul Taylor, Financial Times (ft.com, 22 y 23 de mayo 2008) ¿Qué hacer para mantener nuestros programas de calendario existentes? (Yo utilizo Outlook pero mis amigos utilizan Google o Yahoo Calendar) Entonces se necesita un calendario Web 2.0 o servicio de planificación de reuniones. Calgoo y Tunglen permiten a los usuarios continuar utilizando su software favorito y planificar fácilmente reuniones. Calgoo trabaja con Microsoft Outlook, Google Calendar, Apple iCal o 30 Boxes, y Tungle trabaja con la mayoría de los programs de calendario incluyendo Outlook, Google Calendar, iCal y Lotus Notes

245 Otras herramientas colaborativas
Chat (chatroom, canales donde se realiza la interacción, cuartos de charla) MUD (Multi-User Dugeon o Dimension) . Dimensión multi-usuario (parecido al juego de Calabozos y Dragones… o Dragones y Mazmorras, ?..) Se puede interactuar con personas de otras partes del mundo y con personajes virtuales Vision Quest. Permite realizar juntas electrónicas. Entre sus grandes ventajas sobre otros sistemas se encuentra su facilidad de uso. Cualquiera puede conducir una junta electrónica y el sistema puede ser usado de manera dristribuída. Las juntas se pueden realizar con los participantes en el mismo lugar o en diferentes lugares, al mismo tiempo o en tiempos distintos CRUISER. Creación de una comunidad o grupo virtual.

246 Definiciones de Procesos, Procesos de negocio y Wf
Un proceso se puede definir como una serie de actividades , en las que varias entidades (personas, máquinas, etc.) colaboran para conseguir un objetivo concreto. P.e. un proceso típico en una empresa podría consistir en el conjunto de actividades necesarias para responder a una solicitud de compra por parte de un cliente (negociación de precios y fechas de envío, facuración, envío de loos bienes al cliente, etc). El proceso puede ser visto también como una cadena de actividades coherentes que resulta en la creación de valor (ya sea material o inmaterial) para alguien. Esta cadena de actividades se conoce como cadena de valor.

247 Definiciones de Procesos, Procesos de negocio y Wf
Un proceso de negocio es un tipo especial de proceso que describe, desde un punto de vista orientado al mercado, las actividades de una organización. El principal objetivo de los procesos de negocios es satisfacer las necesidades de los clientes. Wf se define como la automatización de un proceso de negocio, total o parcial, durante la cual se pasan documentos, información o tareas de un participante a otro para realizar una acción de acuerdo con un conjunto de reglas de procedimiento. Esta reglas se establecen en la definición del proceso

248 Definiciones de términos BPM, WF, ... [WfMC]
Business Process (Proceso/s de negocio). Un conjunto de uno o más procedimientos enlazados o actividades que realizan colectivamente un objetivo de negocio, u objetivo de política organizacional, normalmente dentro del contexto de una estructura organizacional definiendo roles y relaciones funcionales. Workflow. La automatización de un proceso de negocio, en todo o en parte, durante el cual, documentos, información o tareas se pasan de un participante a otro por acción, de acuerdo a un conjunto de reglas de procedimiento. Estas reglas se establecen en la definición del proceso ... (gestión electrónica de procesos de negocio)

249 Definiciones de términos BPM, WF, ... [WfMC]
Definición de proceso. La representación de un proceso de negocio en un formato que soporta manipulación automatizada, tal como modelado, o representación en un sistema de gestión de flujo de trabajo. La definición de proceso consta de una red de actividades y sus relaciones, criterios para indicar el arranque y terminación del proceso e información acerca de las actividades individuales tales como participantes, aplicaciones de TI y datos asociados, etc.

250 Definiciones de términos [Wikipedia]
Un proceso de negocio es un conjunto de tareas relacionadas lógicamente llevadas a cabo para lograr un resultado de negocio definido. Cada proceso de negocio tiene sus entradas, funciones y salidas. Las entradas son requisitos que deben tenerse antes de que una función pueda ser aplicada. Cuando una función es aplicada a las entradas de un método, tendremos ciertas salidas resultantes. Es una colección de actividades estructurales relacionadas que producen un valor para la organización, sus inversores o sus clientes. Es, por ejemplo, el proceso a través del que una organización ofrece sus servicios a sus clientes

251 Definiciones de términos [Wikipedia]
Los procesos de negocio consisten en subprocesos, decisiones y actividades. Un subproceso es parte un proceso de mayor nivel que tiene su propia meta, propietario, entradas y salidas. Las actividades son partes de los procesos de negocio que no incluyen ninguna toma de decisión ni vale la pena descomponer (aunque ello sea posible). Por ejemplo, “Responde al teléfono”, “Haz una factura” Un proceso de negocio es usualmente el resultado de una Reingeniería de Procesos. El modelado de procesos es usado para capturar, documentar y rediseñar procesos de negocio

252 Definiciones de términos BPM, WF, ... [WfMC]
Business Process Management (no incluida definición en el Glosario de WfMC, pero si aceptada en discusiones internas en 2007]. La práctica de desarrollo, ejecución, medida de prestaciones (desempeño), y simulación de Procesos de Negocio para efectuar (llevar a cabo) la mejora continuada de esos procesos. Gestión de Procesos de Negocios está relacionada (concernida) con el ciclo de vida de la Definición de Proceso Glosario de WfMC "The WfMC glossary", Workflow handbook 1997, John Wiley & Sons, Inc., 1997, ISBN

253 Referencias y recursos
WfMC (Workflow Management Coalition)

254 Workflow Artículo con direcciones de descargas de Windows Sharepoint Introducción para desarrolladores a los flujos de trabajo para Windows SharePoint Services 3.0 y SharePoint Server 2007 Servicio de artículos técnicos de Microsoft en español Servicio de descargas Servicio de descargas de microsoft (en español)

255 Bibliografía [TURBAN et al, 2007] Turban, E., Aronson J.E., Liang T-P. y Sharda, R. (2007)Decision Support and Business Intelligence Systems. Eigth Edition. New Jersey: Pearson/Prentice-Hall. Pp [GONZÁLEZ 2006]. González Lorca, Jesús (2006). Sistemas workflow. Funcionamiento y metodología de implantación. Gijón: Ediciones Trea MORENO, J. J. y JOYANES, L. (2006) 2006 Workflow Handbook. (ed) Layna Fischer. Florida:Future Strategies MORENO, J. J. y JOYANES, L. (2007) 2007 BPM and Workflow Handbook. (ed) Layna Fischer. Florida:Future Strategies

256 Definiciones de términos BPM, WF, ... [WfMC]
Business Process Management (no incluida definición en el Glosario de WfMC, pero si aceptada en discusiones internas en 2007]. La práctica de desarrollo, ejecución, medida de prestaciones (desempeño), y simulación de Procesos de Negocio para efectuar (llevar a cabo) la mejora continuada de esos procesos. Gestión de Procesos de Negocios está relacionada (concernida) con el ciclo de vida de la Definición de Proceso Glosario de WfMC "The WfMC glossary", Workflow handbook 1997, John Wiley & Sons, Inc., 1997, ISBN

257 Referencias y recursos
WfMC (Workflow Management Coalition)

258 Workflow Artículo con direcciones de descargas de Windows Sharepoint Introducción para desarrolladores a los flujos de trabajo para Windows SharePoint Services 3.0 y SharePoint Server 2007 Servicio de artículos técnicos de Microsoft en español Servicio de descargas Servicio de descargas de microsoft (en español)

259 Bibliografía [TURBAN et al, 2007] Turban, E., Aronson J.E., Liang T-P. y Sharda, R. (2007)Decision Support and Business Intelligence Systems. Eigth Edition. New Jersey: Pearson/Prentice-Hall. Pp [GONZÁLEZ 2006]. González Lorca, Jesús (2006). Sistemas workflow. Funcionamiento y metodología de implantación. Gijón: Ediciones Trea MORENO, J. J. y JOYANES, L. (2006) 2006 Workflow Handbook. (ed) Layna Fischer. Florida:Future Strategies MORENO, J. J. y JOYANES, L. (2007) 2007 BPM and Workflow Handbook. (ed) Layna Fischer. Florida:Future Strategies


Descargar ppt "Prof. Luis Joyanes Aguilar"

Presentaciones similares


Anuncios Google