DataMining Desarrolladores: Keyla Ferreira CI

Slides:



Advertisements
Presentaciones similares
INVESTIGACIÓN DE MERCADOS
Advertisements

ESTADISTICA A ESTADISTICA A UNMSM - FQIQ
Data Mining Minería de Datos Universidad Tecnológica Metropolitana
ESTRATEGIA E-BUSINESS
El impacto de la Informática en la Epidemiología y en la Gerencia en Salud Esta conferencia estudia y analiza los procesos de cambio operados en la Epidemiología.
PLAN ESTRATÉGICO Introducción 1.- Definición.
Fundamentos de Diseño de Software INFT.1
C OB I T Control Objectives for Information and Related Technology Information Systems and Control Foundation.
Introducción a la minería de datos
Metodología de la Investigación Social
DATA MINING MINERIA DE DATOS Gersom Costas.
“Existen dos tipos de personas, las que hacen el trabajo y
MUESTREO (NAGA´s) BOLETÍN 5020
UNIDAD III: Semana No. 23 MARCO METODOLÓGICO
Evaluaciones de Sistemas de Administración de la Seguridad SMSA
SEGMENTACION DE MERCADOS
METRICAS DE PROCESO Y PROYECTO
Data Mining Integrantes: Rojas Correa, Trinidad Romanskyy, Bohdan
K-NN: K vecinos más cercanos
AUDITORIA DE LA ADMINISTRACIÓN DE RECURSOS HUMANOS
ADMINISTRACIÓN DE TECNOLOGIAS DE INFORMACIÓN Y COMUNICACIÓN
Contabilidad FINANCIERA
Investigación de Operaciones en Comercio Electrónico
El proceso de extracción de conocimiento
MÉTODOS DE ANÁLISIS FINANCIEROS
Escuela de Administración Información para la toma de decisiones
VIVIANA ACHURY S. ANGIE NATALIA GARCIA S.. En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos (Bajo.
Investigación en acción
POLÍTICA DE PRECIOS.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Muestra: Recolección de Datos: Análisis de Datos:
Trabajo de Investigación
MUESTRA Implica DEFINIR la unidad de análisis (personas, situaciones, individuos, eventos, fenómeno, ensayo)
Metodología Investigación Científica
Recursos humanos y responsabilidad social corporativa
INTELIGENCIA DE MERCADOS
Estadística Administrativa II
INTELIGENCIA DE NEGOCIOS
VII Reunión sobre casos prácticos de inspección y vigilancia de mercados y entidades. Santiago de Chile Marcelo García R Sonia Muñoz C. Santiago, 17 de.
TÉCNICA MULTIVARIABLE / DEPENDENCIA
Business Intelligence y Data Mining
DATA WAREHOUSE Equipo 9.
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
Data Mining aplicado a promociones en tarjetas de crédito/débito Diego Rafael Gómez Izquierdo Universidad de Palermo
La Información en las Organizaciones. Datos Externos Datos Internos Datos Personales Data Mining Data Warehouse Data Marts Meta Data OLAP Queries DSS.
Grupo Continental Control de Procesos.
1 TEMA 1: NECESIDAD DE LA INFORMACIÓN PARA LA TOMA DE DECISIONES EN LA EMPRESA Las bases de datos ocupan un lugar determinante en cualquier área. No sólo.
ERICK CISNEROS SAAVEDRA GABRIELA REGULES GUTIÉRREZ Datamining.
“Introducción a las Ciencias de la Informática”
FUNDAMENTOS DE SISTEMAS DE INFORMACIÓN DE MERCADOTECNIA. 1.1 Conceptos
INTEGRANTES: CALVIMONTES NOGALES DANIELA QUIROGA HINOJOSA CLAUDIA.
INGENIERÍA DEL SOFTWARE GESTIÓN DE PROYECTOS
SEGMENTACION DE MERCADOS
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
Generalidades Autor: Yohn Jair Palacios Fecha: octubre 23 de 2013.
LOS SISTEMAS DE INFORMACIÓN INVESTIGACIÓN DE MERCADOS
KDD y Técnicas de Minería de Datos en Weka
Análisis y Diseño de Aplicaciones
SOLUCIONES EMPRESARIALES
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Minería de Datos MC BEATRIZ BELTRÁN MARTÍNEZ FACULTAD DE CIENCIAS DE LA COMPUTACIÓN. Primavera 2016.
DATA MINING. Extracción de información oculta y predecible de grandes bases de datos Poderosa tecnología que ayuda a concentrase en la información importante.

Taller de investigación 1
TEMA II EL PROCESO DE LA PLANEACION. 1.Pasos en el proceso de planeación.
Investigación de Mercados Internacional. Investigación de mercados es la recopilación, registro y análisis de datos con la finalidad de obtener información.
Extracción de conocimiento a partir de Recursos Digitales para el Aprendizaje Mtro. Alfredo Zapata González Escuela Superior de Informática.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
Transcripción de la presentación:

DataMining Desarrolladores: Keyla Ferreira CI.- 19.335.368 Enrique Buono CI.- 19.223.511

Agenda Proceso de Extracción de Conocimiento Minería de Datos - Data Mining Conceptos e Historia Los Fundamentos del Data Mining Principales características y objetivos de la Minería de Datos El alcance de Data Mining Una arquitectura para Data Mining Fases de un Proyecto de MD Filtrado de datos Selección de variables Algoritmos de Extracción de Conocimiento Interpretación y evaluación Aplicaciones de Uso En el Gobierno En la Empresa En la Universidad En Investigaciones Espaciales En los Clubes Deportivos CONCLUSIÓNES

Proceso de Extración del Conocimiento En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos, debido básicamente al gran poder de procesamiento de las máquinas como a su bajo costo de almacenamiento.

Minería de Datos – Data Mining Conceptos e historia Una definición tradicional es la siguiente: “Un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos” (Fayyad y otros, 1996). El data mining es una tecnología compuesta por etapas que integra varias áreas y que no se debe confundir con un gran software. Reúne las ventajas de varias áreas como la Estadística, la Inteligencia Artificial, la Computación Gráfica, las Bases de Datos y el Procesamiento Masivo, principalmente usando como materia prima las bases de datos.

Fundamentos del Data Mining Las técnicas de Data Mining son el resultado de un largo proceso de investigación y desarrollo de productos Data Mining está listo para su aplicación en la comunidad de negocios porque está soportado por tres tecnologías que ya están suficientemente maduras: 1.- Recolección masiva de datos. 2.- Potentes computadoras con multiprocesadores. 3.- Algoritmos de Data Mining.

Principales características y objetivos 1.- Explorar los datos que se encuentran en las profundidades de las bases de datos. 2.- Los datos se consolidan en un almacén de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet. 3.- El entorno de la minería de datos. 4.- Las herramientas de la minería de datos 5.- El minero 6.- Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados. 7.- Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente. 8.- La minería de datos produce cinco tipos de información: * Asociaciones. * Secuencias. * Clasificaciones. * Agrupamientos. Pronósticos.

Alcance de Data Mining El nombre de Data Mining deriva de las similitudes entre buscar valiosa información de negocios en grandes bases de datos Dadas bases de datos de suficiente tamaño y calidad, la tecnología de Data Mining puede generar nuevas oportunidades de negocios al proveer estas capacidades: 1.-Predicción automatizada de tendencias y comportamientos. 2.-Descubrimiento automatizado de modelos previamente desconocidos.

Arquitectura para Data Mining Para aplicar mejor estas técnicas avanzadas Data Mining, éstas deben estar totalmente integradas con el data warehouse así como con herramientas flexibles e interactivas para el análisis de negocios. El Data warehouse analítico resultante puede ser aplicado para mejorar procesos de negocios en toda la organización, en áreas tales como manejo de campañas promocionales, detección de fraudes, lanzamiento de nuevos productos, etc. El punto de inicio ideal es un data warehouse que contenga una combinación de datos de seguimiento interno de todos los clientes junto con datos externos de mercado acerca de la actividad de los competidores.

Fases de un Proyecto de MD Los pasos a seguir para la realización de un proyecto de minería de datos son siempre los mismos, independientemente de la técnica específica de extracción de conocimiento usada. El proceso de minería de datos pasa por las siguientes fases: * Filtrado de datos. * Selección de Variables. * Extracción de Conocimiento. * Interpretación y Evaluación.

Filtrado de Datos El formato de los datos contenidos en la fuente de datos, nunca es el idóneo, y la mayoría de las veces no es posible ni siquiera utilizar ningún algoritmo de minería sobre los datos en bruto. Mediante el preprocesado, se filtran los datos, se obtienen muestras de los mismos, o incluso se reducen el número de valores posibles.

Selección de Variables La selección de características reduce el tamaño de los datos eligiendo las variables más influyentes en el problema, sin apenas sacrificar la calidad del modelo de conocimiento obtenido del proceso de minería. Los métodos para la selección de características son básicamente dos: 1.- Aquellos basados en la elección de los mejores atributos del problema. 2.-Aquellos que buscan variables independientes mediante tests de sensibilidad, algoritmos de distancia o heurísticos.

Algoritmos de Extracción de Conocimineto Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. De igual manera pueden usarse varias técnicas a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un preprocesado diferente de los datos.

Interpretación y Evaluación Una vez obtenido el modelo, se debe proceder a su validación, comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema.

Aplicaciones de Uso Cada año el data mining se ha ido incorporando a la vida de empresas, gobiernos, universidades, hospitales y diversas organizaciones que están interesadas en explorar sus bases de datos y sacar provecho de ellas.

En el Gobierno El FBI analizará las bases de datos comerciales para detectar terroristas. A principios del mes de julio de 2002, el director del Federal Bureau of Investigation (FBI), John Aschcroft, anunció que el Departamento de Justicia comenzará a introducirse en la vasta cantidad de datos comerciales referentes a los hábitos y preferencias de compra de los consumidores, con el fin de descubrir potenciales terroristas antes de que ejecuten una acción.

En la Empresa Detección de fraudes en las tarjetas de crédito. En 2001, las instituciones financieras a escala mundial perdieron más de 2.000 millones de dólares estadounidenses en fraudes con tarjetas de crédito y débito. El Falcon Fraud Manager es un sistema inteligente que examina transacciones, propietarios de tarjetas y datos financieros para detectar y mitigar fraudes.

En la Empresa Hábitos de compra en supermercados. Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. Prediciendo el tamaño de las audiencias televisivas. La British Broadcasting Corporation (BBC) del Reino Unido emplea un sistema para predecir el tamaño de las audiencias televisivas para un programa propuesto, así como el tiempo óptimo de exhibición.

En la Universidad Conociendo si los recién titulados de una universidad llevan a cabo actividades profesionales relacionadas con sus estudios. Se hizo un estudio sobre los recién titulados de la carrera de Ingeniería en Sistemas Computacionales del Instituto Tecnológico de Chihuahua II, en Méjico (Rodas, 2001). Se quería observar si sus recién titulados se insertaban en actividades profesionales relacionadas con sus estudios y, en caso negativo, se buscaba saber el perfil que caracterizó a los exalumnos durante su estancia en la universidad.

En Investigaciones Espaciales Proyecto SKYCAT. El sistema Sky Image Cataloguing and Analysis Tool (SKYCAT) se basa en técnicas de agrupación (clustering) y árboles de decisión para poder clasificar los objetos en estrellas, planetas, sistemas, galaxias, etc. con una alta confiabilidad .

En los Clubes Deportivos Los equipos de la NBA utilizan aplicaciones inteligentes para apoyar a su cuerpo de entrenadores. El Advanced Scout es un software que emplea técnicas de data mining y que han desarrollado investigadores de IBM para detectar patrones estadísticos y eventos raros.

Conclusiones El Data Mining es una técnica de extracción de información valiosa. El Data Mining no se debe confundir con un software, aunque integre varias áreas. En el Data Mining se busca que de los datos emerjan hipótesis. El Data Mining requiere tecnología adecuada y una buena organización de los datos para garantizar su óptimo desempeño. El usuario del Data Mining puede tener o no un alto conocimiento de programación para aplicar esta técnica. El Data Mining y los Almacenes de Datos están fuertemente relacionados, en lo que arquitectura se refiere. Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados. El Data Mining puede ser aplicado en distintos entornos como: el gobierno, la empresa, la universidad, los deportes, etc.

¿Preguntas?