Minería de datos Dr. Francisco J. Mata

Slides:



Advertisements
Presentaciones similares
Spokesperson will be Jay Schaudies, Vice President, Global eCommerce.
Advertisements

Maestría en Data Mining
Los Mandatos Tú.
Para empezar Hoy es martes el once de dieciembre Escriba mandatos informales positivos con los verbos en oraciones completas. Modelo- Hervir--> Hierve.
Introducción Programación Matemática Objetivos:
Enchúlame la Máquina SQL Server 2005
Productividad personal Estar al día Colaboración Limitada.
TIBERIUS Predictive Modelling Software
¡Los números! cero 11 once 12 doce 13 trece.
Árboles de decisión Tema 9 Parte teórica Minería de datos
Parte práctica Tema 8 Minería de datos Dr. Francisco J. Mata.
Regresión mínimo cuadrada (I)
VERBS “action words”.
Introducción a JAVA COMP 250. Estructura de Selección selection statements selection statements – Escoger cuál acción ejecutar dependiendo de dos ó más.
Query Direcciones SELECT Nombre, Apellido, Ciudad FROM Direcciones;
Bases de Datos Espaciales SPATIAL QUERY LANGUAGES
Invocar procedimientos almacenados con Microsoft ADO.NET
Plurales y género 1) How to form plurals of nouns and adjectives & 2) How to know if a word is masculine or feminine.
Implementing DDI in the National Institute of Statistics and Geography of Mexico Eric Rodriguez.
ILMC Environment and Safety Advisors Futuri s Ministerio de Medio Ambiente y Recursos Naturales Green Lead Assessment Tool Luis Marroquin Acumuladores.
Curso de Instrumentación
Programación con OpenMP* Intel Software College. Copyright © 2006, Intel Corporation. All rights reserved. Intel and the Intel logo are trademarks or.
Ensayo de Rendimiento DISTRIBUCIÓN DE ESTADÍSTICOS MUESTRALES.
FUNDAMENTOS DE LA TEORÍA DE LA PROBABILIDAD
Examen FRAD Empezar. 1. ¿Cu á l es la diferencia entre FRAD y FRANAR? 1.FRAD son las siglas de un grupo de trabajo de OCLC y FRANAR las siglas de un grupo.
Instrumentación Industrial
Entrada y salida Fundamentos de programación/Programación I
ERASMO AGUILAR SIG FARQ UNI
Cap 1. Introducción (Definiciones y conceptos básicos)
Objetivo 3: Minimizar los Costos de Operación y Administración de las Dependencias y Entidades. En coordinación con lo que establezca el programa de mediano.
GRAFICACIÓN POR COMPUTADORA
Big data analytics for Development
Hoy es lunes, el 21 de octubre. Esponja: ¿Cómo se dice? 1. We dont like to wear sweaters. 2. The girls wear dresses. 3. He wears a t-shirt. 4. I like to.
Programa de las Naciones Unidas para el Desarrollo Youth and political participation Attitudes towards voting and the protest.
Parte 3. Descripción del código de una función 1.
NOMBRES Y ARTÍCULOS. un carro unos carros.
INTRODUCCION MECN 4610 – Automatic Control System Required Pre-requisite(s): MECN 4600 Mechanical Measurements and Instrumentation PROFESOR: AMILCAR RINCON-CHARRIS.
FUNCIONES DE UNA VARIABLE REAL
SQL Base de Datos LENGUAJES DE CONSULTA AR y CR no pueden ser tomados como base para implementar porque: Poseen sintaxis compleja No permiten.
PL/SQL Francisco Moreno Universidad Nacional. Funciones Si un procedimiento tiene solo un parámetro de salida, se puede remplazar por una función y esta.
Dirección de Recursos Humanos
Después de completar esta Lección, será capaz de: Limitar las filas recuperadas por una consulta Ordenar las filas recuperadas por una consulta.
L.E.L.I María de la Luz Solana Delgado
¡Primero mira fijo a la bruja!
Green IT con Microsoft Visio. Nuestra empresa Green IT con Microsoft Visio.
Ildefonso Mas Data Platform Engineer – Area de BI MCTS de SQL Server 2008 BI.
25/11/07Laboratorio de Bases de Datos1 PL/SQL* *Tomado del curso de Francisco Moreno.
Herramientas de Oracle para realizar Tuning de Sentencias SQL
Imperativo Telling people what to do; giving commands Forms: Formal: Familiar: Ud. Tú affirmative Uds. Tú negative Regular & irregular verbs.
ESTRUCTURAS DE CONTROL
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
C++ vs C Los códigos de C++ están copiados de la documentación de PRO1.
SISTEMA DE INFORMACIÓN RETO DE NEGOCIOS SOLUCIONES DE NEGOCIOS ADMINISTRACIÓN TECNOLOGÍA DE LA INFORMACIÓN ORGANIZACIÓN SOSTENER LA VENTAJA COMPETITIVA.
Comparación del poder adquisitivo salarial entre varios países con base en una canasta básica de bienes Comparison of wage purchasing power among several.
Derechos de Autor©2008.SUAGM.Derechos Reservados Sistema Universitario Ana G. Méndez División de Capacitación Basic Quality Tools CQIA Primer Section VII.
Introducción Program Slicing Pattern Matching Problema: Pérdida de precisión Solución Conclusiones Peculiaridades de Erlang Erlang Dependence Graph.
Señales y sistemas de tiempo discreto
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 2) Microsoft SQL Server 2008 R2 Suscribase a
Lógica de Programación COIS 115 Profesor: Gustavo Velez.
Gráficos.
Tema 2 ENTORNO DE LA EMPRESA. Clasificacion.
¿Cómo almacenar datos dentro del computador?
Métodos estadísticos para la gerencia
 Elaboración de la Matriz de Priorización.  Diagrama Matricial.  Diagrama de Procesos.  Diagrama de Flechas. Yépez Chávez Luis.
Free PPT Chart : ALLPPT.com ALLPPT.com _ Free Powerpoint Templates, Diagrams and Charts Text here Add text add text add text add text Text here Add text.
Tema 7 Arreglos Parte 1.
Elaboración de protocolos de calidad de datos
Frecuencia Dado.
THE FAMILY IN THE HOME.
Slope to Car Runout Distance Investigation
Transcripción de la presentación:

Minería de datos Dr. Francisco J. Mata Tema 9 Parte práctica Árboles de decisión Minería de datos Dr. Francisco J. Mata

Árboles de decisión en SQL 2008 Analysis Services Algoritmo híbrido Pureza: entropia por defecto (C4.5) Clasificación y regresión (CART) Outputs categóricos o continuos Minería de datos Dr. Francisco J. Mata

Minería de datos Dr. Francisco J. Mata Ejemplo Output Purchase Bike Input Age Cars Children Commute Distance Education Gender Home Owner Income Marital Status Occupation Region Table Analysis Tool Sample SQL 2005 Analysis Services Excel Add-ins Minería de datos Dr. Francisco J. Mata

Árbol de decisión 3 niveles Minería de datos Dr. Francisco J. Mata

Árbol de decisión (VISIO) Minería de datos Dr. Francisco J. Mata

Minería de datos Dr. Francisco J. Mata Dependencias Minería de datos Dr. Francisco J. Mata

Minería de datos Dr. Francisco J. Mata Dependencias (VISIO) Minería de datos Dr. Francisco J. Mata

Resultados clasificación Clasificado 1 Clasificado 0 Realmente 1 Verdadero positivo Falso negativo Realmente 0 Falso positivo Verdadero negativo Minería de datos Dr. Francisco J. Mata

Minería de datos Dr. Francisco J. Mata Matriz de confusión Falso negativo Falso positivo Minería de datos Dr. Francisco J. Mata

Gráfico de precisión (ROC) ROC: “receiving operating characteristics” A veces llamado como “lift chart” Despliega la sensitividad del modelo Verdaderos positivos entre el total de positivos reales por deciles Requiere una variable binaria Minería de datos Dr. Francisco J. Mata

Gráfico de precisión (ROC) para Purchase Bike=Yes Lift=SUM(Table10[Classify Purchased Bike])/SUM(Table10[Percentile])=115,82% Minería de datos Dr. Francisco J. Mata

Gráfico de ganancia para Purchase Bike=Yes Minería de datos Dr. Francisco J. Mata

Gráfico de ganancia para Purchase Bike=Yes Minería de datos Dr. Francisco J. Mata

Reglas para Purchase Bike=Yes con umbral de probabilidad de 60,74% Age >= 32 and < 39 (68,42% correcto) Age >= 39 and Cars = 1 (60,74% correcto) Minería de datos Dr. Francisco J. Mata