La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Minería de Datos con Clementine SPSS 11.1

Presentaciones similares


Presentación del tema: "Minería de Datos con Clementine SPSS 11.1"— Transcripción de la presentación:

1 Minería de Datos con Clementine SPSS 11.1
SPSS Inc. Minería de Datos con Clementine SPSS 11.1 Clementine es un CONJUNTO DE PROGRAMAS DE MINERÍA DE DATOS QUE PERMITE DESARROLLAR RÁPIDAMENTE MODELOS PREDICTIVOS mediante técnicas empresariales y utilizarlos en operaciones empresariales PARA MEJORAR LA TOMA DE DECISIONES. Con un diseño que sigue el modelo CRISP-DM, estándar del sector, Clementine admite el proceso completo de minería de datos, desde los propios datos hasta obtener los mejores resultados empresariales. Copyright 2006 SPSS Inc.

2 CARACTERISTICAS GENERALES (1)
SPSS Inc. CARACTERISTICAS GENERALES (1) Arquitectura Módulos Client Server Batch. Compatibilidad Entornos Windows Entornos Unix (solo servidor) Desarrollado en Java CLEMENTINE CLIENT. Clementine Client es una VERSIÓN COMPLETAMENTE FUNCIONAL del producto que SE INSTALA Y EJECUTA EN EL EQUIPO DE ESCRITORIO DEL USUARIO. ESTA VERSIÓN SE PUEDE EJECUTAR EN MODO LOCAL COMO UN PRODUCTO INDEPENDIENTE O EN MODO DISTRIBUIDO junto con Clementine Server para mejorar el rendimiento a la hora de trabajar con grandes conjuntos de datos. CLEMENTINE SERVER. Clementine Server SE EJECUTA ININTERRUMPIDAMENTE EN MODO DE ANÁLISIS DISTRIBUIDO junto con una o varias instalaciones cliente, lo que ofrece un MAYOR RENDIMIENTO CUANDO SE TRABAJA CON GRANDES CONJUNTOS DE DATOS, ya que las operaciones que requieren un uso intensivo de la memoria se pueden realizar en el servidor SIN TENER QUE DESCARGAR DATOS EN EL EQUIPO CLIENTE. Clementine Server también ofrece compatibilidad con la optimización SQL, procesamiento en modo por lotes y la posibilidad de realizar el modelado en la base de datos, lo que ofrece ventajas adicionales de rendimiento y automatización. Debe existir al menos una instalación de Clementine Client o Clementine Batch para ejecutar un análisis. CLEMENTINE BATCH. Clementine Batch es una VERSIÓN ESPECIAL DEL CLIENTE que se ejecuta en modo por lotes únicamente, ofreciendo soporte para TODAS LAS CAPACIDADES ANALÍTICAS DE CLEMENTINE, PERO SIN EL ACCESO A LA INTERFAZ DE USUARIO HABITUAL. Esto permite realizar tareas repetitivas o cuya ejecución sea de larga duración sin tener que intervenir el usuario y sin la presencia de la interfaz de usuario en pantalla. A diferencia de Clementine Client, que puede ejecutarse como un producto independiente, la licencia de Clementine Batch sólo puede obtenerse y utilizarse junto con Clementine Server. Copyright 2006 SPSS Inc.

3 CARACTERISTICAS GENERALES (2)
SPSS Inc. CARACTERISTICAS GENERALES (2) Licencias Software propietario de IBM. Licencia no gratuita (payware). Complementos Solution Publisher Text Mining for Clementine Web Mining for Clementine CLEMENTINE SOLUTION PUBLISHER es un componente complementario que PERMITE A LAS ORGANIZACIONES PUBLICAR RUTAS DE CLEMENTINE PARA SU USO FUERA DEL ENTORNO ESTÁNDAR DE CLEMENTINE. Las rutas publicadas se pueden EJECUTAR MEDIANTE LA APLICACIÓN CLEMENTINE SOLUTION PUBLISHER RUNTIME, que se puede distribuir e implementar según sea necesario. Solution Publisher se instala junto con Clementine Client, pero precisa de una LICENCIA INDEPENDIENTE para activar su funcionalidad. TEXT MINING FOR CLEMENTINE es un complemento totalmente integrado en Clementine que UTILIZA TECNOLOGÍAS DE LINGÜÍSTICA AVANZADA Y NLP (Neuro-Linguistic Programming) PARA PROCESAR CON RAPIDEZ UNA GRAN VARIEDAD DE DATOS DE TEXTO SIN ESTRUCTURAR, EXTRAER Y ORGANIZAR LOS CONCEPTOS CLAVE Y AGRUPARLOS EN CATEGORÍAS. Las categorías y conceptos extraídos se puede combinar con los datos estructurados existentes, como pueden ser datos demográficos, y se pueden aplicar para modelar utilizando el conjunto completo de herramientas de minería de datos de Clementine para tomar decisiones mejores y más certeras. WEB MINING FOR CLEMENTINE es un módulo complementario que permite que los analistas realicen ANÁLISIS EN WEB PREDICTIVOS AD HOC DESDE DENTRO DE LA INTERFAZ DE FLUJO DE TRABAJO VISUAL E INTUITIVA DE CLEMENTINE. Respaldado por la tecnología probada NetGenesis de análisis en Web, el módulo Web Mining for Clementine TRANSFORMA DATOS WEB SIN PROCESAR EN EVENTOS EMPRESARIALES PREPARADOS PARA SU ANÁLISIS QUE PERMITEN SEGMENTAR USUARIOS, COMPRENDER LOS RECORRIDOS Y LAS AFINIDADES QUE TRAZAN LOS USUARIOS AL EXPLORAR EL SITIO Y PRONOSTICAR LA PROPENSIÓN DE LOS USUARIOS A CONVERTIR, COMPRAR O COMERCIAR CON ACCIONES. Copyright 2006 SPSS Inc.

4 CARACTERISTICAS GENERALES (3)
SPSS Inc. CARACTERISTICAS GENERALES (3) Integración Oracle Data Miner IBM DB2 Intelligent Miner Microsoft Analysis Services 2005 Documentación Manual de usuario Manual de algoritmos Manual de aplicaciones Manual de CRISP-DM Demos Clementine admite la INTEGRACIÓN CON HERRAMIENTAS DE MODELADO Y MINERÍA DE DATOS disponibles en proveedores de bases de datos como ORACLE DATA MINER, IBM DB2 INTELLIGENT MINER Y MICROSOFT ANALYSIS SERVICES Podrá GENERAR, PUNTUAR Y ALMACENAR MODELOS DENTRO DE LA BASE DE DATOS, TODO DESDE LA APLICACIÓN CLEMENTINE. Esto permite combinar las capacidades analíticas y la facilidad de uso de Clementine con la potencia y el rendimiento de una base de datos, al mismo tiempo que se saca partido de los algoritmos nativos de bases de datos proporcionados por estos proveedores. Copyright 2006 SPSS Inc.

5 INTERFAZ DE USUARIO CLIENTE
SPSS Inc. INTERFAZ DE USUARIO CLIENTE Organizador Armado de Ruta Selección de Nodos Copyright 2006 SPSS Inc.

6 METODOLOGIA CRISP-DM SPSS Inc.
Esta herramienta presenta una ORIENTACIÓN A LA UTILIZACIÓN DE LA METODOLOGÍA CRISP-DM PARA LA ELABORACIÓN DE LOS PROYECTOS. Clementine permite crear proyectos mediante la metodología CRISP-DM y ORGANIZAR TODOS LOS COMPONENTES (RUTAS, RESULTADOS, MODELOS, ETC) que se van creando en sus distintas etapas, simplemente ARRASTRÁNDOLOS A SU CARPETA CORRESPONDIENTE. Incluso pese a que algunas fases no impliquen generalmente trabajar en Clementine, la herramienta de proyectos incluye las seis fases de CRISP, lo cual permite disponer de una ubicación central para el almacenamiento y el seguimiento de todos los componentes asociados con el proyecto. Además, ES POSIBLE AGREGAR DISTINTOS TIPOS DE DOCUMENTOS (como pdf, word, etc), los cuales pueden ser muy ÚTILES, ESPECIALMENTE CUANDO NOS REFERIMOS AL ENTENDIMIENTO DEL NEGOCIO, donde los componentes que se incluyan probablemente sean distintos documentos que lo describan. Copyright 2006 SPSS Inc.

7 ENTRADAS SPSS Inc. Copyright 2006 SPSS Inc.
Aquí se detallan algunas de las posibles entradas de datos que permite la herramienta: Excel El nodo de importación Excel importa datos de cualquier versión de Microsoft Excel. No es necesario un origen de datos ODBC. Enterprese View El nodo Enterprise View permite crear y mantener una CONEXIÓN ENTRE UNA SESIÓN DE CLEMENTINE Y ENTERPRISE VIEW EN UN SPSS PREDICTIVE ENTERPRISE REPOSITORY COMPARTIDO. Al hacerlo, es posible leer datos de Enterprise View en una ruta de Clementine y empaquetar un modelo de Clementine en un escenario al que pueden acceder otros usuarios del repositorio compartido. Archivo var. El nodo Archivo variable lee datos desde los ARCHIVOS DE TEXTO DE CAMPO LIBRE: campos cuyos registros contienen un. Este nodo resulta también útil para los archivos con texto de cabecera de longitud fija y determinados tipos de anotaciones. NÚMERO CONSTANTE DE CAMPOS, PERO UN NÚMERO VARIADO DE CARACTERES Archivo fijo El nodo archivo fijo importa datos desde ARCHIVOS DE TEXTO DE CAMPO FIJO; esto es, archivos cuyos campos NO ESTÁN DELIMITADOS PERO EMPIEZAN EN LA MISMA POSICIÓN Y TIENEN UNA LONGITUD FIJA. Los datos heredados o generados por la máquina se suelen almacenar en formato de campo fijo. Archivo SAS El nodo importar SAS importa datos SAS a Clementine. SAS es otra poderosa herramienta de data mining. Base de datos El nodo Base de datos se puede utilizar para IMPORTAR DATOS DESDE OTROS PAQUETES MEDIANTE ODBC (del inglés, Open Database Connectivity), incluidos MS Access, dBASE, SAS (sólo la versión NT), Oracle, Sybase, Microsoft SQL Server, DB2, etc. Para leer una base de datos o escribir en ella, es NECESARIO TENER UN ORIGEN DE DATOS ODBC INSTALADO Y CONFIGURADO PARA LA BASE DE DATOS EN CUESTIÓN, así como contar con los permisos de lectura o escritura necesarios para ello. Data Access Pack de SPSS incluye un conjunto de controladores ODBC que pueden usarse a tal efecto Archivos SPSS Puede utilizar el nodo de importación de SPSS para leer los datos directamente desde un archivo de SPSS guardado (.sav). Copyright 2006 SPSS Inc.

8 OPERACIONES CON DATOS Operaciones con Registros Operaciones con Campos
SPSS Inc. OPERACIONES CON DATOS Operaciones con Registros Operaciones con Campos Aquí se muestran todas las operaciones con los datos (registros y campos) que se pueden realizar con Clementine. Estas operaciones son de inmensa utilidad durante las fases del entendimiento y preparación de los datos de CRISP-DM. OPERACIONES CON REGISTROS Seleccionar El nodo Seleccionar SELECCIONA O DESCARTA UN SUBCONJUNTO DE REGISTROS de la ruta de datos en función de una condición específica. Muestrear El nodo Muestrear recorta el tamaño del conjunto de datos según los parámetros que establezca. Resulta útil para reducir un conjunto de datos de gran tamaño mediante la selección de una muestra aleatoria para generar un modelo o el entrenamiento de una red neuronal. Agregar El nodo Agregar REEMPLAZA UNA SECUENCIA DE REGISTROS DE ENTRADA CON REGISTROS DE SALIDA AGREGADOS Y RESUMIDOS. Ordenar Los nodos Ordenar organizan registros en orden ascendente o descendente atendiendo a los valores de uno o varios campos. Fundir El nodo Fundir toma VARIOS REGISTROS DE ENTRADA Y CREA UN REGISTRO DE SALIDA ÚNICO QUE CONTIENE TODOS O ALGUNOS DE LOS CAMPOS DE ENTRADA. ES ÚTIL PARA FUSIONAR DATOS DESDE DIFERENTES ORÍGENES, como datos de clientes internos y datos demográficos adquiridos. Distinguir El nodo Distinguir se puede usar para eliminar registros duplicados pasando el primero de los registros distintos a la ruta de datos o descartando el primer registro y pasando cualquier duplicado a la ruta de datos en su lugar. OPERACIONES CON CAMPOS Tipo El nodo Tipo ESPECIFICA PROPIEDADES Y METADATOS DE CAMPO. Por ejemplo, puede especificar un TIPO DE USO (RANGO, CONJUNTO, CONJUNTO ORDENADO O MARCA) PARA CADA CAMPO, ESTABLECER LAS OPCIONES PARA GESTIONAR VALORES PERDIDOS Y NULOS DEL SISTEMA, establecer el papel de un campo con fines de modelado (LA CLASE), especificar las etiquetas de valor y campo y especificar los valores de un campo. Filtro El nodo Filtro filtra (DESCARTA) CAMPOS, VUELVE A NOMBRAR campos y establece asociaciones de un nodo de origen a otro. Derivar El nodo Derivar MODIFICA LOS VALORES DE DATOS O CREA CAMPOS NUEVOS DESDE UNO O MÁS CAMPOS EXISTENTES. Crea campos del tipo fórmula, marca, conjunto, estadísticos, recuento y condicional. Rellenar El nodo Rellenar SUSTITUYE VALORES DE CAMPOS y cambia el almacenamiento. Puede sustituir los valores en función de una condición CLEM, como También puede sustituir todos los espacios vacíos o valores nulos por un valor específico. Un nodo Rellenar suelen utilizarse junto con un nodo Tipo para sustituir valores perdidos. Intervalos El nodo Intervalos CREA AUTOMÁTICAMENTE NUEVOS CAMPOS DE CONJUNTOS EN FUNCIÓN DE LOS VALORES DE UNO O MAS CAMPOS DE RANGOS NUMÉRICOS existentes. Por ejemplo, puede transformar un campo de ingresos de escala en un campo categórico nuevo que contenga grupos de ingresos como desviaciones desde la media. Partición El nodo de partición GENERA UN CAMPO DE PARTICIÓN, QUE DIVIDE LOS DATOS EN SUBCONJUNTOS DIFERENTES PARA LAS FASES DE ENTRENAMIENTO, COMPROBACIÓN Y VALIDACIÓN en la generación del modelo. Transformación de SPSS El nodo Transformación de SPSS permite llevar a cabo TRANSFORMACIONES DE DATOS UTILIZANDO LA SINTAXIS DE COMANDOS DE SPSS, LO QUE PERMITE LLEVAR A CABO LAS TRANSFORMACIONES QUE NO ADMITE CLEMENTINE Y AUTOMATIZAR TRANSFORMACIONES COMPLEJAS que requieren varios pasos, incluida la creación de varios campos desde un único nodo. Copyright 2006 SPSS Inc.

9 MODELADO Módulo Base Módulo de Asociación Módulo de Clasificación
SPSS Inc. MODELADO Módulo Base Módulo de Asociación Módulo de Clasificación Módulo de Segmentación El MÓDULO BASE de Clementine incluye una selección de los NODOS ANALÍTICOS QUE SE UTILIZAN CON MAYOR FRECUENCIA y que permitirá iniciar a los clientes en la minería de datos. Se admite una enorme gama de TÉCNICAS DE MODELADO, entre las que se incluyen la CLASIFICACIÓN (ÁRBOLES DE DECISIÓN), SEGMENTACIÓN O CONGLOMERADOS, ASOCIACIÓN Y MÉTODOS ESTADÍSTICOS: La REGRESIÓN LINEAL es una técnica de estadística común utilizada para resumir datos y realizar PRONÓSTICOS AJUSTANDO UNA SUPERFICIE O LÍNEA RECTA QUE MINIMICE LAS DISCREPANCIAS existentes entre los valores de salida reales y los pronosticados. ----- El MÓDULO CLASIFICACIÓN ayuda a las organizaciones a PRONOSTICAR UN RESULTADO CONOCIDO, como saber si un cliente comprará o se irá, o si una transacción se ajusta a un patrón conocido de fraude. Las técnicas de modelado INCLUYEN APRENDIZAJE AUTOMÁTICO DE LAS MÁQUINAS (REDES NEURONALES), ÁRBOLES DE DECISIÓN (INDUCCIÓN DE REGLAS), IDENTIFICACIÓN DE SUBGRUPOS, MÉTODOS ESTADÍSTICOS Y GENERACIÓN DE VARIOS MODELOS: C5.0: Este nodo utiliza el ALGORITMO C5.0 para generar un ÁRBOL DE DECISIÓN O UN CONJUNTO DE REGLAS. Los modelos C5.0 dividen la muestra en función del campo que ofrece la máxima ganancia de información. Las distintas submuestras definidas por la primera división se vuelven a dividir, por lo general basándose en otro campo, y el proceso se repite hasta que resulta imposible dividir las submuestras de nuevo. Por último se vuelven a examinar las divisiones del nivel inferior, y se eliminan o podan las que no contribuyen significativamente con el valor del modelo. Es una VARIANTE DEL ALGORITMO C4.5 QUE OFRECE MEJORAS en cuanto a: VELOCIDAD, MEMORIA, ARBOLES MAS PEQUEÑOS, ETC. El MÓDULO SEGMENTACIÓN se recomienda en aquellos casos en los que se DESCONOCE EL RESULTADO ESPECÍFICO (por ejemplo a la hora de detectar nuevos patrones de fraude o de identificar grupos de interés en la base de clientes). Los modelos de conglomerados se centran en la identificación de grupos de registros similares y en el etiquetado de registros según el grupo al que pertenecen: REDES NEURONALES KOHONEN (redes tipo SOM). Sirven para CLUSTERING CUANDO NO SE CONOCEN LOS GRUPOS A PRIORI. El MÓDULO ASOCIACIÓN es el más útil si se desean pronosticar varios resultados; por ejemplo, los clientes que adquirieron el producto X también adquirieron Y y Z. Los algoritmos de reglas de asociación ENCUENTRAN DE FORMA AUTOMÁTICA LAS ASOCIACIONES (REGLAS) que se podrían detectar de forma manual mediante técnicas de visualización: El nodo A PRIORI extrae un conjunto DE REGLAS DE LOS DATOS y DESTACA AQUELLAS REGLAS CON UN MAYOR CONTENIDO DE INFORMACIÓN (UTILIZA CONFIANZA Y SOPORTE). A priori ofrece cinco métodos diferentes para la selección de reglas y utiliza un sofisticado esquema de indización para procesar eficientemente grandes conjuntos de datos. El nodo SECUENCIA (utilizado en la elaboración del TP) extrae reglas de secuencia (utilizando también confianza y soporte), pero además incluye la utilización de registros de forma transaccional y la posibilidad de incluir una marca de tiempo en el análisis que permita acotar el tiempo entre eventos que se están analizando. El nodo SELECCIÓN DE CARACTERÍSTICAS filtra los campos predictores para su eliminación en función de un conjunto de criterios (como el porcentaje de valores perdidos); a continuación, CLASIFICA EL GRADO DE IMPORTANCIA DEL RESTO DE PREDICTORES DE ACUERDO CON UN OBJETIVO ESPECÍFICO. Por ejemplo, a partir de un conjunto de datos dado con cientos de predictores potenciales, ¿cuáles tienen mayor probabilidad de ser útiles para el modelado de resultados de pacientes? Copyright 2006 SPSS Inc.

10 VISUALIZACION (SALIDAS)
SPSS Inc. VISUALIZACION (SALIDAS) Estas son unas pocas de las tantas salidas graficas que proporciona la herramienta para: Comprender mejor los tipos de datos y las distribuciones Manipular registros y campos previo a las operaciones de modelado Comprobar la distribución y las relaciones entre campos recién derivados. Apoyo al modelado MALLA  Los nodos Malla muestran la FUERZA DE LAS RELACIONES ENTRE LOS VALORES DE DOS O MÁS CAMPOS CATEGÓRICOS. El gráfico muestra las conexiones usando varios tipos de líneas para indicar la fuerza de conexión. Puede utilizar un nodo Malla, por ejemplo, para explorar las relaciones existentes entre la compra de varios artículos en un sitio de comercio electrónico o un punto de venta al por menor tradicional. GRAFICO Los nodos Gráfico muestran la RELACIÓN ENTRE LOS CAMPOS NUMÉRICOS. Puede crear un gráfico con puntos (también denominado diagrama de dispersión), o puede utilizar líneas. Puede crear tres tipos de gráficos de líneas especificando un valor de Modo para X en el cuadro de diálogo. HISTOGRAMA Los nodos Histograma MUESTRAN OCURRENCIA DE VALORES DE LOS CAMPOS NUMÉRICOS. Se suelen utilizar para explorar los datos antes de las manipulaciones y la generación de modelos. Al igual que con el nodo Distribución, con frecuencia los nodos de histogramas se utilizan para detectar desequilibrios en los datos. EVALUACIÓN El nodo de diagrama Evaluación ofrece una FORMA SENCILLA DE EVALUAR Y COMPARAR MODELOS PREDICTIVOS PARA ELEGIR EL MEJOR MODELO PARA SU APLICACIÓN. Los diagramas de evaluación MUESTRAN EL COMPORTAMIENTO DE LOS MODELOS PRONOSTICANDO DETERMINADOS RESULTADOS. Funcionan ordenando los registros en función del valor pronosticado y confianza del pronóstico, dividiendo los registros en grupos de igual tamaño (cuantiles), y a continuación, dibujando el valor del criterio de negocios de cada cuantil, del más alto al más bajo. EL GRÁFICO MUESTRA MÚLTIPLES MODELOS COMO LÍNEAS INDEPENDIENTES. Copyright 2006 SPSS Inc.

11 SPSS Inc. DEMO Para esta sección, imagine que es un investigador médico que está recopilando datos para un estudio. Ha recopilado información sobre un conjunto de pacientes, de los cuales todos sufrieron la misma enfermedad. Durante el curso del tratamiento, cada paciente respondió a un medicamento de un total de cinco. Parte de su trabajo consiste en utilizar la minería de datos para averiguar qué medicamento es el adecuado para un futuro paciente con la misma enfermedad. 1) Orígenes -> Archivo var. (selecciono archivo Drug1n y acepto) Una vez que ha cargado el archivo de datos, puede echar un vistazo a los valores para ver el número de registros. Esto se puede hacer generando una ruta que incluya un nodo Tabla: 2) Resultados -> Tabla (selecciono y acepto) Durante el proceso de minería de datos, resulta útil examinar los datos mediante la creación de resúmenes visuales. Clementine ofrece varios tipos diferentes de gráficos para seleccionar, según el tipo de datos que desea resumir. Por ejemplo, para averiguar qué proporción de pacientes respondió a cada medicamento, utilice el nodo Distribución. 3) Gráficos -> Distribución (selecciono campo Drug y ejecuto) También es útil un grafico que permita auditar los datos 4) Resultados -> Auditar datos (le doy ejecutar por defecto) Ahora, veamos los factores que pueden influir en Droga, la variable objetivo. Como algunos campos de datos son categóricos, puede intentar representar un gráfico de malla, que establece asociaciones entre distintas categorías. 5) Gráficos -> Malla (Selecciono BP y Drug como campos) Como investigador, sabe que las concentraciones de sodio y potasio en la sangre son factores importantes. Como se trata de valores numéricos, puede crear un diagrama de dispersión de sodio frente a potasio utilizando las categorías de medicamento como una superposición de colores. 6) Gráficos -> Grafico (Campo X: Na, Campo Y: K, Color: Drug) Como el cociente de sodio-potasio parece que pronostica cuándo utilizar el medicamento Y, puede derivar un campo que contenga el valor de este cociente para cada registro. Este campo será de utilidad posteriormente cuando genere un modelo para pronosticar cuándo se debe utilizar cada uno de los cinco medicamentos. 7) Oper. con Campos -> Derivar (nombre: Na_K, formula: Na/K, muestro calculadora) Puede comprobar la distribución del nuevo campo si conecta un nodo Histograma al nodo Derivar. 8) Gráficos -> Histograma (selecciono campo: Na_K, Color: Drug) Durante la exploración y manipulación de los datos, ha formulado algunas hipótesis. El cociente sodio-potasio en sangre parece influir en la elección del medicamento, al igual que la presión sanguínea. Sin embargo, aún no se pueden explicar todas las relaciones. Aquí es donde puede que el modelado nos dé la respuesta. En este caso, deberá intentar ajustar los datos mediante un modelo que crea reglas, el C5.0. 9) Oper. con Campos -> Filtro (selecciono flechas de K y Na) 10) Oper. con Campos -> Tipo (selecciono Drug, le doy Salida en la última columna) 11) Modelado -> C.50 (ejecutamos) Podemos ver el modelo generado, resultados y en la parte de VISOR la forma del árbol. Se puede evaluar la precisión del modelo utilizando un nodo de análisis. 12) Resultados -> Análisis (ejecutar) Copyright 2006 SPSS Inc.

12 FIN


Descargar ppt "Minería de Datos con Clementine SPSS 11.1"

Presentaciones similares


Anuncios Google