Weka.

Slides:



Advertisements
Presentaciones similares
Internet y tecnologías web
Advertisements

Red Social: “Un millón de Amigos”.
? Es un sistema de gestión de cursos De distribución libre
Tu , un sitio web R e d d e P r o f e s o r e s I n n o v a d o r e s Módulo: Tu , un sitio web.
Microsoft SQL Server 2008 – SQL Server Integration Services
Trabajo de programas de simulación de redes
FLAN “F- LINKS AND NODES”
¿QUÉ SON LAS BASES DE DATOS?
INFOPATH ERIKA SAAVEDRA.
INFOPATH.
UNIVERSIDAD ECOTEC TEMA: INFOPATH
TMiner Data Mining en Java
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
INTRODUCCIÓN A UML Oscar Miguel Alonso Moreno.
Informática empresarial Colegio técnico profesional Las Palmitas
DIAGRAMA DE COMPONENTES INTEGRANTES Córdova Vásquez Giovanny Escobar Alvares Calixto Gomez Quinteros Adelaida Pinto Flores Yarmila.
Principios de diseño de Interfaces Prof. Adelaide Bianchini
 El termino OO, significa que el software es organizado como una colección de objetos. Un objeto es un paquete de software que contiene datos y procedimientos.
INTELIGENCIA DE NEGOCIOS
Curso Básico de Crystal Presentation Design (Departamental Edition) Xcelsius Sesión 4.
InfoPath Ventajas y Uso.
Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar.
Fundamentos de programación
María Gertrudis López1 Yosly Hernández1 Cira Beleño1 Doris Pernalete2
Mt. Martín Moreyra Navarrete.
LabTIG – Facultad de Humanidades – Universidad Nacional del Nordeste Universidad Nacional del Nordeste Facultad de Humanidades CARRERA DE ESPECIALIZACION.
LA IMPORTANCIA DE LAS PyMEs
TIPOS DE SOFTWARE Se denomina software a un programa, equipamiento lógico o soporte lógico necesario para hacer posible la realización de una tarea con.
Fundamentos de bases de datos:
Ing. Elkin José Carrillo Arias
Proceso KDD MSc. Carlos Alberto Cobos Lozada
Ingeniería en Sistemas de Información Diseño de Sistemas (3K1)
PRESENTADO POR: JHENYFER PUENTES ADRIANA LOTE MARCO YEPEZ ROQUE ECHEVARRIA CARLOS ROBLES JAVIER TRUJILLO.
Herramientas de uso libre para el manejo de los datos
Hermilia Molina Acevedo
Ensamblé de computadores
GUTIÉRREZ GRANADOS HÉCTOR DANIEL
INTRODUCCIÓN A GRETL Diana Ruiz Tinajero..
SOFTWARE WITNESS Alumna: Lucia Pantoja Obando. ¿Qué es el software Witness? Es una herramienta de simulación que permite modelar el entorno de trabajo,
Facultad de Ingeniería
Análisis y diseño de sistemas Diagrama de componentes
Bases de Datos.
Sistemas Expertos Integrantes Javier Farfán Katherine Jara Héctor Gatica.
UNIVERSIDAD LATINA III. MANTENIMIENTO Y GESTIÓN DE LA INFORMACIÓN DE UNA BASE DE DATOS. E.I. L.E. Prof. Ramón Castro Liceaga.
Microsoft InfoPath ESTEFANIA FIALLO.
Miguel de Icaza es un desarrollador mexicano de software libre, reconocido por su proyectoGNOME , por su participación en el administrador de archivos Mindnight.
KDD y Técnicas de Minería de Datos en Weka
SHUTTENBORG ACCESS CONOCE LOS PROGRAMAS. Cortés Gamboa Lizzeth
Bases de Datos Unidad 1.
Una base de datos es una colección de información organizada de forma que un programa de ordenador pueda seleccionar rápidamente los fragmentos de datos.
BASE DE DATOS DISTRIBUIDAS
S ISTEMA O PERATIVO P ROCESADOR DE T EXTOS. SOFTWARE El primer elemento de un sistema de computación es el hardware (equipamiento). El SOFTWARE es el.
Visual Basic. Sorange campos Introducción Es uno de los tantos lenguajes de programación que podemos encontrar hoy en día. Dicho lenguaje nace del BASIC.
Introducción a EducaMadrid Francisca García Bernal.
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
 es una aplicación para manejar hojas de cálculo. Este programa es desarrollado y distribuido por Microsoft, y es utilizado normalmente en tareas financieras.
¿Qué es un Mapa Conceptual?
DATA WAREHOUSE.
Sistemas Operativos Universidad Politécnica Territorial de Mérida
GESTIÓN DE RECURSOS BIOLÓGICOS EN EL MEDIO NATURAL
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.

Integrantes Miguel Betancourt Alexis Tacuri.  Activiti es una plataforma para la formación de flujos de trabajo y procesos empresariales dentro del.
UNIVERSIDAD ESTATAL A DISTANCIA DE COSTA RICA ESCUELA DE EDUCACIÓN CURSO TELECOMUNICACIONES EDUCATIVAS I ELABORADO POR: JOHNNY MUÑOZ SALAZAR USO DE LAS.
Para cada uno de los atributos, indicaremos su campo de descripción. Cuando un campo no dispone de este (como el.
DLM Transact SQL Sesión I Introducción al SQL Server Uso de las herramientas de consultas del Transact SQL.
Presentación general Diciembre 2007 MKT-NVO-P-002E.
Curso de programación Visual Chart 6 (1ªEd.)
DOCENTE: CLAUDIA ESTHER DOMÍNGUEZ BRIGIDO CBTIS 242 CUETZALAN DEL PROGRESO, PUE.
Protección de un servicio Web 1.Autenticación. 2.Gestión de usuarios y grupos. 3.Gestión de servicios. 4.Gestión de sistema de ficheros. 5.Firewall. 6.Prevención.
Transcripción de la presentación:

Weka

¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado en la universidad de Waikato en Nueva Zelanda en el año 1993, esta herramienta por su nombre en inglés (Waikato Environment for Knowledge Analysis) además es una herramienta de distribución de licencia GNU-GLP o software libre.

Breve Historia 1993 Inicio del proyecto - Universidad de Waikato. Primer versión en C y TCL/TK. Reimplementación en Java. Cambio de nombre a JAWS (Java WEKA System). Incluía clasificadores, reglas de asociación, filtros y evaluación. Se le agregó selección de atributos. Se le regresó el nombre WEKA. 1997 1998 1999

Características Es un software de fácil acceso por los usuarios ya que está disponible libremente bajo licencia pública GNU- GPL. Tiene un formato especial de entrada de datos arff. (Attribute - Relation File Format). Es una herramienta muy versátil que soporta muchas tareas estándar de la minería de datos en especial tareas de procesamiento de datos, regresión, clasificación, clúster entre otras, así mismo permite la visualización y la selección de los datos.

Ventajas Contiene una gran gama de técnicas para modelado y procesamiento de datos. Es capaz de mostrar los datos en varios tipos de gráficos, con el objetivo de una mejor comprensión y análisis. Funciona en la mayoría de las plataformas actúales.

¿Como usar WEKA? Weka comprende de 3 modos de uso A: Desde la línea de comandos B: Desde las interfaces de usuario C: Creando un programa Java

Campos de Aplicación Weka posee un grupo de técnicas que se pueden aplicar con éxito a múltiples campos, tales como el Marketing, manufactura, salud, energía, finanzas, medicina, entre otros, para su aplicación se debe de tener en cuenta el tipo de tarea que se desea realizar. Con base a la tarea se puede implementar en para dar la solución necesaria en cada uno de estos campos.

GUI de WEKA Weka define 4 entornos para el análisis y extracción de conocimiento a partir de datos: Explorer: entorno visual que ofrece una interfaz gráfica para el uso de paquetes. Experimenter: entorno que permite configurar un conjunto de experimentos completos y complejos de análisis mediante distintos métodos de tratamiento y sobre distintos ficheros de datos. KnowledgeFlow: permite generar proyectos de minería de datos mediante la generación de diagramas de flujos de información. Simple CLI: entorno consola para acceder directamente con java a los paquetes de Weka.

El explorador: se observa, 6 sub-entornos de ejecución: Preprocess: visualización y preprocesado de los datos (aplicación de filtros) Classify: Aplicación de algoritmos de clasificación y regresión Cluster: Agrupación. Associate: Asociación. Select Attributes: Selección de atributos. Visualize: Visualización de los datos por parejas de atributos

Preprocesado: Open File Cargar un archivo arff CSV, C4.5 Ofrece diferentes maneras para cargar las instancias (desde un archivo, proporcionando una URL y desde una base de datos) Open File Cargar un archivo arff CSV, C4.5

Preprocesado Open Url Nos permitirá introducir una dirección en la que definir dónde se encuentra nuestro fichero.

Preprocesado Open DB Con este botón se nos da la posibilidad de obtener los datos de una base de datos. Pasos Definir la url La contraseña El nombre de usuario consulta que queremos realizar.

Preprocesado Aplicación de filtros Una vez que se tienen los datos cargados se pueden aplicar filtros de preprocesamiento. Weka permite aplicar una gran diversidad de filtros sobre los datos, permitiendo realizar transformaciones sobre ellos de todo tipo. Al pulsar el botón Choose dentro del recuadro Filter se nos despliega un árbol en el que seleccionar los atributos o instancias a escoger

Sistema Jerárquico

Conclusión Se pudo lograr ver las características de Weka y se puede decir que es una solución muy completa que incorpora potentes características para la explotación de datos, con características muy similares a otras herramientas de venta comercial y con la ventaja sobre estos de que es una herramienta de acceso libre y completamente gratuito.