Un Enfoque de Clustering basado en PSO Asistido

Slides:



Advertisements
Presentaciones similares
INTEGRANTES: NOVOA TAFUR, EINSTEIN MANUEL RODRÍGUEZ POSTIGO, JULIO CESAR.
Advertisements

PRINCIPIOS DE ESTADÍSTICAS INFERENCIALES PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS.
KRONOGRAMA Ikastetxearen txostena eta Hobekuntza plana.
Práctica Docente en la Universidad Pedagógica de El Salvador Universidad Pedagógica de El Salvador “Dr. Luis Alonso Aparicio”
 E Expresión de un problema de programación lineal  A Aplicaciones de la programación lineal  S Soluciones de un problema de programación lineal.
Vibraciones en sistemas físicos Autor: Tadeusz Majewski.
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
GENERALIDADES DEL TRABAJO ESTADÍSTICO La Estadística es una de las ramas de la Matemática de mayor universalidad, ya que muchos de sus métodos se han desarrollado.
Mapas conceptuales. Luis Carlos Armero Eraso. Fisioterapia.
Estimación de la distribución de las variables
Erick Daniel Wolf Chacón SANTO DOMINGO-ECUADOR 2014
UNIVERSIDAD DEL ISTMO PROGRAMA DE MAESTRÍAS Y POSGRADOS MÓDULO “TECNOLOGÍA Y COMUNICACIÓN EDUCATIVA” ELABORADO POR: SÁNCHEZ BEITIA, JOSELYN
Instituto Nacional de Estadística y Geografía
PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS
Sofía Sibilia y Silvina Sayago
PROYECTO FINAL DE CARRERA Ingeniería Aeronáutica DESARROLLO DE OPTIMIZADOR DE FORMA 2D BASADO EN CÓDIGO DE ELEMENTOS FINITOS CON MALLADOS CARTESIANOS.
Pedro Letelier Patricio Contreras
GRAFICAS DE CONTROL X-R
Píldoras de programación en PDV.
“POLIMORFISMO PARAMETRICO”

Etapas de una investigación
Carlos Grandi1, Ligia Nascente2, Viviane C. Cardoso3
Análisis de Flujos Metabólicos
UACJ IIT Universidad Autonóma de Ciudad Juárez
ESTADÍSTICA II Ing. Danmelys Perozo MSc.
Acerca del uso de métricas de calidad de Wikipedia
CONCEPTOS BASICOS ESTADISTICA.-Conjunto de métodos que nos permiten tomar decisiones en momentos de incertidumbre (duda). Tiene como objetivo que la información.
METODOLOGÍA DE GESTIÓN DE PROYECTOS
ESTADÍSTICA UNIDIMENSIONAL
Encuesta de satisfacción del Estudiantes 2014
TIPO DE DATOS EN ACCESS 2010 TEXTO, MEMO, NUMERO, FECHA/HORA, MONEDA, AUTONUMERACION, SI/NO, OBJETO OLE, HIPERVINCULO, DATOS ADJUNTADOS, CALCULADO Y ASISTENTES.
Estadística Generalidades y diseño de investigación.
ESTADISTICAS APLICADA A PESQUERIAS Avances sobre el “Estudios de una metodología para el calculo del tamaño de muestra en la pesquería artesanal de la.
CAPÍTULO 4: OPERACIONES DE PIXEL
Evaluación del proyecto El proceso de evaluaci ó n consiste en un ejercicio de an á lisis de la pertinencia, eficacia, eficiencia e impacto del proyecto.
DEPRESIÓN Y RESILIENCIA EN MUJERES CON CÁNCER DE MAMA
Búsqueda tabú INTEGRANTES: JESSICA PINTA MICHELLE TORRES.
Métodos de búsqueda. Introdución Esta operación se utiliza basicamente para recuperar datos que se habian almacenado con anticipación. El resultado puede.
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
Capítulo 7. (Bernal, 2005) Procesos de Investigación Científica Sección 7.11 Procesamiento de la Información. Datos.
 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las.
Autores: Ñauñay Colcha Jorge Luis Bravo Maldonado Paulo Dennis
El problema de la medición en psicología.
Identificación de los efectos de los diseños experimentales.
Localización y planeación de trayectorias
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
La estadística podría definirse como la ciencia que se encarga de recopilar, organizar, procesar, analizar e interpretar datos con el fin de deducir las.
Titulo de la comunicación – Arial 24
MEDIDAS DE DISPERSION absolutas y relativas. INTRODUCCION La estadística es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos.
URBINA GUADARRAMA GILBERTO MORENO CONTRERAS TANGANXOAN ZUANGUA
Titulo de la comunicación – Arial 20
Teorías sobre comunidades de plantas
Titulo de la comunicación – Arial 24
cencia/mmcc/docs/temageneticos.p df /algoritmo-genetico
REGRESIONINTERPOLACION Los Métodos Numéricos Métodos mas utilizados Ajuste de Curvas.
Para la adecuada interpretación de estas graficas existen ciertos criterios a evaluar:
Informacion estadistica Para cada tabla ●Cardinalidad (n° de filas) ●Factor de bloques (n° de filas que caben en un bloque) ●N° de bloques ocupados ●Método.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
ALGORITMO FFT Ing. José Arturo Marín Thames 2018.
Capitulo 1 Introducción y recolección de datos 1.
INFORMACION GENERAL DE OBJETO DE APRENDIZAJE Bibliografía Autor Competencia Tema INICIO Facultad de Ingeniería Mexicali – Agosto 2009 Optimizado para Microsoft.
INFORMACION GENERAL DE OBJETO DE APRENDIZAJE Bibliografía Autor Competencia Tema INICIO Facultad de Ingeniería Mexicali – Agosto 2009 Optimizado para Microsoft.
UNIVERSIDAD PRIVADA SAN JUAN BAUTISTA FILIAL CHINCHA ESCUELA PROFESIONAL DE INGENIERÍA DE COMPUTACIÓN Y SISTEMAS Por: Nestares Torres Luis Jesús Enrique.
Conjunto de programas contenidos en un núcleo o kernel que efectúan la gestión de los procesos básicos de un Sistema informático, y permite la normal.
COMPORTAMIENTO ESCOLAR DE UNA GENERACIÓN DE LA LICENCIATURA EN DERECHO INTERNACIONAL EN LA UNIDAD ACADEMICA PROFESIONAL CUAUTITLAN IZCALLI (UAEM)
Guías Modulares de Estudio Cálculo diferencial – Parte B.
VARIANZA Y Y COVARIANZA DE VARIABLES ALEATORIAS Estadística II MI. MARTHA PAMELA RAMÍREZ VELA ITESM CAMPUS SALTILLO 1.
∆ 2 AlCl 3 Al 2 O 3 Reacción global Mensurando % Pureza Al = Cantidad de óxido de aluminio Cantidad de cloruro de aluminio x 100 masa Al 2 O 3 (g) masa.
Transcripción de la presentación:

Un Enfoque de Clustering basado en PSO Asistido por Información de Clustering Inicial Carlos Velázquez, Leticia Cagnina y Marcelo Errecalde  LIDIC. Departamento de Informática. Universidad Nacional de San Luis carvear20@yahoo.com.ar,{lcagnina,merreca}@unsl.edu.ar

El algoritmo CLUDIPSO PSO discreto Registra dos valores importantes: gbest y pbest Las partículas evolucionan con sólo dos ecuaciones Cada clustering válido es representado por una partícula Función a ser optimizada: Coeficiente de Silueta

Pseudo-Código de CLUDIPSO Para cada ejecución hacer Crear e inicializar la población de partículas (S); Repetir Para cada partícula i de S Hacer Actualizar Velocidad Actualiza la Posición Fin Hacer Registra la mejor posición Personal (Pbest) Registra la mejor posición Global (Gbest) Cálculo del Coeficiente de Silueta Mientras ¬(Cantidad de Ciclos) Fpara

Partícula de CLUDIPSO

Hibridización de CLUDIPSO Objetivos: Evitar la búsqueda “ciega” en las primeras iteraciones Obtener información inicial con poco esfuerzo computacional Sortear inconvenientes con colecciones grandes de textos cortos Mejorar los resultados obtenidos con la versión original

Características de las colecciones utilizadas Colección |DOC| |T| |G| R6 536 53494 6 R8B 816 71842 8 JRC-Acquis 563 1424074

Plataforma Weka – Método EM Utilizado para obtener la semilla con el primer clustering Se fijaron los valores por defecto Ejecutado con pocas iteraciones

Características de las ejecuciones 50 partículas 10000 iteraciones Factor Personal Ω1 y Social de aprendizaje Ω2 fijados en 1.0 pm_min = 0.4 pm_max = 0.9 Factor de Inercia w = 0.9 30 ejecuciones independientes

Resultados Obtenidos La calidad fue evaluada y comparada a través de la medida externa F-Measure Algoritmo Mínimo Máximo CLUDIPSO (Colección: R6) 0,26 0,38 CLUDIPSO Híbrido (Colección: R6) 0,48 0,51 CLUDIPSO (Colección: R8B) 0,18 0,25 CLUDIPSO Híbrido (Colección: R8B) 0,37 0,42 CLUDIPSO (Colección: JRC) 0,33 CLUDIPSO Híbrido (Colección: JRC) 0,50 0,55

Análisis Estadístico

Conclusiones y trabajos futuros Se obtienen mejores resultados con la versión Hibridizada para las 3 colecciones (R6, R8B. JRC-Acquis). La distribución de los datos muestra que, en la mayoría de los casos, la dispersión de los mismos es similar en ambas versiones. Se comparará la version Hibridizada contra CLUDIPSO* Estos resultados obtenidos y CLUDIPSO Híbrido pero sin el uso de la mutación.

!Gracias! ¿Preguntas?