A este grupo de personas que tenemos aquí…

Slides:



Advertisements
Presentaciones similares
Creación de un Blog… Pues bienvenido al tutorial donde aprenderás como crear un blog en Blogger paso a paso. Te explicaremos cada paso a seguir para la.
Advertisements

TEMA 4 COMBINATORIA.
PRINCIPIOS DE ESTADÍSTICAS INFERENCIALES PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS.
Sistema de ecuaciones 2x2. Recordemos lo visto en las clases anteriores…
Ecuaciones diferenciales No homogéneas Método de coeficientes indeterminados. Por 4n93L.
Diseños de investigación.  Arnau (1995a) define el diseño de investigación como un plan estructurado de acción que, en función de unos objetivos básicos,
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
Master en Recursos Humanos Análisis de Conglomerados (Cluster Analysis): prácticas con SPSS Ana María López Área de Metodología de las Ciencias del Comportamiento.
MICROSOFT ACCESS. Definición de una Base de Datos: un programa que permite gestionar y organizar una serie de datos. Por ejemplo, para la gestión de los.
Escala de Medición. Profesor: Bachiller: Ramón Aray Parababire Claribel C.I.: Barcelona, Agosto del 2017 Instituto Universitario Politécnico.
Capitulo 3 Análisis descriptivo inferencial: comparaciones de muestras
Guía 10: Los Números Reales
Lineamientos informales para un buen diseño
Instituto Nacional de Estadística y Geografía
PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS
EXPOSITOR L.C. EDUARDO M. ENRÍQUEZ G.
Editor de Planillas de Cálculo Introducción al análisis de gráficos
El módulo de Servicio Estudiantiles se encuentra dentro del sistema Herramientas para Alumnos ( Para iniciar sesión en HA es necesario.
UNIVERSIDAD NACIONAL DE CAÑETE
En INCERTIDUMBRE No se conocen las probabilidades de ocurrencia de los estados naturales, por lo tanto, hay que recurrir a criterios empíricos para tomar.
PROPORCIONALIDAD 2º ESO
Statistic Package for Social Sciencies
Las barras blancas son los témpanos que forman los cluster, son los separadores de las observaciones y en consecuencia “agrupan visualmente”
Transferencia de Datos
FUNCIONES EN EXCEL 2007.
Serie: Cómo hacer con EpiInfoTM
Fuente:
MANEJO DE ARCHIVOS DIGITALES
Muestreo. El muestreo es un tópico sumamente importante en los modelos mixtos de investigación y tradicionalmente se ha clasif cado en dos tipos principales.
TEMA II. ESTUDIO DE MERCADO 2.2 El muestreo estadístico en la investigación de mercados. Métodos de pronósticos de corto plazo.
ANALISIS DE DATOS CUANTITATIVOS
MUESTREO ESTRATIFICADO
Estadística Conceptos Básicos L.A. y M.C.E. Emma Linda Diez Knoth.
PLAN DE MUESTREO.
Introducción ACTIVIDAD: magnitudes Conceptos:
Climogramas: elaboración e interpretación
TABLAS DINÁMICAS Tablas dinámicas son una excelente forma de resumir, analizar, explorar y presentar los datos. Tablas dinámicas son muy flexibles y se.
Conceptos y Procedimiento
Metodologías para Gestión de Proyectos
UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ
Climogramas: elaboración e interpretación
Objetivo de la clase: Resolver ecuaciones de primer grado con una incógnita.
Universidad Peruana de Ciencias Aplicadas Matemática Básica (C.C.) Sesión 13.1 Ciclo
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
Muestreo por Conglomerados Muestreo por Conglomerados en etapa 1 y 2.
PRECISIÓN y EXACTITUD.
TABLAS DINÁMICAS Tablas dinámicas son una excelente forma de resumir, analizar, explorar y presentar los datos. Tablas dinámicas son muy flexibles y se.
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
Proyecto "Las mascotas" Informática 6° Básico.
Depto. Matemáticas – IES Elaios Tema: Estadística Inferencial 1. MUESTREO ALEATORIO Presentación elaborada por el profesor José Mª Sorando, ampliando y.
GRADO DE CONFIANZA DE LA INFERENCIA Es la probabilidad de que el valor real del parámetro poblacional se encuentre dentro de los límites especificados.
Depto. Matemáticas – IES Elaios Tema: Estadística Inferencial 1. MUESTREO ALEATORIO Presentación elaborada por el profesor José Mª Sorando, ampliando y.
Makeitrational Pequeño tutorial de la versión demo
CICLOS EN JAVA FOR, WHILE, DO WHILE Un ciclo en Java o bucle en Java (como prefieras llamarlo) permite repetir una o varias instrucciones cuantas veces.
CLASIFICACIÒN 23/02/ pequeñas y accesibles Salvo en poblaciones muy pequeñas y accesibles nunca se observan a todas las unidades de la población.
Análisis de la toma de decisiones. Fundamentos para la toma de decisiones:  Definir los problemas  Recopilar datos  Generar opciones  Elegir un curso.
MÉTODO SIMPLEX. Ejemplo de Simplex: Vamos a resolver el siguiente problema: MaximizarZ = f(x 1,x 2 ) = 3x 1 + 2x 2 Sujeto a:2x 1 + x 2 ≤ 18 2x 1 + 3x.
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
Contraste de hipótesis Comparación de más de 3 grupos Kruskal-Wallis
Transformar variables
UNIVERSIDAD CATOLICA DE TRUJILLO BENEDICTO XVI ESTADÍSTICA Ms. Ylder Heli Vargas Alva Presentación de los datos: barras, circular,
Se dispone de N individuos, con información sobre n variables.
MEDIDAS DE DISPERSIÓN “Medidas de dispersión”. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Mg. Homero Ango Aguilar Mg. Jimmy Homero Ango Bedriñana Población, Muestra y Unidad de Análisis Universidad Nacional San Cristóbal de Huamanga Curso de.
Problema nº 3: Circunferencias
01/08/ Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.
MICROSOFT ACCESS. Definición de una Base de Datos: un programa que permite gestionar y organizar una serie de datos. Por ejemplo, para la gestión de los.
Olimpiada Mátemática SAEM Thales
Proceso de la investigación de mercado
EXCEL INTERMEDIO FILTROS AVANZADOS – TABLA DINAMICA – AUDITORIA DE FORMULAS JORGE LUIS AGUILAR ALCALDE.
Transcripción de la presentación:

A este grupo de personas que tenemos aquí… … les mediremos una serie de atributos de tipo métrico, y conforme a estos atributos vamos a clasificar, o distribuir, a estas personas (o entidades muestrales) en grupos o categorías de tal forma que dentro de cada grupo las unidades muestrales sean lo más homogénea posible, y entre los grupos estas unidades, comparativamente, sean lo más heterogénea posibles.

La información que requeriremos de estas 21 personas es la siguiente… Salir de compras es divertido Salir de compras afecta el presupuesto Al salir de compras aprovecho de comer fuera Al salir a comprar trato de hacer las mejores No me importa salir de compras Al salir de compra voy a ahorrar si comparo precios. De una escala del 1 al 7, donde 1 es desacuerdo y 7 de acuerdo, de su grado de conformidad a las siguientes aseveraciones…

Atributos Variables divertido presupuesto aprovecho buenacompra Salir de compras es divertido Salir de compras afecta el presupuesto Al salir de compras aprovecho de comer fuera Al salir a comprar trato de hacer las mejores No me importa salir de compras Al salir de compra voy a ahorrar si comparo precios. presupuesto aprovecho buenacompra noimporta ahorro

Los datos obtenidos son los siguientes…

Debemos definir una medida de “similitud”, puesto que esta medida de similitud nos puede entregar una pauta para formar conglomerados (cluster) homogéneos. ¿Qué “distancia” hay entre el caso i y el caso j?

La distancia euclídea entre el caso 1 y el caso 2 es: [(6 – 2)2 + (4 – 3)2 + (7 – 1)2 + (3 – 4)2 + (2 – 5)2 + (3 – 4)2]1/2 = 8 Nota: se pueden utilizar otras “distancias”. A menor distancia mayor similaridad

¿Cómo se forman los conglomerados? Diremos entonces que dos casos serán “similares” si su distancia es “pequeña” Se forman los conglomerados en base de esta similaridad. Cada caso es en si un comglomerado, se comparan estos conglomerados mediante la medida de similaridad. Se forma un nuevo conglomerado formado por los dos casos más similares. Con estos conglomerados (uno menos que en el paso anterior) se miden las similaridades entre pares de casos, y se elige el de mayor similaridad, para formar un nuevo conglomerado. Y así se continua hasta llegar a un solo conglomerado. Este proceso se llama procedimiento jerárquico Veamos un ejemplo

Supongamos que tenemos 7 casos, etiquetados desde la A hasta la G, y hemos calculado la distancia euclídea entre ellos, y que se entrega en el siguiente cuadro:

Nuevo conglomerado

Nuevo conglomerado G se combina con E pero E ya está combinado con F

Nuevo conglomerado Se selecciona C y D para el nuevo conglomerado (podría haber sido B y C, se decide en forma arbitraria)

Nuevo conglomerado Se selecciona C y B y como C ya está con D, se forma el conglomerado B - C – D.

Se selecciona B y E y puesto que ambos son de conglomerados distintos se fusionan ambos conglomerados Nuevo conglomerado

Se selecciona A y B y se forma el último conglomerado Nuevo conglomerado

¿Cuántos conglomerados elegir? Promedio entre las distancia E a F Promedio entre las distancias EF, FG y EF Promedio conjunto entre los conglomerados (C-D) y (E-F-G) Promedio conjunto entre los conglomerados (B-C-D) y (E-F-G) Promedio del conglomerado (B-C-D-E-F-G) Promedio del conglomerado (A-B-C-D-E-F-G)

¿Cuántos conglomerados elegir? Nº ideal La medida de similitud crece a medida que disminuyen los conglomerados. De otra forma “grandes aumentos” en esta medida cuando se forma un nuevo conglomerado nos indica que los nuevos conglomerados no son tan similares No hay grandes cambios, cada conglomerados es homogéneo Esta medida indica un cambio brusco, el nuevo conglomerado que entró no es tan homogéneo

Vamos a resolver nuestro problema original de las personas que van de compras

Vamos a resolver nuestro problema original de las personas que van de compras Se seleccionan las variables métricas de manera habitual en el software

En el software se eligen estas dos opciones como estudio preliminar en las opciones “estadísticos” y “Método”

Esta tabla muestra como los casos son “aglomerados” en cada etapa del análisis de cluster.

Etapa Los conglomerados o cluster se van formando por la combinación de casos y conglomerados en cada etapa, hasta llegar a un solo conglomerado.

Etapa En cada etapa un caso o cluster es unido a otro caso o cluster.

Los casos 5 y 11 se unen en un conglomerado en la etapa 6

Cuando conglomerados o casos son unidos, el nuevo cluster es etiquetado con el número menor de etiqueta de los dos cluster.

La columna de coeficientes indica la distancia entre los dos cluster o casos en cada etapa. La “distancia” es la elegida según el método

Tres cluster permanecen después de la etapa 18 Tres cluster permanecen después de la etapa 18. Lo indicado es formar 3 cluster como solución Aquí hay un “salto súbito” en la creación de un nuevo cluster “buena solución”

Esta parte de la tabla muestra la etapa en que aparece por primera vez un cluster. Y los valores “0” indican que el cluster es aún un “caso” El cluster 6 (que ya no es un “caso”) apareció por primera vez en la etapa 3, y volverá a aparecer en la etapa 11.

Ahora, si hemos decidido formar tres cluster o conglomerados, dando las instrucciones pertinentes al software deberá aparecer esta solución de pertenencia. Esto es, las personas que tienen las “etiquetas” {1, 3, 6, 7, 8, 12, 15, 17 y 21} pertenecen al conglomerado 1. Las personas etiquetadas con {2, 5, 9, 11, 13, y 20} pertenecen al conglomerado 2. Y las personas etiquetadas con {4,10,14,16,18 y 19} pertenecen al conglomerado 3.

amarretes pasotas cachondos 1 2 4 3 5 6 7 8 9 10 11 12 13 14 15 16 17 Cuidan presupuesto Buscan mejor compra Pasan de todo Les da lo mismo 8 que 80 Divertidos innovadores amarretes pasotas cachondos 1 2 4 3 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

Cachondos Pasotas Amarretes