Experimentación Numérica

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
Introducción a la Inferencia Estadística
Inferencia estadística
Test de Hipótesis.
PRUEBA DE HIPOTESIS Denominada también prueba de significación, tiene como objetivo principal evaluar suposiciones o afirmaciones acerca de los valores.
Contraste de Hipótesis
Grupo 4 Matías Melgar Pablo Carbonell
Inferencia Estadística
La prueba U DE MANN-WHITNEY
puede o no ser verdadero, relativo a una o más poblaciones.
PRUEBAS DE HIPOTESIS HIPOTESIS
Estimación por intervalos de confianza.
Prueba de Hipótesis La Prueba t Carlos B. Ruiz-Matuk.
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Estimación por Intervalos de confianza
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Clase 5 Hipótesis de diferencias de grupos
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Unidad VI: PRUEBAS DE HIPOTESIS
CHI-CUADRADO Y DISTRIBUCION NORMAL
Clases 4 Pruebas de Hipótesis
@ Angel Prieto BenitoMatemáticas 2º Bachillerato CS1 TIPOS DE ERRORES Tema 14.4 * 2º BCS.
Diseño Estadístico y Herramientas para la Calidad
Unidad V: Estimación de
UNIVERSIDAD INCA GARCILASO DE LA VEGA

Parte II. Algorítmica. 3. Algoritmos voraces.
INTERVALO DE CONFIANZA
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Distribuciones derivadas del muestreo
Estadística Administrativa II
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
Unidad V: Estimación de
EXPERIMENTACIÓN NUMÉRICA
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Clase 4a Significancia Estadística y Prueba Z
Inferencia Estadística
Análisis y diseño de experimentos
Experimentación Numérica
Unidad V: Estimación de
Sobre los parámetros de la población Facultad de Ingeniería, División de Ciencias Básicas Bernardo Frontana, Irene Valdez /
Capítulo 1. Conceptos básicos de la Estadística
COMPARACION DE MEDIAS Para comparar media utilizando la prueba T hay Ttres opciones diferentes utilizando contrastes de hipotesis sobre : PARA UNA MUESTRA.
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005.
Instituto Tecnológico De Villahermosa Alumno: Lázaro García Hernández.
Pruebas de hipótesis.
Routing Problem.  Elección de Prueba de Hipótesis  Prueba de Hipótesis  Datos de Entrada  Resultados de la Prueba  Conclusiones.
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
CISO 3155: Capítulo 91 Evaluando los promedios de dos grupos distintos Capítulo 9.
PRUEBA DE HIPÓTESIS DE LA DISTRIBUCIÓN “Z” PARA DOS PROPORCIONES.
Aspectos generales de la investigación educativa en el SNIT
INFERENCIA ESTADÍSTICA
Pruebas de hipótesis para una muestra
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
CAPACITACIÓN, INVESTIGACIÓN, ESTADÍSTICA Y MERCADEO
DISTRIBUCIÓN “t” DE STUDENT
RESUMEN DE LA DISTRIBUCION MUESTRAL PARA LA MEDIA MUESTRAL X INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL  TIPO DE PROBLEMA ESPERANZA Y VARIANZA.
PRUEBAS DE HIPÓTESIS Y ESTIMACIÓN.  Constituyen el proceso relacionado con aceptar o rechazar declaraciones acerca de los parámetros de la población.
Estadística Inferencial
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
DISTRIBUCION “T” DE STUDENT
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Dijkstra Su nombre se refiere a Edsgers Dijkstra, quien lo describió por primera vez en 1959.
Transcripción de la presentación:

Experimentación Numérica 2012

Presentación de algoritmos Variables de Respuesta Agenda Objetivo Presentación de algoritmos Variables de Respuesta Planeación de Experimento Planeación del Trabajo Experimental Ejecución de los Experimentos Análisis de los Resultados Interpretación de los Resultados Conclusiones Referencias

La experimentación numérica y el sentido de su existencia. Objetivo La experimentación numérica y el sentido de su existencia. Definir qué algoritmo es el mejor en términos de: Tiempo de ejecución Gasto de recursos (menor gastos de memoria) Permitiendo el balanceo de carga de forma eficiente, para uso futuro. Nuestra experimentación numérica tendrá como base, el uso de un estadístico de prueba.

Giancarlo Algoritmos Tabú Requiere de una solución inicial. En nuestro caso esta solución dependerá de un algoritmo heurístico - Voraz. Luego de obtener la solución inicial se precede a una mejora de esta, por lo que se procede a realizar los movimientos obteniéndose varias soluciones aspirantes a ser la mejor solución que proporcione la minimización de la función objetivo. Para esto se utilizo las siguientes variables: F(X) : Función objetivo(minimización) S: Espacio de soluciones: x>0 ϵ R N(X): Vecindario = Las soluciones posibles a elegir T(X): Lista Tabú = Soluciones no elegibles en la iteración (Soluciones visitadas) A(X, k): Conjunto de aspirantes o candidatos = Soluciones que tienen algún atributo que las hace elegibles.

Andre Algoritmos Floyd

Algoritmo Dijkstra Christian Es un algoritmo para la determinación del camino más corto dado un vértice origen al resto de vértices en un grafo con pesos en cada arista. La idea subyacente en este algoritmo consiste en ir explorando todos los caminos más cortos que parten del vértice origen y que llevan a todos los demás vértices; cuando se obtiene el camino más corto desde el vértice origen, al resto de vértices que componen el grafo, el algoritmo se detiene

DIJKSTRA (Grafo G, nodo_fuente s) para u ∈ V[G] hacer distancia[u] = INFINITO padre[u] = NULL distancia[s] = 0 adicionar (cola, (s,distance[s])) mientras que cola no es vacía hacer u = extraer_minimo(cola) para todos v ? adyacencia[u] hacer si distancia[v] > distancia[u] + peso (u, v) hacer distancia[v] = distancia[u] + peso (u, v) padre[v] = u adicionar(cola,(v,distance[v]))

Variables de respuesta Gustavo Variables de respuesta Estos serán los indicadores que nos muestren el performance de los algoritmos Las variables de respuesta para la comparación de los algoritmos serán las siguientes: T: Tiempo total de procesamiento de información C: Costo total de procesamiento de información, relacionado al tiempo

Problemas presentados antes de la experimentación Algoritmo Floyd

Planeación del experimento Gustavo Planeación del experimento Primera Hipótesis: Experimento 1 El algoritmo “Tabú” obtiene un menor tiempo de procesamiento en comparación con el algoritmo “Dijkstra”. Segunda Hipótesis: Experimento 2 El algoritmo “Tabú” obtiene un menor costo de procesamiento en comparación con el algoritmo “Dijsktra”. Planeación de la Hipótesis

Planeación del experimento Gustavo Planeación del experimento Modelo Estadístico a utilizar T Student Se ha escogido el modelo estadístico T-Student, tomando como suposición que la población tiene distribución normal y que las varianzas de cada población son iguales pero desconocidas, por lo que se analizarán las medias de los datos. El modelo T-Student a utilizar es el siguiente:

Planeación del experimento Gustavo Planeación del experimento Modelo Estadístico a utilizar El modelo T-Student a utilizar es el siguiente: X1: tiempo o costo de procesamiento del algoritmo “Tabú” X2: tiempo o costo de procesamiento del algoritmo “Dijkstra” Si: Varianza de la muestra i; ni: Tamaño de la muestra i; Para ambos experimentos trabajaremos con un nivel de riesgo  igual a 5%, el cual nos indica que se tendrá un 5 % de probabilidad de rechazar la Hipótesis nula cuando esta es en realidad cierta.

Planeación del trabajo Experimental Gustavo Planeación del trabajo Experimental Comparación de Tiempos de Procesamiento y Costos de Procesamiento Inputs Los datos de entrada para este experimento serán 3 datos [Ciudad Origen] [Ciudad Destino] [Numero de Paquetes]

Planeación del trabajo Experimental Gustavo Planeación del trabajo Experimental Comparación de Tiempos de Procesamiento y Costos de Procesamiento Outputs Para la experimentación numérica como datos de salida, luego de cada ejecución, se obtendrá: Tiempo de procesamiento de toda la información (medido en milisegundos) Costo de procesamiento de toda la información (Megabytes)

Planeación del trabajo Experimental Comparación de Tiempos de Procesamiento y Costos de Procesamiento Cantidad de la muestra El resultado de cada ejecución de los algoritmos, será el tiempo y costo de procesamiento de los 45 grafos equivalentes a las ciudades por las que puedo utilizar. La muestra constará de 41 experimentaciones de cada uno de los algoritmos. A partir de las experimentaciones se calculará el tiempo y costo medio de procesamiento, para luego proceder con los cálculos estadísticos y así aprobar o rechazar la hipótesis inicial.

Planeación del trabajo Experimental Comparación de Tiempos de Procesamiento y Costos de Procesamiento Consideraciones Importantes: Se está utilizando un sola PC con 2GB de RAM, con un procesador de 2.4 GHz, 2 núcleos y con un límite de uso del 40% de la memoria para la ejecución del algoritmo. Se está simulando una infraestructura de varias computadoras trabajando a la vez en una sola PC.

Ejecución de los Experimentos Aquí se plantea cada uno los Experimentos Experimento 1: Comparación de tiempos Para este experimento, trabajaremos con algoritmos de procesamiento de información “Tabú” y “Dijkstra” presentados anteriormente con el objetivo de comprobar cuál de los dos obtiene un menor tiempo de procesamiento de información. Experimento 2: Comparación de costos Para este experimento, trabajaremos con algoritmos de procesamiento de información “Tabú” y “Dijkstra” presentados anteriormente con el objetivo de comprobar cuál de los dos obtiene un menor costo de procesamiento de información.

Experimento 1: Comparación de tiempos Aprovecha el tiempo Planteamiento de hipótesis Las hipótesis para este experimento son:  H0: El algoritmo “Tabú” obtiene el mismo tiempo de procesamiento en comparación con el algoritmo “Dijkstra”. H0: μ1 = μ2 H1: El algoritmo “Tabú” obtiene un menor tiempo de procesamiento en comparación con el algoritmo “Dijkstra”. H1: μ1 < μ2

Experimento 1: Comparación de tiempos Aprovecha el tiempo Definición de variables Las variables a utilizar son: X1= tiempo de procesamiento del algoritmo “Tabú”. X2= tiempo de procesamiento del algoritmo “Dijkstra”.   Considerando: μ1 = tiempo promedio de procesamiento del algoritmo “Encolamiento por criterio”. μ2 = tiempo promedio de procesamiento del algoritmo “Ráfaga”.

Experimento 2: Comparación de costos Ahorra al máximo Planteamiento de hipótesis Las hipótesis para este experimento son:  H0: El algoritmo “Tabú” obtiene el mismo costo de procesamiento en comparación con el algoritmo “Dijkstra”. H0: μ1 = μ2 H1: El algoritmo “Tabú” obtiene un menor costo de procesamiento en comparación con el algoritmo “Dijkstra”. H1: μ1 < μ2

Experimento 2: Comparación de costos Ahorra al máximo Definición de variables Las variables a utilizar son: X1= costo de procesamiento del algoritmo “Encolamiento por criterio”. X2= costo de procesamiento del algoritmo “Ráfaga”.   Considerando: μ1 = costo promedio de procesamiento del algoritmo “Encolamiento por criterio”. μ2 = costo promedio de procesamiento del algoritmo “Ráfaga”.

Aprovecha el tiempo y Ahorra al máximo Experimento 1 y 2 Aprovecha el tiempo y Ahorra al máximo Criterios de decisión Considerando un nivel de significación =0.05, y seleccionada el estadístico T-Student para realizar la prueba de hipótesis se puede definir la siguiente región crítica.   R.C. = { T < t1-α,n1+n2-2} : Prueba unilateral de cola izquierda Si se obtiene un estadístico a partir de los datos obtenidos de la muestra, que está dentro de la región crítica, entonces se rechaza H0 y se acepta H1. Caso contrario, se rechaza H1 y se acepta H0.

A experimentar! Es momento de la ejecutar los algoritmos y recoger datos para su comparación

Resultados del Experimento 1 Aprovecha el tiempo Luego de ejecutar 20 veces el algoritmo 1 y 2 se han obtenido los siguientes datos estadísticos en base al tiempo de procesamiento: Estadístico Algoritmo 1 Tiempo (ms) Algoritmo 2 Tiempo (ms) Media (u2) Desviación estándar (S2)

Análisis de Resultados: Experimento 1 Aprovecha el tiempo Calculamos el valor del estadístico t, en base a la media y desviación estándar: t n1 41 n2 El valor -1.684 se halla en la tabla t-Student con los grado de libertad 19 una probabilidad de 0.95 de acuerdo al  definido= 5 % que es la probabilidad de rechazar Ho siendo esta cierta.   "Como t = -1.684 > -12.659362 se rechaza Ho"

Resultados del Experimento 2 Ahorra al máximo Luego de ejecutar 20 veces el algoritmo 1 y 2 se han obtenido los siguientes datos estadísticos en base al costo de procesamiento: Estadístico Algoritmo 1 Costo (MB) Algoritmo 2 Costo (MB) Media (u2) 1.820 22.050 Desviación estándar (S2) 0.6313 2.6160

Análisis de Resultados: Experimento 2 Ahorra al máximo Calculamos el valor del estadístico t, en base a la media y desviación estándar: t -37.559010 n1 41 n2 El valor -1.684 se halla en la tabla t-Student con los grado de libertad 19 una probabilidad de 0.95 de acuerdo al  definido= 5 % que es la probabilidad de rechazar Ho siendo esta cierta.   "Como t = -1.729 > -37.559010 se rechaza Ho"

Interpretación de resultados Aprovecha el tiempo y Ahorra al máximo Interpretación de los resultados del experimento 1: Dado que se rechazó la hipótesis Ho, significa que se acepta la Hipótesis H1. El algoritmo “Encolamiento por criterio” es el que tiene el menor tiempo de procesamiento.   Interpretación de los resultados del experimento 2: Dado que se rechazó la hipótesis Ho, significa que se acepta la Hipótesis H1. El algoritmo “Encolamiento por criterio” es el que tiene el menor costo de procesamiento.

Conclusiones Primer experimento Nuestro veredicto Primer experimento   Como se plantea desde un inicio en nuestras hipótesis. El algoritmo de “Encolamiento por criterio” tiene un menor tiempo de procesamiento de información. Eso nos lleva a concluir que deberíamos elegir este algoritmo para dar solución al problema identificado. Segundo experimento Como se plantea desde un inicio en nuestras hipótesis. El algoritmo de “Encolamiento por criterio” tiene un menor costo de procesamiento de información. Eso nos lleva a concluir que deberíamos elegir este algoritmo para dar solución al problema identificado.

Comparación de rendimiento El consumo Algoritmo “Tabú” Algoritmo “Dijkstra”

Referencias Estadística Aplicada - Manuel Córdova Zamora http://www.spss.com/es/ http://www.udc.es/dep/mate/estadistica2/cap2.html www.cs.princeton.edu www.cs.utexas.edu http://es.wikipedia.org/wiki/Algoritmo_de_Dijkstra