Transformación de Potencia Box-Cox Modelos Estadísticos Dra. Graciela González Farías José Ramón Domínguez Molina 14/marzo/2003 Omar Posada Villarreal.

Slides:

Advertisements

Presentaciones similares

Intervalos de Confianza para la Varianza de la Población

Advertisements

ANÁLISIS ESTADÍSTICO COMPUTARIZADO

PRUEBAS DE HIPOTESIS. I.S.C. Rosa E. Valdez V.. Dentro del estudio de la inferencia estadística, se describe como se puede tomar una muestra aleatoria.

Generación de variables aleatorias

Agrupación de datos cuantitativos definiciones básicas y otras explicaciones.

SELECCIÓN DE LA MUESTRA

Profesor Hermann Pempelfort. Punto y coma Permite que no se muestre por pantalla la acción o resultado ejecutado. Ejemplo1: x = 3 Ejemplo2: x = 3; Ejemplo3:

Inferencia Estadística

Departament destadísticoa Grup destadísticoa Computacional Introducción a la metodología bootstrap Jordi Ocaña Departament destadísticoa Secció Departamental.

8. Distribuciones continuas

Variables Aleatorias Continuas

Juan Camilo Montoya Universidad Sergio Arboleda Dic, 2012

Generación de Números y Variable aleatorias

FORTRAN 90 arreglos.

R. Introducción R es una versión del lenguaje de programación S desarrollado por John Chambers en los laboratorios Bell en R fue escrito inicialmente.

UNITA - IBARRA BLOQUES PL-SQL SUBPROGRAMAS Paulina Guevara.

El Coeficiente de Contingencia:

Estimación por Intervalos de confianza

Índice Estadística Aplicada Unidad II: Probabilidades

Distribuciones de Probabilidad

Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.

HERRAMIENTAS PARA EL CONTROL ESTADÍSTICO DE CALIDAD.

Diseño de experimentos

1 M. en C. Gal Vargas Neri. ESTADISTICA I CSH, Tema III TEMARIO.

MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES

Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.

Análisis no paramétricos

SINTAXISYSEMANTICA. Tengo la impresión de que Java fue diseñado para hacer que fuera difícil escribir mal código, mientras que Python está diseñado para.

Biograma Introducir datos en una matriz. Elegir método para máximos y mínimos. Calcular los máximos y mínimos observados. Límites.

Programación en Matlab

Unidad V: Estimación de

GRUPO I ESTADISTICA I YIRA LOPEZ WILLIAM ESTEVEZ CAROLINA PEREZ

Generación de variables aleatorias

Generación de Variables Aleatorias

DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.

Distribución de Frecuencias por intervalos

1 Denominamos F(x) a función de distribución de una variable aleatoria X, que viene dada por la expresión siguiente: 0 si x < 0 F(x) = P X (X  x) = p.

Funciones de densidad de probablidad

Medianas y Estadísticas de Orden

¿Cuándo usar esta distribución?

Maestría en Transporte Estadística Capítulo 1. Objetivos ¿Cómo se determinan las magnitudes para planificación de transporte, operación de transporte,

Ejemplo Con N=18, encontrar el elemento que estaba en la posición 0 requiere.

Tabla de Distribución de Frecuencias

Tabla de Distribución de Frecuencias

Límites y Continuidad.

MAESTRIA EN DESARROLLO EDUCATIVO ESTADISTICA DESCRIPTIVA DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS ASESOR: JOSE LUIS VILLEGAS VALLE.

8. Distribuciones continuas

Nociones Básicas de Análisis Estadístico de Muestras

Probabilidad y Estadística X = x Unidad de muestreo Mediremos un atributo Variable aleatoria Valor que toma la variable aleatoria.

Transformación de Potencia Box-Cox

COMO HACER TABLAS DE FRECUENCIAS Y HISTOGRAMA CON CURVA NORMAL

EJEMPLO CON EL EJERCICIO 6 DE LA GUIA Cargar los datos Ir a Estadísticas-inferencia basada en una muestra- prueba t para un parámetro.

ESTADÍSTICA UNIDIMENSIONAL

P Y E 2004 Clase 19Gonzalo Perera1 Propiedades generales del p-valor Repaso de la clase anterior. Tests de aleatoriedad Estadística de datos dependientes.

estadístico de procesos.

Tema 4: Lo más normal del mundo

MEDIDAS DE TENDENCIA CENTRAL

Derivada de una función.

Cáp.10 Análisis de Datos Estadística Inferencial -

Límite y Continuidad.

Prof. León Hurtado. b a La Integral definida x y Prof. León Hurtado f(x)

EPE MA 148 ESTADÍSTICA INFERENCIAL TEMA:

Pruebas paramétricas y no paramétricas

26. La Homocedasticidad y la prueba de Levene

Tabla de Distribución de Frecuencias

ESTADÍSTICA DESCRIPTIVA

Generación de Variables Aleatorias

 Clara Espino. Pruebas de Hipótesis.. En esta estadística clásica el promedio poblacional es un parámetro fijo y por lo tanto no tienes ningún tipo de.

Paul Leger Funciones Paul Leger

R. Introducción R es una versión del lenguaje de programación S desarrollado por John Chambers en los laboratorios Bell en R fue escrito inicialmente.

Transcripción de la presentación:

Transformación de Potencia Box-Cox Modelos Estadísticos Dra. Graciela González Farías José Ramón Domínguez Molina 14/marzo/2003 Omar Posada Villarreal

Transformación de potencia n Simple n Se requiere que la distribución sea –Suave –Continua –X>0

Transformación de potencia n =2, Y=X 2 n =1/2, Y=X 1/2 n Se busca que la variable transformada se parezca a una distribución normal

Ejemplo: X ~ Exp(1) n Rango: [-2, 2] pasos de 0.5. n La mejor fue = 0.5

Ejemplo: X ~ Exp(3) n Rango: [0, 10] pasos de n La mejor fue = 3.05

Ejemplo: X ~ U(0.01, 1) n Rango: [-10, 10] pasos de 0.5. n La mejor fue >= 10

Ejemplo: X ~ U(1, 5) n Rango: [-10, 10] pasos de 1. n La mejor fue <= -10

Ejemplo: X ~ Beta(5, 2.5) n Rango: [-10, 10] pasos de 1. n La mejor fue >= 10

Listado S-Plus (1) n # Realiza una transformación que se ajuste a la normal n fX Datos n leftlambda Limite inferior para probar lambda n rightLambda Limite superior para probar lambda n eachLambda Intervalo entre marcas n boxCox = function(fX, leftLambda, rightLambda, eachLambda) { n cX = data.matrix(fX) n dimX = dim(cX) n n = dimX[1] n origSD = stdev(cX) n #Equivale a cXLambda1 = (cX ^ 1) - 1 n #origSD = stdev(cXLambda1) n # Checa que xi>0 n for (i in 1:n) { n if (cX[i] <= 0) { n stop("Debe ser: x[i]>0") n } n # Inicializar n # Rango de lambdas a probar n minLambda = rightLambda n rLambda = seq(leftLambda, rightLambda, by=eachLambda) n nLambda = length(rLambda) n minSD = 1E100 n rSD = vector(mode="numeric", length=nLambda) cY = vector(mode="numeric", length=n)

Listado S-Plus (2) n # Para cada lambda n for (j in 1:nLambda) { n # Transformacion Box-Cox n # print(paste("- i=", i, " j=", j)) n if (rLambda[j] != 0) { n cY = (cX ^ rLambda[j] - 1) / rLambda[j] n } else { n cY = log(cX) n } n n # Recuerda el vector con min stdev n rSD[j] = stdev(cY) n if (rSD[j] < minSD) { n cMinY = cY n minLambda = rLambda[j] n minSD = rSD[j] n } n n return (cX, origSD, rLambda, rSD, cMinY, minLambda, minSD) n }

Listado S-Plus (3) n plotBoxCox = function(sTitle, cX, origSD, rLambda, rSD, cMinY, minLambda, minSD) { n print("Original") n # En una pagina n par(mfrow = c(2,2)) n options(digits=3) n n # Conserva la mayor escala de los datos orig y tran en el eje Y n minY = min(cX, cMinY) n maxY = max(cX, cMinY) n # Grafica qqplot normalizado de los datos originales n # Muestra la varianza actual. n sTitle2 = paste(sTitle, "\nQQPlot normalizado. Desv. Tipica = ", format(origSD)) n qqnorm(cX, main=sTitle2, ylab="X", ylim=c(minY, maxY)) n qqline(cX) n print("Transformada") n # Grafica transformacion con Desv. Tipica n sTitle2 = paste("Tran. Box-Cox con SD min. QQPlot norm.\n(lambda = ", format(minLambda), ", Desv. Tip. = ", format(minSD), ")") n qqnorm(cMinY, main=sTitle2, ylab="Y", ylim=c(minY, maxY)) n qqline(cMinY) n print("Histograma") n sTitle2 = paste(sTitle, "\nHistograma") n hist(cX, main=sTitle2, xlab="X") n n print("Lambda") n # Grafica lambda vs. Desv. Tipica n sTitle2 = paste("Lambda vs. Desv. Tipica.\n(lambda = ", format(minLambda), ", Desv. Tip. = ", format(minSD), ")") n plot(rLambda, rSD, main=sTitle2, xlab="Lambda", ylab="log(SD)", log='y') n }

Listado S-Plus (4) n # PARAMETROS DEL PROGRAMA n # Inicializar archivo n example = 5 n n = 100# Tamano de muestra n # Parametros de los ejemplos n # El dominio debe ser X>0 n if (example == 1) { n print("Exp") n lambda1 = 1# Parámetro para exp n sTitle = paste("Exponencial(", lambda1, ")") n leftLambda = -2 n rightLambda = 2 n eachLambda = 0.05 n cXOrig = rexp(n, lambda1) n } else if (example == 2) { n print("Exp") n lambda1 = 3# Parámetro para exp n sTitle = paste("Exponencial(", lambda1, ")") n leftLambda = 0 n rightLambda = 10 n eachLambda = 0.05 n cXOrig = rexp(n, lambda1)

Listado S-Plus (5) n } else if (example == 3) { n print("Unif") n alfa = 0.01# Parámetro para Unif n beta = 1# Parámetro para Unif n sTitle = paste("Uniforme(", alfa, ", ", beta, ")") n n leftLambda = -10 n rightLambda = 10 n eachLambda = 0.5 n cXOrig = runif(n, min=alfa, max=beta) n } else if (example == 4) { n print("Unif") n alfa = 1# Parámetro para Unif n beta = 5# Parámetro para Unif n sTitle = paste("Uniforme(", alfa, ", ", beta, ")") n n leftLambda = -10 n rightLambda = 10 n eachLambda = 1 n cXOrig = runif(n, min=alfa, max=beta) n } else if (example == 5) { n print("Beta") n alfa = 5# Parámetro para Unif n beta = 2.5# Parámetro para Unif n sTitle = paste("Beta(", alfa, ", ", beta, ")") n leftLambda = -10 n rightLambda = 10 n eachLambda = 1 n cXOrig = rbeta(n, alfa, beta) n } n # Escribe en archivo una muestra aleatoria con distribucion exponencial n cXOrig = t(cXOrig) n cXOrig = t(cXOrig)# Dos veces para transponer renglon a columna (?) n exportData(cXOrig, "D:\\Posada\\ModEst\\ModEst4\\ExpSample.txt", type="ASCII") n fX = importData("D:\\Posada\\ModEst\\ModEst4\\ExpSample.txt", type="ASCII") n res = boxCox(fX, leftLambda, rightLambda, eachLambda) n plotBoxCox(sTitle, res$cX, res$origSD, res$rLambda, res$rSD, res$cMinY, res$minLambda, res$minSD)

Listado S-Plus (6) n # Escribe en archivo una muestra aleatoria con distribucion exponencial n cXOrig = t(cXOrig) n cXOrig = t(cXOrig)# Dos veces para transponer renglon a columna (?) n exportData(cXOrig, "D:\\Posada\\ModEst\\ModEst4\\ExpSample.txt", type="ASCII") n fX = importData("D:\\Posada\\ModEst\\ModEst4\\ExpSample.txt", type="ASCII") n res = boxCox(fX, leftLambda, rightLambda, eachLambda) n plotBoxCox(sTitle, res$cX, res$origSD, res$rLambda, res$rSD, res$cMinY, res$minLambda, res$minSD)