Transformación de Potencia Box-Cox Modelos Estadísticos Dra. Graciela González Farías José Ramón Domínguez Molina 14/marzo/2003 Omar Posada Villarreal.

Slides:



Advertisements
Presentaciones similares
Intervalos de Confianza para la Varianza de la Población
Advertisements

ANÁLISIS ESTADÍSTICO COMPUTARIZADO
PRUEBAS DE HIPOTESIS. I.S.C. Rosa E. Valdez V.. Dentro del estudio de la inferencia estadística, se describe como se puede tomar una muestra aleatoria.
Generación de variables aleatorias
Agrupación de datos cuantitativos definiciones básicas y otras explicaciones.
SELECCIÓN DE LA MUESTRA
Profesor Hermann Pempelfort. Punto y coma Permite que no se muestre por pantalla la acción o resultado ejecutado. Ejemplo1: x = 3 Ejemplo2: x = 3; Ejemplo3:
Inferencia Estadística
Departament destadísticoa Grup destadísticoa Computacional Introducción a la metodología bootstrap Jordi Ocaña Departament destadísticoa Secció Departamental.
8. Distribuciones continuas
Variables Aleatorias Continuas
Juan Camilo Montoya Universidad Sergio Arboleda Dic, 2012
Generación de Números y Variable aleatorias
FORTRAN 90 arreglos.
R. Introducción R es una versión del lenguaje de programación S desarrollado por John Chambers en los laboratorios Bell en R fue escrito inicialmente.
UNITA - IBARRA BLOQUES PL-SQL SUBPROGRAMAS Paulina Guevara.
El Coeficiente de Contingencia:
Estimación por Intervalos de confianza
Índice Estadística Aplicada Unidad II: Probabilidades
Distribuciones de Probabilidad
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
HERRAMIENTAS PARA EL CONTROL ESTADÍSTICO DE CALIDAD.
Diseño de experimentos
1 M. en C. Gal Vargas Neri. ESTADISTICA I CSH, Tema III TEMARIO.
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Análisis no paramétricos
SINTAXISYSEMANTICA. Tengo la impresión de que Java fue diseñado para hacer que fuera difícil escribir mal código, mientras que Python está diseñado para.
Biograma Introducir datos en una matriz. Elegir método para máximos y mínimos. Calcular los máximos y mínimos observados. Límites.
Programación en Matlab
Unidad V: Estimación de
GRUPO I ESTADISTICA I YIRA LOPEZ WILLIAM ESTEVEZ CAROLINA PEREZ
Generación de variables aleatorias
Generación de Variables Aleatorias
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
Distribución de Frecuencias por intervalos
1 Denominamos F(x) a función de distribución de una variable aleatoria X, que viene dada por la expresión siguiente: 0 si x < 0 F(x) = P X (X  x) = p.
Funciones de densidad de probablidad
Medianas y Estadísticas de Orden
¿Cuándo usar esta distribución?
Maestría en Transporte Estadística Capítulo 1. Objetivos ¿Cómo se determinan las magnitudes para planificación de transporte, operación de transporte,
Ejemplo Con N=18, encontrar el elemento que estaba en la posición 0 requiere.
Tabla de Distribución de Frecuencias
Tabla de Distribución de Frecuencias
Límites y Continuidad.
MAESTRIA EN DESARROLLO EDUCATIVO ESTADISTICA DESCRIPTIVA DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS ASESOR: JOSE LUIS VILLEGAS VALLE.
8. Distribuciones continuas
Nociones Básicas de Análisis Estadístico de Muestras
Probabilidad y Estadística X = x Unidad de muestreo Mediremos un atributo Variable aleatoria Valor que toma la variable aleatoria.
Transformación de Potencia Box-Cox
COMO HACER TABLAS DE FRECUENCIAS Y HISTOGRAMA CON CURVA NORMAL
EJEMPLO CON EL EJERCICIO 6 DE LA GUIA Cargar los datos Ir a Estadísticas-inferencia basada en una muestra- prueba t para un parámetro.
ESTADÍSTICA UNIDIMENSIONAL
P Y E 2004 Clase 19Gonzalo Perera1 Propiedades generales del p-valor Repaso de la clase anterior. Tests de aleatoriedad Estadística de datos dependientes.
estadístico de procesos.
Tema 4: Lo más normal del mundo
MEDIDAS DE TENDENCIA CENTRAL
Derivada de una función.
Cáp.10 Análisis de Datos Estadística Inferencial -
Límite y Continuidad.
Prof. León Hurtado. b a La Integral definida x y Prof. León Hurtado f(x)
EPE MA 148 ESTADÍSTICA INFERENCIAL TEMA:
Pruebas paramétricas y no paramétricas
26. La Homocedasticidad y la prueba de Levene
Tabla de Distribución de Frecuencias
ESTADÍSTICA DESCRIPTIVA
Generación de Variables Aleatorias
 Clara Espino. Pruebas de Hipótesis.. En esta estadística clásica el promedio poblacional es un parámetro fijo y por lo tanto no tienes ningún tipo de.
Paul Leger Funciones Paul Leger
R. Introducción R es una versión del lenguaje de programación S desarrollado por John Chambers en los laboratorios Bell en R fue escrito inicialmente.
Transcripción de la presentación:

Transformación de Potencia Box-Cox Modelos Estadísticos Dra. Graciela González Farías José Ramón Domínguez Molina 14/marzo/2003 Omar Posada Villarreal

Transformación de potencia n Simple n Se requiere que la distribución sea –Suave –Continua –X>0

Transformación de potencia n =2, Y=X 2 n =1/2, Y=X 1/2 n Se busca que la variable transformada se parezca a una distribución normal

Ejemplo: X ~ Exp(1) n Rango: [-2, 2] pasos de 0.5. n La mejor fue = 0.5

Ejemplo: X ~ Exp(3) n Rango: [0, 10] pasos de n La mejor fue = 3.05

Ejemplo: X ~ U(0.01, 1) n Rango: [-10, 10] pasos de 0.5. n La mejor fue >= 10

Ejemplo: X ~ U(1, 5) n Rango: [-10, 10] pasos de 1. n La mejor fue <= -10

Ejemplo: X ~ Beta(5, 2.5) n Rango: [-10, 10] pasos de 1. n La mejor fue >= 10

Listado S-Plus (1) n # Realiza una transformación que se ajuste a la normal n fX Datos n leftlambda Limite inferior para probar lambda n rightLambda Limite superior para probar lambda n eachLambda Intervalo entre marcas n boxCox = function(fX, leftLambda, rightLambda, eachLambda) { n cX = data.matrix(fX) n dimX = dim(cX) n n = dimX[1] n origSD = stdev(cX) n #Equivale a cXLambda1 = (cX ^ 1) - 1 n #origSD = stdev(cXLambda1) n # Checa que xi>0 n for (i in 1:n) { n if (cX[i] <= 0) { n stop("Debe ser: x[i]>0") n } n # Inicializar n # Rango de lambdas a probar n minLambda = rightLambda n rLambda = seq(leftLambda, rightLambda, by=eachLambda) n nLambda = length(rLambda) n minSD = 1E100 n rSD = vector(mode="numeric", length=nLambda) cY = vector(mode="numeric", length=n)

Listado S-Plus (2) n # Para cada lambda n for (j in 1:nLambda) { n # Transformacion Box-Cox n # print(paste("- i=", i, " j=", j)) n if (rLambda[j] != 0) { n cY = (cX ^ rLambda[j] - 1) / rLambda[j] n } else { n cY = log(cX) n } n n # Recuerda el vector con min stdev n rSD[j] = stdev(cY) n if (rSD[j] < minSD) { n cMinY = cY n minLambda = rLambda[j] n minSD = rSD[j] n } n n return (cX, origSD, rLambda, rSD, cMinY, minLambda, minSD) n }

Listado S-Plus (3) n plotBoxCox = function(sTitle, cX, origSD, rLambda, rSD, cMinY, minLambda, minSD) { n print("Original") n # En una pagina n par(mfrow = c(2,2)) n options(digits=3) n n # Conserva la mayor escala de los datos orig y tran en el eje Y n minY = min(cX, cMinY) n maxY = max(cX, cMinY) n # Grafica qqplot normalizado de los datos originales n # Muestra la varianza actual. n sTitle2 = paste(sTitle, "\nQQPlot normalizado. Desv. Tipica = ", format(origSD)) n qqnorm(cX, main=sTitle2, ylab="X", ylim=c(minY, maxY)) n qqline(cX) n print("Transformada") n # Grafica transformacion con Desv. Tipica n sTitle2 = paste("Tran. Box-Cox con SD min. QQPlot norm.\n(lambda = ", format(minLambda), ", Desv. Tip. = ", format(minSD), ")") n qqnorm(cMinY, main=sTitle2, ylab="Y", ylim=c(minY, maxY)) n qqline(cMinY) n print("Histograma") n sTitle2 = paste(sTitle, "\nHistograma") n hist(cX, main=sTitle2, xlab="X") n n print("Lambda") n # Grafica lambda vs. Desv. Tipica n sTitle2 = paste("Lambda vs. Desv. Tipica.\n(lambda = ", format(minLambda), ", Desv. Tip. = ", format(minSD), ")") n plot(rLambda, rSD, main=sTitle2, xlab="Lambda", ylab="log(SD)", log='y') n }

Listado S-Plus (4) n # PARAMETROS DEL PROGRAMA n # Inicializar archivo n example = 5 n n = 100# Tamano de muestra n # Parametros de los ejemplos n # El dominio debe ser X>0 n if (example == 1) { n print("Exp") n lambda1 = 1# Parámetro para exp n sTitle = paste("Exponencial(", lambda1, ")") n leftLambda = -2 n rightLambda = 2 n eachLambda = 0.05 n cXOrig = rexp(n, lambda1) n } else if (example == 2) { n print("Exp") n lambda1 = 3# Parámetro para exp n sTitle = paste("Exponencial(", lambda1, ")") n leftLambda = 0 n rightLambda = 10 n eachLambda = 0.05 n cXOrig = rexp(n, lambda1)

Listado S-Plus (5) n } else if (example == 3) { n print("Unif") n alfa = 0.01# Parámetro para Unif n beta = 1# Parámetro para Unif n sTitle = paste("Uniforme(", alfa, ", ", beta, ")") n n leftLambda = -10 n rightLambda = 10 n eachLambda = 0.5 n cXOrig = runif(n, min=alfa, max=beta) n } else if (example == 4) { n print("Unif") n alfa = 1# Parámetro para Unif n beta = 5# Parámetro para Unif n sTitle = paste("Uniforme(", alfa, ", ", beta, ")") n n leftLambda = -10 n rightLambda = 10 n eachLambda = 1 n cXOrig = runif(n, min=alfa, max=beta) n } else if (example == 5) { n print("Beta") n alfa = 5# Parámetro para Unif n beta = 2.5# Parámetro para Unif n sTitle = paste("Beta(", alfa, ", ", beta, ")") n leftLambda = -10 n rightLambda = 10 n eachLambda = 1 n cXOrig = rbeta(n, alfa, beta) n } n # Escribe en archivo una muestra aleatoria con distribucion exponencial n cXOrig = t(cXOrig) n cXOrig = t(cXOrig)# Dos veces para transponer renglon a columna (?) n exportData(cXOrig, "D:\\Posada\\ModEst\\ModEst4\\ExpSample.txt", type="ASCII") n fX = importData("D:\\Posada\\ModEst\\ModEst4\\ExpSample.txt", type="ASCII") n res = boxCox(fX, leftLambda, rightLambda, eachLambda) n plotBoxCox(sTitle, res$cX, res$origSD, res$rLambda, res$rSD, res$cMinY, res$minLambda, res$minSD)

Listado S-Plus (6) n # Escribe en archivo una muestra aleatoria con distribucion exponencial n cXOrig = t(cXOrig) n cXOrig = t(cXOrig)# Dos veces para transponer renglon a columna (?) n exportData(cXOrig, "D:\\Posada\\ModEst\\ModEst4\\ExpSample.txt", type="ASCII") n fX = importData("D:\\Posada\\ModEst\\ModEst4\\ExpSample.txt", type="ASCII") n res = boxCox(fX, leftLambda, rightLambda, eachLambda) n plotBoxCox(sTitle, res$cX, res$origSD, res$rLambda, res$rSD, res$cMinY, res$minLambda, res$minSD)