Tema 7. Transformaciones. Transformaciones lineales

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

BUENAS TARDES.
Tema 4: Medidas de posición individual.
Tema 6: Regresión lineal.
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
Tema. 5. Variabilidad. Concepto
Tema.9.Predicción y estimación. Concepto. Cálculo de la ecuación de regresión lineal. Modelo general lineal. Evaluación del modelo. Diagnóstico del modelo.
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN METODOLOGÍAS DE INVESTIGACIÓN
Tema 16: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Tema. 4. Medidas de posición. Medidas de posición individual, centiles
Tema 13. Inferencia estadística Principales conceptos. Muestreo
Tema. 6. Medidas de forma y valores atípicos. Asimetría y curtosis
Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis
Bloque III. Caracterización de la relación entre variables Tema. 8
Tema 19: Contraste no paramétrico de hipótesis: Conceptos básicos
REGRESION LINEAL SIMPLE
Estadística Unidad III
ESTADÍSTICA DESCRIPTIVA
Unidad de competencia II Estadística descriptiva:
Capítulo 4: Medidas de dispersión
Capítulo 3: Medidas de posición
Pronósticos, Series de Tiempo y Regresión
INTEGRALES INDEFINIDAS. MÉTODOS ELEMENTALES DE INTEGRACIÓN
Bivariadas y Multivariadas
TEMA 2.1. MOVIMIENTO RECTILÍNEO.
Modelado y simulación en Ingeniería Química. Manuel Rodríguez
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
Estimación por intervalos de confianza.
Regresión y correlación
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
MEDIDAS DE VARIABILIDAD O DISPERSION
Bioestadística Aplicada I
PROCESAMIENTO DE DATOS DE VIENTO 1º Parte.
Medidas de Dispersión Estadística E.S.O.
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
EJEMPLO COMPLETO Y APLICACIONES Bloque IV * Tema 161.
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Facultad: Turismo Y Hotelería
La Derivada. Ya vimos: los conceptos, métodos ó instrumentos necesarios para establecer el “comportamiento” de una función.  en un entorno de x o [ 
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Descomposición Factorial Unidad 5
Estadística Descriptiva continuación
TEMA 2.5 PUNTUACIONES TIPICAS Y ESCALAS DERIVADAS.
Medidas de Dispersión.
Medida de Dispersión Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio.
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
Coeficiente de Variación
Medidas de Dispersión Varianza
Grupo Continental Control de Procesos.
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
Medidas de dispersión.
Unidad II: Variables Aleatorias Concepto Discreta y Continua Fun. de densidad Fun. de probabilidad F. de distribución Esperanza y Varianza Propiedades.
Page 1 Page 2 Asimetría Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética).
Pruebas de hipótesis.
coeficientes de correlación de
Media Geométrica En matemáticas y estadística, la media geométrica de una cantidad arbitraria de números (por decir n números) es la raíz n-ésima del producto.
LA DISTRIBUCIÓN NORMAL
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
1 Introducción al tratamiento de datos © José Luís Contreras.
Estadística II Regresión Lineal.
VARIANZA, COVARIANZA, DESVIACION ESTANDAR Y BETA
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
NÚMEROS REALES.
Área Académica: Matemáticas Tema: Factorizaciones Profesor(a): Paz María de Lourdes Cornejo Arteaga Periodo: Julio-Diciembre 2015.
REGRESIÓN LINEAL SIMPLE
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Medidas de tendencia central
FUNCIONES EXPONENCIALES Y LOGARÍTMICAS. 1. Funciones exponenciales. Una función exponencial es una función cuya expresión es siendo la base a un número.
Transcripción de la presentación:

Tema 7. Transformaciones. Transformaciones lineales Tema 7. Transformaciones. Transformaciones lineales. Puntuaciones típicas. Transformaciones no lineales.

Transformaciones lineales Con la forma y=a+bx Que se emplea por ejemplo, para pasar de grados Celsius a grados Fahrenheit. Pero fijaros que esta transformación no cambia la forma de la distribución. (Puede cambiar la media y la desv.típica, pero no la forma de la distribución.)

Puntuaciones típicas Indican el número de desviaciones típicas en que una observación se separa de la media del grupo de datos. La media de las puntuaciones típicas es 0 La varianza (y desv.típica) es 1 Observad que las puntuaciones z son abstractas (ello permite la comparación de variables con escalas diferentes).

Puntuaciones típicas (ejemplo) Si tenemos dos estudiantes A y B que han hecho un examen, y sabemos que la puntuación típica de A para el grupo de estudiantes es de 1 y la puntuación típica de B es de 0, ¿quién tendrá mejor nota? Evidentemente es A; su puntuación está 1 desv.típica sobre la media del grupo; la de B corresponde a la de la media del grupo. Puntuaciones típicas y observaciones atípicas Si z>3, tales valores se suelen considerar atípicos

Escalas derivadas (sobre las punt.típicas) Un pequeño inconveniente de las puntuaciones típicas es que conllevan el uso de valores muy pequeños (con decimales, habitualmente), así como valores negativos. Por ello, a veces se efectúan transformaciones lineales sobre las puntuaciones típicas. El ejemplo que vamos a ver son las puntuaciones T (con media 50 y desv.típica 10) y con las escalas de CI (con media 100 y desv.típica 15).

Puntuaciones T De manera genérica Observad que la nueva media viene dada por b, y que la desv.típica viene dada por el valor absoluto de a En el caso de las puntuaciones T, a=10 y b=50 Escala de CI En el caso de la escala de CI:

Transformaciones no lineales ¿Porqué hacemos transformaciones (no lineales) en los datos? -Para hacer la distribución más simétrica -Para hacer lineal la relación entre variables (caso de tener más de una variable; tema siguiente)

Una familia de transformaciones especialmente útiles es la “escalera de potencias” de Tukey Corrigen asimetría negativa Corrigen asimetría positiva

Ejemplo. Datos de TR de un participante Observad no sólo que hay algunas puntuaciones atípicas a ambos lados, sino que hay una clara asimetría positiva.

Ejemplo. Datos (transformados; raiz cuadrad) de TR de un participante (cont.) HEMOS EFECTUADO LA RAIZ PARA HACER MÁS SIMETRICA LA DISTRIBUCIÓN. Observad no sólo que aún queda algo de asimetría positiva. Con el logaritmo, podremos reducir más la asimetría positiva, es lo que haremos ahora

Ejemplo. Datos (transformados; logaritmo) de TR de un participante (cont.) Nota: Si algún valor fuera 0, emplear log(1+x) Observad no sólo que la asimetría positiva ha desaparecido (si acaso hay cierta asimetría negativa causada por unas pocas puntuaciones atípicas).

Ejemplo. Datos (transformados; cuadrado) de TR de un participante (cont.) Nota: Emplear el cuadrado no lo debéis hacer para corregir la asimetría positiva...sólo la negativa! Lo que hemos hecho es aumentar la asimetría positiva y eso no es lo que queríamos...(y si empleamos el cubo, aún peor para nuestros fines).

Esta familia de transformaciones (“escalera de Tukey”) tiene importantes propiedades: Preservan el orden de los valores; es decir, los valores mayores de la escala original seguirán siendo los valores mayores en la escala transformada. 2. Modifican la distancia entre los valores. Con potencias p<1 (raíz x o log x) se comprimen los datos en la parte superior de la distribución en relación a los valores menores; Con potencias p>1 (como el cuadrado de x) se tiene el efecto contrario. 3. El efecto sobre la forma de la distribución cambia sistemáticamente con p. Si raíz x hace menos pronunciada la asimetría positiva de una distribución, el log x provocará que la distribución resultante sea aún menos asimétrica positiva (en relación a raíz x).

En definitiva, las transformaciones de potencia pueden hacer que la variable transformada tenga menos asimetría. ¿Por qué es eso importante? – Las distribuciones que muestran una clara asimetría son difíciles de estudiar. – Los valores originales aparentemente atípicos se encontrarán más cercanos al grueso de los datos. – Los métodos estadísticos suelen emplear la media aritmética; pero la media de una distribución asimétrica no es un buen índice del grueso de los datos.

Para finalizar.... Si bien todas estas transformaciones parece que se hacen para facilitar el análisis de los datos, en algunos contextos, las transformaciones pueden tener un sentido claro: - La inversa de la distancia viajada en un tiempo dado es la velocidad Por tanto, la inversa de la latencia de respuesta (en un experimento psicofísico) es la velocidad de respuesta