La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

T IPIFICACIÓN – ASIMETRÍA - APUNTAMIENTO Pedro Godoy Gómez Profesor Bioestadística.

Presentaciones similares


Presentación del tema: "T IPIFICACIÓN – ASIMETRÍA - APUNTAMIENTO Pedro Godoy Gómez Profesor Bioestadística."— Transcripción de la presentación:

1 T IPIFICACIÓN – ASIMETRÍA - APUNTAMIENTO Pedro Godoy Gómez Profesor Bioestadística

2 Tipificación Se conoce por tipificación al proceso de restar la media y dividir por su desviación típica a una variable X. De este modo se obtiene una nueva variable de media y viación típica, que denominamos variable tipificada.

3 Esta nueva variable carece de unidades y permite hacer comparables dos medidas que en un principio no lo son. Así por ejemplo nos podemos preguntar si un elefante es más grueso que una hormiga determinada, cada uno en relación a su población. También es aplicable al caso en que se quieran comparar individuos semejantes de poblaciones diferentes. Por ejemplo si deseamos comparar el nivel académico de dos estudiantes de diferentes Universidades para la concesión de una beca de estudios, en principio sería injusto concederla directamente al que posea una nota media más elevada, ya que la dificultad para conseguir una buena calificación puede ser mucho mayor en un lugar que en el otro, lo que limita las posibilidades de uno de los estudiante y favorece al otro. En este caso, lo más correcto es comparar las calificaciones de ambos estudiantes, pero tipificadas cada una de ellas por las medias y desviaciones típicas respectivas de las notas de los alumnos de cada Universidad

4 Ejemplo Supongamos que un médico en España cobra $ 2300 y otro de China cobra $1400, ¿Qué médico cobra más? Como no es posible saber quien cobra más solo por los valores anteriores, ya que no sabemos lo que equivalen cada uno de estos montos en sus respectivos países. Para poder compararlos necesitamos los sueldos medios de cada uno de los países y sus desviaciones estándar. Supongamos que el sueldo medio en España es de $1250 con  = 320, mientras que en China el sueldo medio es de $620 con  = 110 Esto nos indica que el médico Chino cobra más que el médico Español.

5 En el cuarto medio A quien obtiene 672 puntos está 0,39 veces bajo la  mientras que en el cuarto medio B está 0,027 veces sobre . alumnopuntajevalor Z alumnopuntajevalor Z 1532-2,26335235 17431,42303445 2649-0,69919272 2653-0,34593103 3672-0,39170835 36720,02751724 4686-0,20454395 4668-0,05110345 5696-0,07085509 5637-0,66041378 67270,34358036 6558-2,21317236 77270,34358036 77020,6171724 87620,81149136 87020,6171724 97730,95854911 9658-0,24765517 107891,17245128 107130,83337929 media701,3 media670,6 desv estand74,8005496 desv estand50,8771942 cv0,10665985 cv0,07586817 El valor Z es el número de  a la izquierda o la derecha.

6 alumnopuntajevalor Zcomparacion alumnopuntajevalor Zcomparacion 1532-2,26335235555,4469828 17431,42303445807,743759 2649-0,69919272635,027036 2653-0,34593103675,424169 3672-0,39170835650,6709781 36720,02751724703,358305 4686-0,20454395660,1933777 4668-0,05110345697,477434 5696-0,07085509666,9950916 5637-0,66041378651,900686 67270,34358036688,0804049 6558-2,21317236535,753491 77270,34358036688,0804049 77020,6171724747,464835 87620,81149136711,8864037 87020,6171724747,464835 97730,95854911719,368289 9658-0,24765517682,775257 107891,17245128730,2510314 107130,83337929763,637229 media701,3 media670,6 desv estand74,8005496 desv estand50,8771942 cv0,10665985 cv0,07586817 La columna de comparación nos indica que 532 puntos en A equivalen a 555 puntos en B. Permite comparar un puntaje con otro.

7 edadZ edadsexo presion sistolica Z presion sistolica presion diostólica Z presion diestolica colesterol Z colesterol alturaZ alturamasaZ masa ataque ( 0 no, 1 si) estado de salud 45-0,07mujer124-0,0480-0,20254-1,131760,3086,181,180 480,91mujer110-0,8270-1,10240-1,431830,6197,982,520 40-1,71hombre114-0,680-0,20279-0,591710,0880,740,560 42-1,05hombre100-1,3880-0,20284-0,491710,0867,59-0,930 45-0,07mujer1903,661102,513150,181710,0882,550,770 491,24mujer1300,3880,52250-1,211760,3083,910,920 501,57mujer1300,3941,07298-0,191710,0873,03-0,310 43-0,72hombre110-0,8274-0,743841,65168-0,0579,380,410 460,26mujer120-0,2680-0,203100,07164-0,2265,32-1,180 480,91hombre120-0,2680-0,203370,65169-0,0158,97-1,900 41-1,38mujer1300,380-0,203671,291740,2173,48-0,260 45-0,07mujer120-0,26900,70273-0,721710,0879,380,410 45-0,07hombre1300,375-0,65273-0,72166-0,1470,31-0,620 43-0,72hombre120-0,2680-0,203140,151860,7470,76-0,570 44-0,4mujer115-0,5470-1,10243-1,3665-4,5568,49-0,820 42-1,05mujer1400,86900,703410,731860,7476,20,050 42-1,05mujer1380,7580-0,20245-1,321760,3083,910,920 491,24hombre115-0,5482-0,02302-0,11740,2170,36-0,610 470,59mujer1481,311102,51302-0,11740,2168,12-0,870 45-0,07hombre120-0,2670-1,103861,69166-0,1466,23-1,080 491,24mujer110-0,8270-1,103120,111790,4377,110,150 41-1,38mujer1320,41900,70302-0,11740,2173-0,310 460,26hombre112-0,7180-0,203941,861740,2175,750,000 501,57hombre114-0,670-1,103581,091740,2189,711,580 media45,21124,6782,21306,79169,1375,77 disv estand3,0517,8511,0546,8222,898,83

8 Los valores atípicos en un conjunto de datos son aquellos que son mucho mayores o mucho menores que el resto de valores. Hay diferentes criterios para definir que se entiende por mucho mayor o mucho menor, pero aquí en el curso utilizaremos un criterio basado en los cuartiles. VALORES ATIPICOS Consideraremos valores atípicos por exceso a aquellos que sean mayores al tercer cuartíl ( Q3) mas 1;5 veces el rango intercuartílico ( R:I:C:) y valores atípicos por defecto a aquellos que sean menores al primer cuartíl ( Q1) menos 1;5 veces el rango intercuartílico (R:I:C:). Así, en general, podemos decir que son valores atípicos son todos los que no se encuentren en el intervalo:

9

10 A continuación se muestra un conjunto de datos. Determine si tiene o no valores atípicos No hay valores fuera del intervalo, por lo que no hay valores atípicos.

11 Diagrama de cajas: Aun así nos puede ser suficiente con una representación todavía mas esquemática de como se distribuyen los datos, en ese caso se puede optar por un Diagrama de cajas. En este aparece en la parte central una caja cuyos extremos están delimitados por el primer y tercer cuartíl, mientras que la mediana aparece como una línea que divide la caja anterior. A su vez los llamados bigotes de la caja, aparecen unidos por un segmento que cruza la caja anterior y que da una idea aproximada del rango de los datos. Hay diferentes criterios para representar los bigotes, pero el que estudiaremos en este curso sera el que se detalla a continuación:

12 el bigote inferior representara o bien 1;5 veces el R.I.C. por debajo del primer cuartíl o bien el valor mínimo si este no es un valor atípico; y el bigote superior representara o bien 1;5 veces el R.I.C. por encima del tercer cuartíl o bien el valor máximo si este no es un valor atípico. Si hay valores atípicos en el conjunto de datos, se representan mediante puntos aislados fuera del diagrama. Nuevamente, los detalles de cada uno de las representaciones anteriores (orientación horizontal/vertical de la representación, colores,...) se dejan a la elección del usuario en función de las características de los datos y los requerimientos de la información que se quiera representar.

13 A continuación representaremos los datos anteriores ( estaturas) en un diagrama de cajas.

14

15

16 Asimetría


Descargar ppt "T IPIFICACIÓN – ASIMETRÍA - APUNTAMIENTO Pedro Godoy Gómez Profesor Bioestadística."

Presentaciones similares


Anuncios Google