La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Estadística… ¿Para que nos sirve…? La estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman.

Presentaciones similares


Presentación del tema: "Estadística… ¿Para que nos sirve…? La estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman."— Transcripción de la presentación:

1 Estadística… ¿Para que nos sirve…? La estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza. La estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza. La ciencia por lo general se ocupa de fenómenos observables. La ciencia por lo general se ocupa de fenómenos observables. La ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes. La ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes.

2 Definición: Es la rama de la matemática que comprende métodos y técnicas que se emplean en la recolección, ordenamiento, resumen, análisis, interpretación y comunicación de conjuntos de datos. Descriptiva: Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico. Probabilidad: con objeto de deducir las leyes que rigen esos fenómenos. Inferencia: poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

3 Pasos de un estudio estadístico Plantear hipótesis Obtener conclusiones Recoger datos y analizarlos Diseñar experimento

4 Plantear hipótesis sobre una población Plantear hipótesis sobre una población Los fumadores tienen más bajas laborales que los no fumadores Los fumadores tienen más bajas laborales que los no fumadores ¿En qué sentido? ¿Mayor número? ¿Tiempo medio? ¿En qué sentido? ¿Mayor número? ¿Tiempo medio? Decidir qué datos recoger (diseño de experimentos) Decidir qué datos recoger (diseño de experimentos) Qué individuos pertenecerán al estudio (muestras) Qué individuos pertenecerán al estudio (muestras) Fumadores y no fumadores en edad laboral. Fumadores y no fumadores en edad laboral. Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas? Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas? Qué datos recoger de los mismos (variables) Qué datos recoger de los mismos (variables) Número de bajas Número de bajas Tiempo de duración de cada baja Tiempo de duración de cada baja ¿Sexo? ¿Sector laboral? ¿Otros factores? ¿Sexo? ¿Sector laboral? ¿Otros factores? Recoger los datos (muestreo) Recoger los datos (muestreo) ¿Estratificado? ¿Sistemáticamente? ¿Estratificado? ¿Sistemáticamente? Describir (resumir) los datos obtenidos Describir (resumir) los datos obtenidos tiempo medio de baja en fumadores y no (estadísticos) tiempo medio de baja en fumadores y no (estadísticos) % de bajas por fumadores y sexo (frecuencias), gráficos,... % de bajas por fumadores y sexo (frecuencias), gráficos,... Realizar una inferencia sobre la población Realizar una inferencia sobre la población Los fumadores están de baja al menos 10 días/año más de media que los no fumadores. Los fumadores están de baja al menos 10 días/año más de media que los no fumadores. Cuantificar la confianza en la inferencia Cuantificar la confianza en la inferencia Nivel de confianza del 95% Nivel de confianza del 95% Significación del contraste: p=2% Significación del contraste: p=2%

5 Población y Muestra: Población: Es un conjunto cuyos elementos poseen alguna característica común que se quiere estudiar, ya sea de individuos, de animales, de objetos, de medidas, de producciones, de acontecimientos o de sucesos. La población puede ser finita o infinita. Población: Es un conjunto cuyos elementos poseen alguna característica común que se quiere estudiar, ya sea de individuos, de animales, de objetos, de medidas, de producciones, de acontecimientos o de sucesos. La población puede ser finita o infinita. Muestra: subconjunto de la población al que tenemos acceso y sobre el que realmente asemos las observaciones ( mediciones). Muestra: subconjunto de la población al que tenemos acceso y sobre el que realmente asemos las observaciones ( mediciones). Debería ser representativo Debería ser representativo –Esta formado por miembros seleccionados de la población (individuos, unidades experimentales).

6 Muestreo En estadística un muestreo es la técnica para la selección de una muestra a partir de una población. En estadística un muestreo es la técnica para la selección de una muestra a partir de una población. Al elegir una muestra, se espera que sus propiedades sean extrapoladles a la población. Este proceso permite ahorrar recursos, obteniendo resultados parecidos que si se realizase un estudio de toda la población. Al elegir una muestra, se espera que sus propiedades sean extrapoladles a la población. Este proceso permite ahorrar recursos, obteniendo resultados parecidos que si se realizase un estudio de toda la población.

7 Técnicas de muestreo Muestreo probabilístico: son todos aquellos métodos para los que puede calcularse la probabilidad de extracción de cualquiera de las muestras posibles. -Sin reposición de los elementos. -Con reposición de los elementos. *Sistemático: Se utiliza cuando el universo es de gran tamaño o ha de extenderse en el tiempo. *Estratificado: Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos respecto a característica a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra. (agrupados en estratos) Muestreo por conglomerados: Cuando la población se encuentra dividida, de manera natural, en grupos que se suponen que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio.

8 Variables Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables. Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables. En los individuos de la población humana, de uno a otro es variable: En los individuos de la población humana, de uno a otro es variable: –El grupo sanguíneo {A, B, AB, O} Var. Cualitativa {A, B, AB, O} Var. Cualitativa –Su nivel de felicidad declarado {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal –El número de hijos {0,1,2,3,...} Var. Numérica discreta {0,1,2,3,...} Var. Numérica discreta –La altura {162 ; 174;...} Var. Numérica continua {162 ; 174;...} Var. Numérica continua

9 Tipos de variables Cualitativas: son aquellas cuando las observaciones realizadas se refieren a un atributo (no son numéricas), por ej: sexo, nacionalidad, profesión. Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos) –N–N–N–Nominales: Si sus valores no se pueden ordenar Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No) –O–O–O–Ordinales: Si sus valores se pueden ordenar Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

10 Cuantitativas: son aquellas en que cada observación tiene un valor expresado por un numero real, por ej: peso, temperatura, salario. (tiene sentido hacer operaciones algebraicas con ellos) Cuantitativas: son aquellas en que cada observación tiene un valor expresado por un numero real, por ej: peso, temperatura, salario. (tiene sentido hacer operaciones algebraicas con ellos) –Discretas: Si toma valores enteros Número de hijos, Número de cigarrillos, Num. de cumpleaños. Número de hijos, Número de cigarrillos, Num. de cumpleaños. –Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Altura, Presión intraocular, Dosis de medicamento administrado, edad, peso, estatura. Altura, Presión intraocular, Dosis de medicamento administrado, edad, peso, estatura.

11 Los posibles valores de una variable suelen denominarse modalidades. Las modalidades pueden agruparse en clases (intervalos) –E–E–E–Edades: M Menos de 20 años, de 20 a 50 años, más de 50 años –H–H–H–Hijos: Menos de 3 hijos, De 3 a 5, 6 o más hijos Las modalidades/clases deben forman un sistema exhaustivo y excluyente –E–E–E–Exhaustivo: No podemos olvidar ningún posible valor de la variable –M–M–M–Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)? –B–B–B–Bien: ¿Cuál es su grupo sanguíneo? –E–E–E–Excluyente: Nadie puede presentar dos valores simultáneos de la variable Estudio sobre el ocio –M–M–M–Mal: De los siguientes, qué le gusta: (deporte, cine) –B–B–B–Bien: Le gusta el deporte: (Sí, No) –B–B–B–Bien: Le gusta el cine: (Sí, No) –M–M–M–Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)

12 Presentación de datos Género Frec. Hombre4 Mujer6 Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra.

13 Clasificación de las variables (tipos de escala) Escala nominal: etiquetas simples, solo permite identificar el objeto en estudio. Ej: código de barras, Rut, patente. Escala nominal: etiquetas simples, solo permite identificar el objeto en estudio. Ej: código de barras, Rut, patente. Escala ordinal: mediciones en que que existe un orden implícito, admite grados de calidad. Escala ordinal: mediciones en que que existe un orden implícito, admite grados de calidad. Escala intervalar: considera no solo la información, permite el orden, permite también cuantificar las diferencias entre los individuos que pertenecen a clases o categorías distintas. (En esta escala no existe el cero absoluto) Escala intervalar: considera no solo la información, permite el orden, permite también cuantificar las diferencias entre los individuos que pertenecen a clases o categorías distintas. (En esta escala no existe el cero absoluto) Escala de razón: considera todas las cualidades de la escala anterior, pero si existe el cero absoluto. Ej : escalas de medición KM Escala de razón: considera todas las cualidades de la escala anterior, pero si existe el cero absoluto. Ej : escalas de medición KM

14 Tabulación de datos Frecuencia [f]: numero de veces que se repite un dato (también se le denomina frecuencia absoluta) Frecuencia [f]: numero de veces que se repite un dato (también se le denomina frecuencia absoluta) Frecuencia acumulada [Fac]: es la que se obtiene sumando ordenadamente las frecuencias absolutas hasta la que ocupa la ultima posición Frecuencia acumulada [Fac]: es la que se obtiene sumando ordenadamente las frecuencias absolutas hasta la que ocupa la ultima posición Frecuencia relativa [Fr]: es el cuociente entre la frecuencia absoluta de uno de los valores de la variable y el total de datos, expresado en tanto porciento Frecuencia relativa [Fr]: es el cuociente entre la frecuencia absoluta de uno de los valores de la variable y el total de datos, expresado en tanto porciento Frecuencia relativa acumulada [Frac] es la que se obtiene sumando ordenadamente la frecuencia relativa hasta la que ocupa la ultima posición. Frecuencia relativa acumulada [Frac] es la que se obtiene sumando ordenadamente la frecuencia relativa hasta la que ocupa la ultima posición. Marca de clase: se define como el promedio de lados extremo de un intervalo. Marca de clase: se define como el promedio de lados extremo de un intervalo. Datos a Granel: datos dispersos, datos sueltos Datos a Granel: datos dispersos, datos sueltos

15 Tablas de frecuencia

16 Medidas de tendencia central TRES MEDIDAS SE USAN PARA DESCRIBIR EL CENTRO O LOCALIZACION DE UN CONJUNTO DE DATOS. LA MODA LA MEDIANA LA MEDIA (PROMEDIO) -LA MEDIA GEOMETRICA -LA MEDIA ARMONICA

17 La Moda Interpreta el significado de centro como el valor que ocurre con mayor frecuencia. (el que mas se repite) Se define o calcula: La moda puede no ser única

18 La Mediana La mediana identifica el valor central de los valores provenientes de una muestra. La mediana es entonces una medida de centralidad. La mitad de los valores de la muestra serán mas grandes que la mediana y la otra mitad serán mas pequeños. Se calcula: -Si N es impar: -Si N es par: (Donde Me sera la mediana)

19 La Media Media aritmética: es el valor obtenido sumando las observaciones y dividiendo esta suma por el número de observaciones que hay en el grupo. La media resume en un valor las características de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas Media aritmética: es el valor obtenido sumando las observaciones y dividiendo esta suma por el número de observaciones que hay en el grupo. La media resume en un valor las características de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas -Donde xi es la marca de clase Se calcula:

20 Media geométrica: La media geométrica de N observaciones es la raíz de índice N del producto de todas las observaciones. La representaremos por G. (No interfieren valores o medidas negativas) -Se calcula: La media geométrica de un conjunto de observaciones es la raíz n ésima de su producto. El cálculo de la media geométrica exige que todas las observaciones sean positivas.

21 Media armónica: Media armónica: La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H. -Se calcula:

22 Desviaciones Desviación media: Desviación media: Si calculamos la suma de los errores absolutos y la dividimos por el tamaño de la muestra, es decir, calculamos el promedio de los errores absolutos, obtenemos una medida de dispersión conocida con el nombre de DESVIACION MEDIA (D.M) Errores absolutos: ignora el signo de cada desvío (+/-). En general si disponemos del conjunto de valores x1,x 2……………….x n, la desviación media para estos valores se define por:

23 Desviación estándar: La desviación estándar resulta ser la distancia que se obtiene entre un dato observado o medido y la media de los mismos. Es decir:

24 Gráficos estadísticos Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se emplean para tener una representación visual de la totalidad de la información. Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros.

25 Tipos de gráficos estadísticos Barra Barra Línea Línea Circulares Circulares Áreas Áreas Cartogramas Cartogramas Mixtos Mixtos Histogramas Histogramas Dispersogramas Dispersogramas Pictogramas Pictogramas

26 Gráficos de barras verticales Representan valores usando trazos verticales, aislados o no unos de otros, según la variable a graficar sea discreta o continua. Pueden usarse para representar: Representan valores usando trazos verticales, aislados o no unos de otros, según la variable a graficar sea discreta o continua. Pueden usarse para representar: O una serie O dos o mas series(también llamado de barras comparativas)

27 Gráficos de barras horizontales Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos. Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos. O para una serie O para mas o dos series

28 Gráficos de barras proporcionales Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que componen un total. Las barras pueden ser: Verticales Horizontales

29 Gráficos de barras comparativas Se utilizan para comparar dos o más series, para comparar valores entre categorías. Se utilizan para comparar dos o más series, para comparar valores entre categorías. Las barras pueden ser: Las barras pueden ser: Verticales Verticales horizontales horizontales

30 Gráficos de barras apiladas Se usan para mostrar las relaciones entre dos o mas series con el total. Se usan para mostrar las relaciones entre dos o mas series con el total. Las barras pueden ser: Las barras pueden ser: verticales verticales horizontales horizontales

31 Gráficos de líneas En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. Se pueden usar para representar: Se pueden usar para representar: una serie una serie dos o más series dos o más series

32 Estos gráficos se utilizan para representar valores con grandes incrementos entre sí.

33 Gráficos circulares Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar. Se pueden ser: En dos dimensiones En tres dimensiones

34 Gráficos de Áreas En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un período de tiempo. Pueden ser: Para representar una serie Para representar dos o más series En dos dimensiones En tres dimensiones.

35 Cartogramas Estos tipos de gráficos se utilizan para mostrar datos sobre una base geográfica. La densidad de datos se puede marcar por círculos, sombreado, rayado o color. Estos tipos de gráficos se utilizan para mostrar datos sobre una base geográfica. La densidad de datos se puede marcar por círculos, sombreado, rayado o color.

36 Gráficos Mixtos En estos tipos de gráficos se representan dos o más series de datos, cada una con un tipo diferente de gráfico. Son gráficos más vistosos y se usan para resaltar las diferencias entre las series. En estos tipos de gráficos se representan dos o más series de datos, cada una con un tipo diferente de gráfico. Son gráficos más vistosos y se usan para resaltar las diferencias entre las series. Pueden ser: Pueden ser: en dos dimensiones en dos dimensiones en tres dimensiones. en tres dimensiones. (polígono de frecuencia)

37 Histogramas Estos tipos de gráficos se utilizan para representa distribuciones de frecuencias. Algún software específico para estadística grafican la curva de gauss superpuesta con el histograma.

38 Los dispersogramas Son gráficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso. Son gráficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.

39 Pictogramas Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un pictograma. Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un pictograma. Pueden ser: Pueden ser: En dos dimensiones En dos dimensiones En tres dimensiones. En tres dimensiones.

40 Las ojivas en estadística La ojiva es una gráficas asociada a la distribución de frecuencias, es decir que en ella se permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo. La ojiva apropiada para información que presente frecuencias mayores que el dato que se está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores, tendrá una pendiente positiva.

41 Diagramas Integrales Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. Se pasan de los diferenciales a los integrales por integración y a la inversa por derivación.


Descargar ppt "Estadística… ¿Para que nos sirve…? La estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman."

Presentaciones similares


Anuncios Google