La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

M i g u e l Á n g e l R o d r í g u e z F. 1 1 ESTADISTICA.

Presentaciones similares


Presentación del tema: "M i g u e l Á n g e l R o d r í g u e z F. 1 1 ESTADISTICA."— Transcripción de la presentación:

1 M i g u e l Á n g e l R o d r í g u e z F. 1 1 ESTADISTICA

2 2 Definiciones Conjunto de métodos científicos ligados a la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis. Arte de la decisión en presencia de incertidumbre. La estadística es la ciencia que estudia los métodos que permiten realizar los procesos de encontrar y describir las variables aleatorias de interés y las relaciones entre ellas, para el problema en estudio. Estos métodos permiten resumir datos y acotar el papel de la casualidad (azar).

3 3 ¿Por qué la estadística? ¿Usaron la estadística Galileo, Newton y Einstein? En ciertas ciencias (Biología, Ciencias Humanas, algunos campos de la Física,...) aparece el concepto de experimento aleatorio (experimento que repetido en las "mismas condiciones" no produce el mismo resultado) y asociado al mismo el de variable aleatoria. Una variable no aleatoria (asociada al resultado de una experiencia que sí produce el mismo resultado) está caracterizada por un valor para cada condición. Una variable aleatoria está caracterizada por la llamada función densidad de probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles valores para cada condición.función densidad de probabilidad

4 4 La Estadística, se divide en dos áreas: Estadística descriptiva: Trata de describir las variables aleatorias en las "muestras". Estadística inductiva o inferencial: Trata de la generalización hacia las poblaciones de los resultados obtenidos en las muestras y de las condiciones bajo las cuales estas conclusiones son válidas. Se enfrenta básicamente con dos tipos de problemas:poblacionesmuestras Estimación, que puede ser puntual o por intervalos. Contraste de hipótesis.

5 5 La descripción completa de una variable aleatoria está dada por su función densidad de probabilidad (fdp).función densidad de probabilidad Afortunadamente una gran cantidad de variables de muy diversos campos están adecuadamente descritas por unas pocas familias de fdps: binomial, Poisson, normal, gamma, etc. Dentro de cada familia, cada fdp está caracterizada por unos pocos parámetros, típicamente dos: media y varianza. Por tanto la descripción de una variable indicará la familia a que pertenece la fdp y los parámetros correspondientes. ESTADISTICA DESCRIPTIVA

6 6 Ejemplo: (hipotético) la concentración de glucosa en sangre en individuos no diabéticos, medida en mg/dl, es normal con media 98 y varianza 90. El problema es ¿cómo averiguar la fdp de una variable de interés? La familia, generalmente, se sabe por resultados de la teoría de la probabilidad, aunque, en cada caso, conviene verificarlo. Para conocer los parámetros se deberían conocer los resultados de todos los posibles experimentos (población: conjunto de todos los valores de una variable aleatoria). Generalmente la población es inaccesible, bien es infinita, o aunque finita suficientemente grande para ser inabordable. En consecuencia, se estudian muestras (subconjuntos de la población) que, en caso de ser aleatorias, permiten realizar estimaciones tanto de la familia como de los parámetros de las fdps.

7 7 Muestra aleatoria: muestra elegida independientemente de todas las demás, con la misma probabilidad que cualquier otra y cuyos elementos están elegidos independientemente unos de otros y con la misma probabilidad. Métodos gráficos de representación de muestras: El método gráfico más frecuente es el histograma, que puede adoptar distintas formas.

8 8 Advertencias: 1ª Estos diagramas tienen un fin descriptivo: deben ser fáciles de leer. 2ª El convenio es que la frecuencia sea proporcional al área (es proporcional a la altura sólo si las barras tienen la misma anchura). 3ª Para fines comparativos es mejor usar frecuencias relativas. 4ª El número de clases (barras), cuando la variable no es cualitativa, no debe ser ni muy grande ni muy pequeño. Generalmente se recomiendan entre 5 y 20 clases de igual tamaño. Otro criterio es usar la raíz cuadrada del número de datos. 5ª Los límites de las clases no deben ser ambiguos, p.e. no deben coincidir con valores posibles de los datos (una cifra decimal más).

9 9 POBLACION Y MUESTRA Se le llama así al conjunto de unidades que poseen la característica en estudio. “El conjunto de elementos que poseen la variable por investigar, que han llenado las condiciones de inclusión y que se encuentran disponibles para la investigación en tiempo y espacio” Población Existen 2 tipos de poblaciones: -Finita -Infinita

10 10 POBLACION Y MUESTRA Es aquella porción o subconjunto de elementos de la población en el cual el número (tamaño) y calidad de los elementos representan fielmente a la población. Mientras la población es más homogénea se requerirá de una muestra menor y si la población es más heterogénea se necesitara mayor muestra. Muestra

11 11 Tipos de muestreo Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre una población determinada, nos referimos a este grupo de elementos como muestra. Población Muestra Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la población en su conjunto. La exactitud de la información recolectada depende en gran manera de la forma en que fue seleccionada la muestra.

12 12 Cuando no es posible medir cada uno de los individuos de una población, se toma una muestra representativa de la misma. La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las características que definen la población de la que fue extraída, lo cual nos indica que es representativa. Por lo tanto, la validez de la generalización depende de la validez y tamaño de la muestra.

13 13 Unidades Estadísticas de Muestreo UNIDAD DE INVESTIGACION: Es la unidad mínima que mantiene la integridad de los datos que interesan estudiar y analizar. Es decir, el ente que contiene las partes que se van a analizar. UNIDAD DE ANALISIS: Está definida como el elemento que se examina y del que se busca la información dentro de la unidad de investigación. UNIDAD DE OBSERVACION: Se denomina a la unidad a través de la cual se obtiene la información, esta puede o no coincidir con el elemento. También se denomina unidad respondiente. UNIDADES DE MUESTREO: Son aquellas que contienen las unidades de análisis de la población y que se utilizarán para confeccionar o seleccionar la muestra. En general, es la selección de los conjuntos que serán tomados en cuenta para la conformar la muestra final en la investigación.

14 14 Estadígrafos y Parámetros Población Muestra PARAMETROS N:Tamaño de la población µ: Media poblacional δ 2 : Varianza Poblacional ESTIMADORES O ESTADISTICOS n:Tamaño de la muestra ẍ: Media muestra S 2 : Varianza muestra

15 Miguel Angel Rodríguez Feliciano 15 TIPOS DE VARIABLES POR SU ESTRUCTURA Simple.-Mide un solo indicador (edad, peso, etc.) Compleja.-Se requiere de 2 o más indicadores (IMC) POR LA FORMA DE MEDIRSE -Cualitativas -Nominales (nombres).- Nombra la modalidad de una característica sin compararla con grados de intensidad (Lugar de procedencia). --Dicotómicas.- Tienen solo dos posibles respuestas (sexo, etc.) -Ordinales.- Expresa que elementos pueden poseer características en distintos grados o intensidades (color de la orina, bacterias por campo). -Cuantitativas -Enteras (1, 5, 14, 33, etc.) -Fraccionadas (1.67, 2.35, 0.73, etc..) POR DEPENDENCIA -Independientes (Y) -Dependientes (X)

16 16 RECOLECCION DE DATOS Es el instrumento por medio del cual, el investigador recoge la información de la realidad; dicho instrumento cuenta con 2 tipos de preguntas: a) abiertas y b) cerradas RECOLECCION DE DATOS Observación Experimentación Encuestas ORGANIZACIÓN DE DATOS Ordenación Tabulación Clasificación PRESENTACION DE DATOS Gráficos Cuadros Descripción ANALISIS E INTERPRETACION CONCLUSIONES Y RECOMENDACIONES Cuestionario

17 17 Ejemplo: Sean los datos 3, 5, 7, 7, 8, 9 = 39/6 = 6,5; = 7; moda = 7 MEDIDAS DESCRIPTIVAS Medidas de posición o tendencia Media muestral: Si tenemos X1, X2,..., Xn datos, se llama media muestral de los mismos a su media aritmética Moda muestral: El valor que más se repite (puede no existir y si existe puede no ser única). Mediana muestral: Ordenando los Xi, el valor que está en el medio

18 18 Rango: Si X i están ordenados X n - X 1 aunque para el cálculo se suele usar otra fórmula más cómoda Desviación típica o estándar: Coeficiente de variación: MEDIDAS DESCRIPTIVAS Medidas de Dispersión Varianza:

19 19 DATOS AGRUPADOS Tabla de Distribución de FrecuenciasClasesniFifiFaifai Clases: Grupo de valores ni: Valor medio de clase Fi: Frecuencia absoluta fi: Frecuencia relativa Fai: Frecuencia absoluta acumulada fai: Frecuencia relativa acumulada

20 20 DATOS AGRUPADOSClasesniFifiFaifai Om: Valor mínimo observado OM: Valor Máximo Observado R: Rango= OM – Om K: Número de clases a: Amplitud de clase= (R) / (K) AT: Amplitud de Tabla= (K) (a). La AT ≥ R LCI: Límite de Clase Inferior LCS: Límite de Clase Superior Tabla de Distribución de Frecuencias

21 21ClasesniFifiFaifai N= 120 DATOS AGRUPADOS Tabla de Distribución de Frecuencias

22 22 DATOS AGRUPADOS R= OM – Om = 125 – 77 = 48 a= (R)/(K) = 48 / 8 = 6 AT= (K) (a) = (8) (6) = 48 1er. Límite de Clase Inferior Intervalos de Clase: LCI1LCS1= LCI1+a LCI2=LCS1LCS2= LCI2+a LCI3=LCS2LCS3= LCI3+a: LCIn=LCSn-1LCSn=LCIn+a Tabla de Distribución de Frecuencias

23 23 DATOS AGRUPADOSClasesniFifiFaifai 77 – 83 83 – 89 89 – 95 95 – 101 101 - 107 107 – 113 113 – 119 119 - 125 Tabla de Distribución de Frecuencias

24 24 Histogramas Histograma y Polígono de Frecuencia

25 25 Ojiva de Frecuencias

26 26 Curvas de Distribución de Frecuencias Por la altura de la curva (curtosis): Curtosis: Curtosis: El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Se definen 3 tipos de distribuciones según su grado de curtosis: Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

27 27 Curvas de Distribución de Frecuencias Por la altura de la curva (curtosis): Leptocúrtica Mesocúrtica Platicúrtica

28 28 Curvas de Distribución de Frecuencias Por el agrupamiento de las observaciones: Simétrica Asimétrica: Sesgada a la derecha (sesgo positivo) Asimétrica: Sesgada a la izquierda (sesgo negativo)

29 29 Curvas de Distribución de Frecuencias Por la dispersión de los datos: Homogénea Heterogénea: Bimodal Heterogénea: Multimodal

30 30 DATOS AGRUPADOS Medidas de Tendencia Central Moda: El valor medio de la clase con mayor Fi li:Límite inferior de la clase mediana. Fia:Frecuencia acumulada anterior a la clase mediana. Fi:Frecuencia absoluta de la clase mediana. A:Intervalo de clase.

31 31 DATOS AGRUPADOS Medidas de Dispersión

32 32 MEDIDAS DESCRIPTIVAS Medidas de Localización Cuartiles: Son aquellos valores que divides al conjunto de datos en cuatro partes iguales Q1= N / 4=> Q2= 2N / 4=> Q3= 3N / 4=>

33 33 MEDIDAS DESCRIPTIVAS Medidas de Localización Deciles: Son aquellos valores que divides al conjunto de datos en diez partes iguales D1 = N / 10=> D2 = 2N / 10=> D3 = 3N / 10=> D4 = 4N / 10=> D5 = 5N / 10=> Mediana D6 = 6N / 10=> D7 = 7N / 10=> D8 = 8N / 10=> D9 = 9N / 10=>

34 34 MEDIDAS DESCRIPTIVAS Medidas de Localización Percentiles: Son aquellos valores que divides al conjunto de datos en cien partes iguales P1 = N / 100=> P2 = 2N / 100=> : p50= 50N /100=> Mediana : P98= 98N /100=> P99= 99N /100=>

35 35 Distribución Normal Representación gráfica de esta función de densidad Media, Mediana y Moda, se encuentran muy cercanas unas de otras

36 36

37 37

38 38 Representación gráfica la función Z a la variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva normal tipificada.

39 39 Característica de la distribución normal tipificada (reducida, estándar) No depende de ningún parámetro Su media es 0, su varianza es 1 y su desviación típica es 1. La curva f(x) es simétrica respecto del eje OY Tiene un máximo en este eje Tiene dos puntos de inflexión en z =1 y z = -1

40 40


Descargar ppt "M i g u e l Á n g e l R o d r í g u e z F. 1 1 ESTADISTICA."

Presentaciones similares


Anuncios Google