La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ESTADÍSTICA I Prof. MSc. Edwin Gerardo Acuña Acuña San José. Costa Rica. 2013 1.

Presentaciones similares


Presentación del tema: "ESTADÍSTICA I Prof. MSc. Edwin Gerardo Acuña Acuña San José. Costa Rica. 2013 1."— Transcripción de la presentación:

1 ESTADÍSTICA I Prof. MSc. Edwin Gerardo Acuña Acuña San José. Costa Rica

2 ¿Qué es estadística?¿Qué es estadística? 2

3 La estadística es una rama de las matemáticas, que a través de un conjunto de técnicas, métodos, normas, reglas y procedimientos que se ocupan en observar, reunir, agrupar, cuantificar y organizar los datos de una muestra, permita no solo describir un hecho o comportamiento de un fenómeno, también analizar y evaluar conclusiones acerca de una población.La estadística es una rama de las matemáticas, que a través de un conjunto de técnicas, métodos, normas, reglas y procedimientos que se ocupan en observar, reunir, agrupar, cuantificar y organizar los datos de una muestra, permita no solo describir un hecho o comportamiento de un fenómeno, también analizar y evaluar conclusiones acerca de una población. 3

4 Cualquier persona recibe información en forma de datos a través de los periódicos, la televisión u otros medios; y a menudo es necesario obtener alguna conclusión a partir de la información contenida en los datos.Cualquier persona recibe información en forma de datos a través de los periódicos, la televisión u otros medios; y a menudo es necesario obtener alguna conclusión a partir de la información contenida en los datos. 4

5 Ejemplos de aplicación de la Estadística. 5

6 Ejercicio 1 Se desea investigar durante el mes de enero de este año, la opinión de los costarricenses mayores de 18 años sobre los distintos casos de corrupción que involucra a expresidentes.Se desea investigar durante el mes de enero de este año, la opinión de los costarricenses mayores de 18 años sobre los distintos casos de corrupción que involucra a expresidentes. 6

7 Ejercicio 2 Se desea conocer el porcentaje de personas que observó el último encuentro de fútbol de la selección nacional, para ello se realizará un estudio telefónico en el Gran Área Metropolitana, entre personas mayores de 12 años.Se desea conocer el porcentaje de personas que observó el último encuentro de fútbol de la selección nacional, para ello se realizará un estudio telefónico en el Gran Área Metropolitana, entre personas mayores de 12 años. 7

8 Ejercicio 3 Ingreso salarial neto de los empleados del ICE.Ingreso salarial neto de los empleados del ICE. El número de citas que atiende una clínica.El número de citas que atiende una clínica. El grado académico de un profesor universitario.El grado académico de un profesor universitario. El distrito de residencia de los costarricenses.El distrito de residencia de los costarricenses. El número de personas que mueren a causa del SIDA cada año.El número de personas que mueren a causa del SIDA cada año. Si una persona ha visitado el parque Simón Bolívar.Si una persona ha visitado el parque Simón Bolívar. Nivel de rating de una emisora radialNivel de rating de una emisora radial Número de placa de un vehículoNúmero de placa de un vehículo 8

9 Proporcionar las técnicas, métodos y procedimientos requeridos para describir y analizar un conjuntos de datos y así simplificar sus resultados.Proporcionar las técnicas, métodos y procedimientos requeridos para describir y analizar un conjuntos de datos y así simplificar sus resultados. Permite describir sus características y analizar el estudio de los fenómenos, de los datos destacados (HOLGUIN, 1993, Pág. 14)Permite describir sus características y analizar el estudio de los fenómenos, de los datos destacados (HOLGUIN, 1993, Pág. 14) Obtener conclusiones de una población, a partir de la descripción y análisis realizados a una muestra. (SANDOVAL, 2001, P. 15)Obtener conclusiones de una población, a partir de la descripción y análisis realizados a una muestra. (SANDOVAL, 2001, P. 15) 9

10 Las técnicas estadísticas utilizadas para interpretar los datos de una investigación pueden ser clasificadas en dos grandes grupos en función de que su objetivo sea describir las características observadas de una muestra o inferir conclusiones sobre la población de la que dicha muestra ha sido extraída. SE CLASIFICA EN DOS RAMAS DESCRIPTIVA INFERENCIAL 10

11 PROCESO La estadística descriptiva es una rama de la estadística, que se encarga en representar a un fenómeno refiriendo variables que caracterizan los datos de la muestra de una población. El proceso que sigue la estadística descriptiva para el estudio de una cierta población consta de los siguientes pasos: 11

12 Selección de variables e indicadores (es una manifestación, observable y medible de los componentes de una variable) (Quivy, 2000) Mediante la recolección de datos se obtiene el valor de cada individuo en los caracteres seleccionados de la muestra. Elaboración de tablas de frecuencias, mediante la adecuada ordenación, clasificación y distribución de los datos del fenómeno estudiado. Representación gráfica de los resultados. 12

13 La estadística inferencial, extrae y analiza las características de los datos obtenidos de una muestras formados por individuos de una población. A partir del estudio de la muestra se pretende conducir a un resultado de los aspectos relevantes de toda la población. Para cuyo estudio se requiere de conocimientos de estadística, probabilidad y matemáticas. (Esta rama de la estadística se estudia en la asignatura Estadística Aplicada a la Investigación Social II) 13

14 Concepto de estadística descriptiva e Inferencial. 14

15 POBLACION Es un conjunto de valores posibles o el recuento de todos los elementos que presentan una característica común que toma de un colectivo o universo de objetos, ideas, acontecimientos o individuos, al cual se refiere el estudio que se pretende realizar. El termino población, se usa para denotar el conjunto de elementos del cual extrae una muestra. 15

16 MUESTRA Es un subconjunto de una población la cual nos puede servir para generalizar acerca de la población de estudio. Es un subconjunto de una población la cual nos puede servir para generalizar acerca de la población de estudio. Muestra aleatoria: Esta se obtiene cuando seleccionamos una muestra de una población en la que todos los elementos son INDEPENDIENTES Y tienen IGUAL oportunidad de ser seleccionados 16

17 MUESTRA La muestra nos sirve para poder representar el comportamiento de la población con alto grado de confianza.La muestra nos sirve para poder representar el comportamiento de la población con alto grado de confianza. El éxito del proyecto depende de la forma en que se seleccione al elemento que participará en el estudio.El éxito del proyecto depende de la forma en que se seleccione al elemento que participará en el estudio. 17

18 Por qué emplear muestras?Por qué emplear muestras? –La población es infinita –Población finita pero muy grande, sería imposible o muy costoso estudiarla. –La unidad estadística se transforma o destruye al ser analizada –Los resultados que se obtendrían al realizar una encuesta por muestreo serían suficientes y precisos. 18

19 Existen diferentes tipos de diseño de muestreo, cada uno de ellos tienen características que se pueden ocupar según el tipo de población y el objetivo la investigación. Es un proceso que determina cómo serán seleccionados los elementos de una parte de la población, para que se puedan obtener conclusiones fiables a partir de la muestra, es importante tanto su tamaño como el modo en que han sido extraídos los objetos, ideas, acontecimientos o individuos que componen el estudio. 19

20 Tipos de muestras Aleatorias:Aleatorias: –Muestreo simple al azar –Muestreo sistemático –Muestreo estratificado –Muestreo por conglomerados n No aleatorias: –Muestreo por cuotas –Muestreo por criterio –Muestreo por conveniencia 20

21 Error de muestreo Se presenta sólo en muestras aleatorias.Se presenta sólo en muestras aleatorias. Es la diferencia entre el resultado dado por la muestra y el resultado que se hubiera obtenido si se hubiera hecho un censo.Es la diferencia entre el resultado dado por la muestra y el resultado que se hubiera obtenido si se hubiera hecho un censo. Ventaja: se puede medir haciendo uso de la teoría de la probabilidad.Ventaja: se puede medir haciendo uso de la teoría de la probabilidad. 21

22 Sesgo Error sistemático (se da en todas las observaciones) en un sólo sentido.Error sistemático (se da en todas las observaciones) en un sólo sentido. No es medible.No es medible. TiposTipos –Sesgo de selección. –Sesgo de medición. 22

23 DATO Se le conoce como dato u observación, a cada resultado que se obtiene al realizar un experimento.Se le conoce como dato u observación, a cada resultado que se obtiene al realizar un experimento. 23

24 INFORMACION A menudo se tiene que organizar los hechos para que te digan algo. Es en ese momento en que habrás convertido los datos en información.A menudo se tiene que organizar los hechos para que te digan algo. Es en ese momento en que habrás convertido los datos en información. 24

25 Un instrumento es un mecanismo por el cual se recopilan datos con las variables que pretende medir a través de: la observación encuesta entrevista o cuestionario basados en los objetivos de la investigación. EL INSTRUMENTO TIENE QUE TENER LAS PROPIEDADES DE: VALIDEZCONFIABILIDAD 25

26 Validez de contenido Validez de criterio Validez de constructo El termino validez denota la utilidad científica de un instrumento de medida en el que puede establecer ampliamente qué tan bien mide lo que pretende medir. A la validez se le ha dado tres significados principales: 26

27 VALIDEZ DE CONTENIDO Se refiere al grado en que la medición abarca la gama de significados que comprende el concepto (marco teórico) VALIDEZ DE CRÍTERIO Se basa en algún juicio externo (expertos) VALIDEZ DE CONSTRUCTO Se refiere al grado en que una medición se relaciona consistentemente con otras mediciones. En la medida en que la variable es abstracta y observable se le denomina de constructo. 27

28 Medidas de estabilidad (Test-retest) Método de formas alternativas o paralelas Método de mitades partidas (Split-Halves) Coeficiente alfa de Cronbach Coeficiente KR-20 Kuder y Richardson El termino confiabilidad es una medida práctica de que tan consistente y estable podría ser un instrumento de medición o prueba. Existen diversos procedimientos para calcular la confiabilidad de un instrumento de medición entre los más utilizados son: 28

29 Fuentes de información Fuentes primarias: Publican o suministran datos recogidos por ellas mismas.Fuentes primarias: Publican o suministran datos recogidos por ellas mismas. Fuentes secundarias: Toman datos recogidos o publicados anteriormente por otras.Fuentes secundarias: Toman datos recogidos o publicados anteriormente por otras. 29

30 Técnicas de Recolección de la información ENTREVISTA ENTREVISTA –Personal Personal –Telefónica Telefónica CUESTIONARIO AUTOADMINISTRADO CUESTIONARIO AUTOADMINISTRADO CUESTIONARIO AUTOADMINISTRADO CUESTIONARIO AUTOADMINISTRADO OBSERVACION Y MEDICION OBSERVACION Y MEDICION OBSERVACION Y MEDICION OBSERVACION Y MEDICION REGISTRO REGISTRO REGISTRO Requieren Cuestionario estructuradoRequieren Cuestionario estructurado 30

31 ENTREVISTA PERSONAL Motiva al entrevistadoMotiva al entrevistado Permite aclarar preguntas y/o verificar respuestas.Permite aclarar preguntas y/o verificar respuestas. Alto porcentaje de respuestaAlto porcentaje de respuesta Permite accesar a todos los elementos de la poblaciónPermite accesar a todos los elementos de la población Alto costo Desconfianza del entrevistado Longitud limitada (en ocasiones) Influencia del entrevistador puede ser un elemento distorsionador 31

32 ENTREVISTA TELEFONICA Bajo costoBajo costo Alto porcentaje de respuestaAlto porcentaje de respuesta Permite verificar las respuestasPermite verificar las respuestas Más flexible con respecto a la hora de la entrevistaMás flexible con respecto a la hora de la entrevista Longitud limitada No permite accesar a todos los elementos de la población (no todos tienen teléfono) 32

33 CUESTIONARIO AUTOADMINSTRADO Bajo costoBajo costo Longitud ilimitadaLongitud ilimitada Libertad de respuestaLibertad de respuesta Mayor tiempo para responderMayor tiempo para responder Permite tratar temas delicados o embarazososPermite tratar temas delicados o embarazosos Porcentaje de respuesta bajo Dificulta la aclaración de dudas Requiere informantes con nivel educativo alto Requiere un sistema de correo eficiente 33

34 OBSERVACION Y MEDICION Neutralidad u objetividadNeutralidad u objetividadErrores en la observación Instrumento mal calibrado Instrumento mal utilizado Alto costo en algunos casos No se pueden verificar los datos 34

35 REGISTRO Bajo costoBajo costo Información real y objetivaInformación real y objetiva Puede tener información desactualizada o incompleta La información disponible no siempre coincide con los fines estadísticos. 35

36 El Cuestionario IdentificaciónIdentificación Párrafo introductorioPárrafo introductorio TamañoTamaño Numeración Numeración Caracteres tipográficos (Tipo de letra, Negrita) Caracteres tipográficos (Tipo de letra, Negrita) Símbolos de ayuda (-->, * )Símbolos de ayuda (-->, * ) 36

37 El Cuestionario Clasificación de las preguntasClasificación de las preguntas –Cerradas De escogencia única De escogencia única De escogencia múltiple De escogencia múltiple De rangos De rangos De notas De notas –Abiertas –Abiertas con alguna clasificación 37

38 El Cuestionario PrecodificaciónPrecodificación Prueba del cuestionarioPrueba del cuestionario Revisión y CríticaRevisión y Crítica CodificaciónCodificación TabulaciónTabulación 38

39 El Cuestionario Longitud del cuestionarioLongitud del cuestionario Orden o secuencia de las preguntasOrden o secuencia de las preguntas –Iniciales –Flujo de los temas –Delicadas Estilo de redacción de las preguntasEstilo de redacción de las preguntas –Clara, comprensible, precisa y lo más específica posible. –No debe incomodar al entrevistado –Debe referirse a un solo aspecto –No debe inducir las respuestas 39

40 Fases de una investigación estadística Planteamiento del problema.Planteamiento del problema. Diseño del instrumento de recolecciónDiseño del instrumento de recolección Obtención de la información.Obtención de la información. Preparación de la informaciónPreparación de la información Análisis e Interpretación.Análisis e Interpretación. Presentación de resultados.Presentación de resultados. 40

41 Presentación de la Información Presentación TextualPresentación Textual En comparación con 1998, la economía experimentó en 1999 una reducción en la tasa de crecimiento, pues alcanzó apenas el 2.5%, mientras que el promedio anual entre 1985 y 1998 había sido de 4.9% 41

42 Presentación semitabularPresentación semitabular En el último mes, la mayoría de los bancos ha disminuido los intereses para vivienda, como se puede apreciar a continuación: Se espera que esta reducción de intereses incentive el sector de la producción. Presentación de la Información 42

43 Presentación tabular: Cuadros Muestran la información de forma ordenada por filas y por columnas, de manera visualmente agradable.Muestran la información de forma ordenada por filas y por columnas, de manera visualmente agradable. Permiten presentar y divulgar la información de una manera fácil de interpretar y útil para el usuario.Permiten presentar y divulgar la información de una manera fácil de interpretar y útil para el usuario. 43

44 Componentes de un cuadro Número de cuadro Número de cuadro Título Título Columna matriz Columna matriz Encabezados Encabezados Cuerpo o contenido Cuerpo o contenido Nota introductoria o preliminar Nota introductoria o preliminar Nota al pie Nota al pie Fuente Fuente 44

45 Cuadro # TITULO (nota introductoria) Columna Matriz Encabezados CUERPO Nota al pie FUENTE 45

46 CUADRO 2 CONSUMO DE DROGAS SEGÚN CANTÓN DE RESIDENCIA POR TIPO DE DROGA, COSTA RICA, 2,000 (Valores Porcentuales) * *Datos preliminares FUENTE: Consumo de alcohol, tabaco y otras drogas. Distribución geográfica I.A.F.A. 46

47 EXPERIMENTO Actividad planeada cuyos resultados producen un conjunto de datos.Actividad planeada cuyos resultados producen un conjunto de datos. 47

48 PARÁMETRO Valor numérico que resume toda la información de una población completa.Valor numérico que resume toda la información de una población completa. Promedio, moda, mediana, desviación estándar, rango, etc.Promedio, moda, mediana, desviación estándar, rango, etc. 48

49 Existen diferentes tipos de variables, entre las más utilizadas son: VARIABLES CUALITATIVAS CUANTITATIVAS Una variable es susceptible de medir cualquier característica de un objeto que pueda tomar diferentes valores de un conjunto de datos (Un dato es una medida que se realiza sobre los sujetos de un experimento). 49

50 EJEMPLO: Sexo, estado civil, o la profesión de una persona. Una variable cualitativa, también llamada no numérica, se denomina por sus atributos porque expresa distintas cualidades, características o modalidades, que son susceptibles de describirse mediante palabras, cuya medición solo puede ser por una escala nominal u ordinal. 50

51 TIPOS DE VARIABLES CUALITATIVASTIPOS DE VARIABLES CUALITATIVAS Dicotómicas: Sólo hay dos categoría, que son excluyentes una de la otraDicotómicas: Sólo hay dos categoría, que son excluyentes una de la otra Ejemplo: enfermo-sano, muerto-vivo, mujer- hombreEjemplo: enfermo-sano, muerto-vivo, mujer- hombre Nominal: tiene mas de dos categorías y no hay orden entre ellas. Nominal: tiene mas de dos categorías y no hay orden entre ellas. Ejemplo: color de los ojos, grupo sanguíneoEjemplo: color de los ojos, grupo sanguíneo Ordinal: tiene varias categorías y hay orden entre ellas.Ordinal: tiene varias categorías y hay orden entre ellas. Ejemplo: grado tumoral, calificación del riesgo en anestesia.Ejemplo: grado tumoral, calificación del riesgo en anestesia. 51

52 Una variable cuantitativa, también llamada numérica, es aquella susceptible de ser expresada numéricamente, cuya medición puede ser utilizada con una escala de intervalo o de razón según el objetivo de la investigación. EJEMPLO: A los pacientes atendidos en la Institución Musas de Metal se les pregunta el ingreso mensual de sus familias. $0 a $5,999 b) $6,000 a $11,999 c)$12,000 a $17,999 d)$18,000 a $23,999 52

53 TIPOS DE VARIABLES CUANTITATIVASTIPOS DE VARIABLES CUANTITATIVAS Continuas: números infinito no numerables de elementos. Tiene asociado el concepto de medidaContinuas: números infinito no numerables de elementos. Tiene asociado el concepto de medida Ejemplo: Presión arterial, Edad, peso.Ejemplo: Presión arterial, Edad, peso. Discretas: números finitos o infinitos numerables de elementos. Se asocia con el concepto de conteo.Discretas: números finitos o infinitos numerables de elementos. Se asocia con el concepto de conteo. Ejemplo: N° de hijos, N° de casos de tuberculosis por estado.Ejemplo: N° de hijos, N° de casos de tuberculosis por estado. 53

54 Hay ocasiones en las que las medidas cuantitativas continuas son transformadas en ordinales mediante la utilización de uno o varios puntos de corte.Hay ocasiones en las que las medidas cuantitativas continuas son transformadas en ordinales mediante la utilización de uno o varios puntos de corte. Ejemplo: La variable peso es codificada en varias categorías y se utiliza en términos como: Bajo-peso, peso-normal, Sobrepeso, ObesidadEjemplo: La variable peso es codificada en varias categorías y se utiliza en términos como: Bajo-peso, peso-normal, Sobrepeso, Obesidad 54

55 Las descripciones numéricas de datos suelen ser importantes. Dado un conjunto de n observacionesLas descripciones numéricas de datos suelen ser importantes. Dado un conjunto de n observaciones La estadística descriptiva nos puede ayudar mediante resúmenes numéricos, que son medidas de tendencia central, o también llamadas de posición y medidas de dispersiónLa estadística descriptiva nos puede ayudar mediante resúmenes numéricos, que son medidas de tendencia central, o también llamadas de posición y medidas de dispersión 55

56 RECOPILACION DE DATOS Es el proceso mediante el cual obtenemos los datos u observaciones de una muestra.Es el proceso mediante el cual obtenemos los datos u observaciones de una muestra. Posteriormente los datos se organizarán de acuerdo al uso que se les de.Posteriormente los datos se organizarán de acuerdo al uso que se les de. Experimento, encuesta, censo.Experimento, encuesta, censo. 56

57 ORGANIZAR Si se tiene una serie de datos, primero hay que organizarlos en forma ordenada y en subconjuntos que presenten características similares. Si se tiene una serie de datos, primero hay que organizarlos en forma ordenada y en subconjuntos que presenten características similares. Los datos agrupados se pueden resumir gráficamente o en tablas y mediante medidas numéricas (parámetros) que obtendremos posteriormente como la media, la mediana, la desviación estándar, etc. Los datos agrupados se pueden resumir gráficamente o en tablas y mediante medidas numéricas (parámetros) que obtendremos posteriormente como la media, la mediana, la desviación estándar, etc. 57

58 Los datos ordenados en grupos o categorías reciben el nombre de:Los datos ordenados en grupos o categorías reciben el nombre de: distribución de frecuencias. distribución de frecuencias. Para obtener el rango de una distribución de frecuencias, se realiza la diferencia entre el mayor y el menor valor de los datos.Para obtener el rango de una distribución de frecuencias, se realiza la diferencia entre el mayor y el menor valor de los datos. Cuando se tiene un gran número de datos, habrá que distribuirlos en : clases, categorías.Cuando se tiene un gran número de datos, habrá que distribuirlos en : clases, categorías. 58

59 Marca de Clase Frecuencia Absoluta. Frecuencia Relativa. Frecuencia Porcentual. Frecuencia Acumulada. Algunos tipos de distribución La distribución de datos ó de frecuencias la cual es la presentación de cuadros o tablas estadísticas. El objetivo principal de una distribución de frecuencias consiste en presentar los datos de un modo que facilite su comprensión e interpretación. 59

60 . Tabla No 1.3 Datos de la encuesta del ahorro mensual de acuerdo al salario que perciben los trabajadores. (pesos mexicanos) VARIABLE FRECUENCIA ABSOLUTA AHORROF Total60 La frecuencia absoluta, es el número de veces que se repite un determinado valor o una determinado atributo de la variable. Está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta y la suma de las frecuencias absolutas debe ser igual al número total de los datos en estudio. 60

61 SE OBTIENE FR = F Frecuencia del intervalo N Suma de frecuencias La frecuencia relativa consiste en la proporción del número total de datos que aparece en cada intervalo, la suma de la frecuencia es siempre la unidad (1). Se obtiene al dividir la frecuencia absoluta de cada intervalo entre el número total de datos o elementos del conjunto. La frecuencia relativa también se expresa, en ocasiones, en tanto por ciento 61

62 La frecuencia porcentual, consiste en calcular el porcentaje de la relación que se establece entre una de las partes con respecto al todo multiplicándolas por 100, que pertenece a cada intervalo o categoría. La frecuencia porcentual también se expresa, en ocasiones en frecuencia relativa. La palabra porcentaje significa por cien. PORCENTAJE = ( F / N ) X 100 PORCENTAJE = FR X 100 Ó 62

63 VARIABLE FRECUENCIA ABSOLUTAACUMULADA AHORROFFA Total60 La frecuencia acumulada, indica cómo se van concentrando los datos de un valor de cada intervalo o una determinada modalidad del atributo. Puede incluir a cualquiera de las frecuencias: absoluta, relativa o porcentual; sugiriendo se calcule sólo la que sea necesaria para los fines de la investigación. Tabla No. 1.6 Datos de la encuesta del ahorro mensual de acuerdo al salario que perciben los trabajadores. (pesos mexicanos) 63

64 Marca de clase = ( Límite inferior + Límite superior ) / Intervalos de clase Con clasificación continua Marca de Clase X La marca de clase, solo es aplicable a datos agrupados y es: Es el punto medio de cada intervalo de clase. Es el valor que representa a todos los datos que puedan estar integrados en éste. 64

65 VARIABLE FRECUENCIA MARCA DE CLASE ABSOLUTARELATIVAPORCENTUALACUMULADA AHORROFFR%FAMC , , , , , , , Total Tabla No. 1.7 Se ha realizado una encuesta a 60 personas a las que se les ha preguntado cuanto dinero ahorran mensualmente de acuerdo al salario que perciben, obteniéndose los siguientes resultados (pesos mexicanos) 65

66 DIAGRAMA DE BARRAS OJIVA SECTORIAL HISTOGRAMA POLIGONOS DE FRECUENCIA Las gráficas se basa por completo en una tabla de datos y sirve para visualizar la forma de distribución de los datos, porque permite mostrar, explicar, interpretar y describir de manera sencilla, clara y efectiva, los datos estadísticos mediante formas geométricas tales como líneas, áreas, volúmenes. Para la descripción gráfica, podrá disponer de una amplia galería de gráficas entre las más utilizadas son: 66

67 Fig. No. 1 Histograma Ahorro (colones) FrecuenciaFrecuencia I n t e r v a l o Cuantitativa Se considera uno de las más sencillas y útiles de representar los datos cuantitativos (numéricas) Representa a los niveles de medición ordinal, de intervalo o de razón Se puede graficar con la frecuencia: absoluta, porcentual ó relativa, según los objetivos de la investigación 67

68 HISTOGRAMA 68

69 C a t e g o r i a Cualitativa Es una gráfica más utilizada por su sencillez, para representar las características cuantitativas (numérica) y cualitativas (no numérica) Representa a los niveles de medición nominal u ordinal Se puede graficar con la frecuencia: absoluta, porcentual o relativa Fig. No. 2 Diagrama de Barras Percepción del ahorro (colones) 69

70 Para ello se utiliza la siguiente expresión aritmética: Total de grados = ( porcentaje ) ( 360 ) Se utilizada para representar principalmente variables cualitativas (no numéricas) Representa al nivel de medición nominal Se puede graficar con la frecuencia: porcentual o relativa Resultan adecuado cuando hay pocos valores Cualitativas Porcentajes Fig. No. 3 Gráfica sectorial Ahorro (dólares) 70

71 FrecuenciaFrecuencia Se utiliza para representar principalmente variables cuantitativas (numéricas) Representa al nivel de medición de intervalo o de razón Se puede graficar con la frecuencia: marca de clase Fig. No. 4 Polígono de Frecuencia Ahorro (euros) 71

72 POLIGONO DE FRECUENCUA 72

73 Fig. No. 5 Ojiva Ahorro (colones) Los polígonos de frecuencia pueden emplearse asimismo para representar frecuencia acumulada que en tal caso resulta designar como ojiva. Es aplicable a variables ordinales. Representa a la distribución de frecuencias acumuladas, sean absolutas, porcentuales o relativas. Es una gráfica ascendente. 73

74 CLASE Ó CATEGORIA La utilidad de lo anterior, es que se puede analizar con mayor facilidad un conjunto de números sin que se tenga que considerar cada número.La utilidad de lo anterior, es que se puede analizar con mayor facilidad un conjunto de números sin que se tenga que considerar cada número. Una categoría o clase recibe el nombre de :Una categoría o clase recibe el nombre de : intervalo de clase. intervalo de clase. 74

75 INTERVALO DE CLASE Los valores extremos de un intervalo de clase reciben el nombre de:Los valores extremos de un intervalo de clase reciben el nombre de: limites de clase. (inferior y superior) Existen otros limites de gran importancia llamados limites reales de clase. Para hallar el limite real inferior se suma el limite inferior mas el número anterior y esto se divide entre dos. 75

76 Para hallar el limite real superior se suma el limite superior mas el número que le sigue y esto se divide entre dos. Tamaño o anchura de clase: basta con realizar la diferencia entre los limites reales considerando primero el superior. Marca de clase: se obtiene sumando los limites superior e inferior y dividiendo entre dos. 76

77 Con la información anterior podemos formar las distribuciones de frecuencia con mayor facilidad si consideramos primero el rango. Después de calcularlo, lo dividimos en un número conveniente de intervalos de clase del mismo tamaño y considerando al mismo tiempo que las marcas de clase coincidan en lo posible con los datos que fueron observados. Por último indicamos la frecuencia de clase. Con la información anterior podemos formar las distribuciones de frecuencia con mayor facilidad si consideramos primero el rango. Después de calcularlo, lo dividimos en un número conveniente de intervalos de clase del mismo tamaño y considerando al mismo tiempo que las marcas de clase coincidan en lo posible con los datos que fueron observados. Por último indicamos la frecuencia de clase. 77

78 Al construir una distribución de frecuencias podemos representarla gráficamente, ya sea por medio de un histograma (rectángulo sobre el eje X) o por un polígono de frecuencias (gráfico de línea trazado sobre las marcas de clase)Al construir una distribución de frecuencias podemos representarla gráficamente, ya sea por medio de un histograma (rectángulo sobre el eje X) o por un polígono de frecuencias (gráfico de línea trazado sobre las marcas de clase) histogramapolígono de frecuencias histogramapolígono de frecuencias 78

79 II semana 79

80 EJEMPLO 1 EJEMPLO 1 Se tiene el número de accidentes que ocurren día a día durante un periodo de 50 días en la autopista Veracruz-Xalapa. Se tiene el número de accidentes que ocurren día a día durante un periodo de 50 días en la autopista Veracruz-Xalapa DIA 24 80

81 Observar que los datos constan de enteros. Observar que los datos constan de enteros. Puesto que el mayor número de accidentes es 9 y el menor es 0, por lo tanto el : Puesto que el mayor número de accidentes es 9 y el menor es 0, por lo tanto el : rango: 9 – 0 = 9 rango: 9 – 0 = 9 Considerando 5 intervalos de clase: Considerando 5 intervalos de clase: (Rango + 1)/5 = (9+1)/5=10/5=2 (Rango + 1)/5 = (9+1)/5=10/5=2 Podemos considerar que cada intervalo de clase constará de : 2 elementos. Podemos considerar que cada intervalo de clase constará de : 2 elementos. 81

82 Formando los intervalos de clase y contabilizando la cantidad de elementos en cada intervalo de clase obtenemos la siguiente distribución de frecuencia: Formando los intervalos de clase y contabilizando la cantidad de elementos en cada intervalo de clase obtenemos la siguiente distribución de frecuencia: INTERVALOS DE CLASE FRECUENCIA Total ( N) = ºDIA 15DIA 15 2ºDIA 22DIA 22 82

83 Identificando las partes de la distribución de frecuencia: Identificando las partes de la distribución de frecuencia: Primer intervalo de clase: 0-1 Primer intervalo de clase: 0-1 Frecuencia de la tercera de clase: 16Frecuencia de la tercera de clase: 16 Limite inferior del primer intervalo de clase: 0Limite inferior del primer intervalo de clase: 0 Limite superior del tercer intervalo de clase: 5Limite superior del tercer intervalo de clase: 5 Tamaño de tercera la clase: = 2Tamaño de tercera la clase: = 2 Marca de la primer clase : (0+1)/2=.5Marca de la primer clase : (0+1)/2=.5 Marca de la quinta clase : (8+9)/2=8.5 …etc.Marca de la quinta clase : (8+9)/2=8.5 …etc. 83

84 FRECUENCIA RELATIVA Es la frecuencia de clase dividida por el total de frecuencias de todas las clases. El resultado se expresa generalmente como porcentajes.Es la frecuencia de clase dividida por el total de frecuencias de todas las clases. El resultado se expresa generalmente como porcentajes. F.R.= f/ N o bien: F.R.%=(f/N) * 100 F.R.= f/ N o bien: F.R.%=(f/N) * 100 Esto nos servirá para la representación gráfica circular o de pastel.Esto nos servirá para la representación gráfica circular o de pastel. 84

85 FRECUENCIA ACUMULADAS Este tipo de frecuencia está diseñada para mostrar el número o porcentajes de elementos que son menores que cierto valor específico o iguales a este.Este tipo de frecuencia está diseñada para mostrar el número o porcentajes de elementos que son menores que cierto valor específico o iguales a este. 85

86 DISTRIBUCION DE FRECUENCIA RELATIVA RELATIVA F.R. (0-1)= 5/50 = 0.10 o bien 10% F.R. (0-1)= 5/50 = 0.10 o bien 10% F.R. (2-3)= 11/50= 0.22 o bien 22% F.R. (2-3)= 11/50= 0.22 o bien 22% F.R. (4-5)= 16/50= 0.32 o bien 32% F.R. (4-5)= 16/50= 0.32 o bien 32% F.R. (6-7)= 13/50= 0.26 o bien 26% F.R. (6-7)= 13/50= 0.26 o bien 26% F.R. (8-9)= 5/50 = 0.10 o bien 10% F.R. (8-9)= 5/50 = 0.10 o bien 10% % % 86

87 DISTRIBUCION DE FRECUENCIA ACUMULADA F.A. (0-1) 0.10 F.A. (2-3) =0.32 F.A. (4-5) =0.64 F.A. (6-7) =0.90 F.A. (8-9) =1.00 Se puede observar que el 64% de los días no excedió de 5 accidentes y que el 90% de los días no excedió de 7 accidentes. 87

88 HISTOGRAMA DE FRECUENCIAS RELATIVAS 88

89 POLIGONO DE FRECUENCIAS ACUMULADAS 89

90 EJEMPLO 2 CONSIDEREMOS LA EDAD DE CIEN ADULTOS MAYORES QUE VARIAN ENTRE 60 Y 74 AÑOS QUE VARIAN ENTRE 60 Y 74 AÑOS

91 RESOLUCION DE EJEMPLO 2 Rango 74-60= 14 añosRango 74-60= 14 años Dividiremos todo en cinco intervalos de clase.Dividiremos todo en cinco intervalos de clase. intervalos de clase (AÑOS) intervalos de clase (AÑOS)

92 RESOLUCION DE EJEMPLO 2 60Limite inferior del primer intervalo de clase. 62Limite superior de primer intervalo de clase. (59+60)/2 = 59.5 Limite real inferior. (62+63)/2 = 62.5 Limite real superior. TamañoC = = 3 C = = 3, …….., etc. 92

93 DISTRIBUCION DE FRECUENCIAS (AÑOS) ( ADULTOS MAYORES) (AÑOS) ( ADULTOS MAYORES) INTERVALOS DE CLASE FRECUENCIAS

94 RESOLUCION DE EJEMPLO 2 Marca de ClaseMarca de Clase (60+62)/2 = 61 (63+65)/2 = 64, ……., etc 94

95 DISTRIBUCION DE FRECUENCIAS MARCAS DE CLASE FRECUENCIA N= 100 N= 100 AÑOS ADULTOS MAYORES 95

96 DISTRIBUCIÓN DE FRECUENCIA RELATIVA. Distribución de frecuencia relativa.Distribución de frecuencia relativa. F. R. (60-62) = 5/100 = 0.05 F. R. (60-62) = 5/100 = 0.05 F. R. (63-65) = 18/100 =

97 DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS F.A. (60-62) 0.05 F.A. (63-65) =0.23 F.A. (66-68) =0.65 F.A. (69-71) =0.92 F.A. (72-74) =

98 MEDIDAS DE TENDENCIA CENTRAL Estas medidas se emplean para indicar un valor que tiende a ser el más representativo de un conjunto de números. Las tres medidas de mayor importancia son:Estas medidas se emplean para indicar un valor que tiende a ser el más representativo de un conjunto de números. Las tres medidas de mayor importancia son: MediaMedia MedianaMediana ModaModa 98

99 X = x 1 + x 2 +…+x n = n j=1 x j = x j N N N N N N MEDIA De las 3 medidas está es la más importante. La media se determina al sumar los valores de un conjunto y dividir el resultado de esta suma entre el número de valores del mismo.De las 3 medidas está es la más importante. La media se determina al sumar los valores de un conjunto y dividir el resultado de esta suma entre el número de valores del mismo. 99

100 MEDIA Esta medida de tendencia central posee varias propiedades: Esta medida de tendencia central posee varias propiedades: Se puede calcular para un conjunto de númerosSe puede calcular para un conjunto de números La media es única, es decir, existe una y solo una para un conjunto de datos.La media es única, es decir, existe una y solo una para un conjunto de datos. Si cambia algún valor del conjunto de números, entonces también cambia la media.Si cambia algún valor del conjunto de números, entonces también cambia la media. La suma de desviaciones de los números a partir de la media es 0.La suma de desviaciones de los números a partir de la media es 0. (x j -X) = 0 (x j -X) = 0 100

101 MEDIA Cuando se tiene una tabla de una distribución de frecuencias en donde hemos clasificado nuestros datos y deseamos calcular la media tenemos que considerar únicamente las marcas de clase de cada intervalo. Estas marcas de clase multiplicadas por las frecuencias y divididas entre la frecuencia total, nos da como resultado la media.Cuando se tiene una tabla de una distribución de frecuencias en donde hemos clasificado nuestros datos y deseamos calcular la media tenemos que considerar únicamente las marcas de clase de cada intervalo. Estas marcas de clase multiplicadas por las frecuencias y divididas entre la frecuencia total, nos da como resultado la media. X = f 1 x 1 + f 2 x 2 +…+f k x k = k j=1 f j x j = fx j N N N N N N 101

102 EJEMPLO 3 En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un cuadro mágico. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos. Los resultados fueron los siguientes:En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un cuadro mágico. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos. Los resultados fueron los siguientes: Minutos x Alumnos f

103 HALLANDO LA MEDIA X = f 1 x 1 + f 2 x 2 +…+f k x k = k j=1 f j x j = fx j N N N N N N X = 1(1)+2(2)+3(3)+0(4)+4(5)+6(6)+9(7)= 133= X = 1(1)+2(2)+3(3)+0(4)+4(5)+6(6)+9(7)= 133= X= 5.32 min. 103

104 MEDIANA La característica de mayor importancia es que divide un conjunto ordenado en dos grupos iguales, es decir, la mediana de un conjunto de datos ordenados en orden de magnitud, es el valor medio o la media de los valores medios.La característica de mayor importancia es que divide un conjunto ordenado en dos grupos iguales, es decir, la mediana de un conjunto de datos ordenados en orden de magnitud, es el valor medio o la media de los valores medios. Una regla para obtener la mediana es:Una regla para obtener la mediana es: Clasificación u ordenamiento de los datos.Clasificación u ordenamiento de los datos. 104

105 MEDIANA Contar para conocer si existen un numero par o impar de datos.Contar para conocer si existen un numero par o impar de datos. Si se tiene un numero impar de valores, la mediana es el valor intermedio. Para un numero par de valores, la mediana es la media de los valores intermedios.Si se tiene un numero impar de valores, la mediana es el valor intermedio. Para un numero par de valores, la mediana es la media de los valores intermedios. 105

106 MEDIANA Considerando una distribución de frecuencias para datos agrupados, la mediana se obtiene mediante:Considerando una distribución de frecuencias para datos agrupados, la mediana se obtiene mediante: Donde:Donde: L 1 = Limite real inferior de la clase mediana (esto es, la clase que contiene la mediana).L 1 = Limite real inferior de la clase mediana (esto es, la clase que contiene la mediana). N = Frecuencia Total (Numero total de Datos)N = Frecuencia Total (Numero total de Datos) (f) 1 =Suma dde las frecuencias de todas las clases que se encuentran debajo de la clase mediana.(f) 1 =Suma dde las frecuencias de todas las clases que se encuentran debajo de la clase mediana. F mediana = Frecuencia de la clase medianaF mediana = Frecuencia de la clase mediana C= Tamaño del intervalo de la clase mediana.C= Tamaño del intervalo de la clase mediana. MedianaMediana = L 1 + N/2 – (F ) 1 F mediana C 106

107 EJEMPLO 4 En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un cuadro mágico. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos. Los resultados fueron los siguientes:En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un cuadro mágico. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos. Los resultados fueron los siguientes: Minutos x Alumnos f

108 HALLANDO LA MEDIANA MedianaMediana = L 1 + N/2 – (F ) 1 c F mediana Recuerde que gráficamente la mediana es el valor que corresponde a la mitad de la frecuencia total. 25/2= 12.5 = N/2 La de la f hasta la quinta clase es 10 : (F ) 1 La de la f hasta la sexta clase es 16 En esta clase se localiza la mediana. Clase mediana : sexta clase 108

109 HALLANDO LA MEDIANA Limite real inferior de la sexta clase: L 1 = (5+6)/2= 5.5 (F ) 1 = 10 F mediana = 6 C= 1 N/2= 12.5 Mediana: (1) 6 Mediana= = min. 109

110 MODA La moda es el valor que mayor número de veces se presenta en un conjunto de números. Existen algunos casos en los cuales no existe la moda y otros en los cuales existen mas de una moda. Una distribución que cuenta con una moda se le conoce como unímodal.La moda es el valor que mayor número de veces se presenta en un conjunto de números. Existen algunos casos en los cuales no existe la moda y otros en los cuales existen mas de una moda. Una distribución que cuenta con una moda se le conoce como unímodal. 110

111 MODA Para una distribución de frecuencias, la moda es el valor o los valores máximos de la curva y se puede calcular por medio dePara una distribución de frecuencias, la moda es el valor o los valores máximos de la curva y se puede calcular por medio de Donde:Donde: L 1 = Limite real inferior de clase de la clase modal. La clase modal es aquella donde se localiza la moda.L 1 = Limite real inferior de clase de la clase modal. La clase modal es aquella donde se localiza la moda. Δ 1 = Es la diferencia entre la frecuencia de la clase modal y la frecuencia anterior o premodalΔ 1 = Es la diferencia entre la frecuencia de la clase modal y la frecuencia anterior o premodal Δ 2 = Es la diferencia entre la frecuencia de la clase modal y la frecuencia siguiente o posmodalΔ 2 = Es la diferencia entre la frecuencia de la clase modal y la frecuencia siguiente o posmodal C = Tamaño del intervalo de clase modalC = Tamaño del intervalo de clase modal Moda = L1 + Δ 1 Δ 1 + Δ 2 C 111

112 EJEMPLO 5 En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un cuadro mágico. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos. Los resultados fueron los siguientes:En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un cuadro mágico. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos. Los resultados fueron los siguientes: Minutos x Alumnos f Moda: 7 min. 112

113 EJEMPLO MEDIDAS DE TENDENCIA CENTRAL En una compañía automotriz hay 100 trabajadores los cuales producen refacciones. Algunos por sus capacidades y experiencias construyen mas que otros al termino de cada mes. La distribución de frecuencias es la siguiente:En una compañía automotriz hay 100 trabajadores los cuales producen refacciones. Algunos por sus capacidades y experiencias construyen mas que otros al termino de cada mes. La distribución de frecuencias es la siguiente: 113

114 Intervalo de ClaseFrecuencia(f) x

115 MEDIA, MEDIANA Y MODA MEDIA X =56.86 refacciones producidas MEDIANA =57.11 refacciones producidas MODA= refacciones producidas 115

116 MEDIA Promedio aritmético del conjunto de datos. Promedio aritmético del conjunto de datos. Un dato extremo disperso afecta al resultado de la media. Un dato extremo disperso afecta al resultado de la media. 116

117 MEDIANA Es el número del medio del conjunto de datos, establece un punto que divide al conjunto de datos en dos grupos de la misma cantidad. Es el número del medio del conjunto de datos, establece un punto que divide al conjunto de datos en dos grupos de la misma cantidad. 117

118 MODA Es el número más popular en el conjunto de datos. Es el número más popular en el conjunto de datos. Es importante saber la marca de cereales que se vende más de manera que se pueda estar seguro de tener suficiente en el almacén. 118

119 MEDIA Y MEDIANA Para un conjunto de datos con dos o más modas, será mejor usar la media o la mediana como característica del grupo, recordando que al haber un extremo disperso, es mejor el uso de la mediana. Para un conjunto de datos con dos o más modas, será mejor usar la media o la mediana como característica del grupo, recordando que al haber un extremo disperso, es mejor el uso de la mediana. 119

120 EJEMPLO 6 Una persona que sirve mesas en el restaurante del hotel PLAZA VERACRUZ de Veracruz, Veracruz, registra las propinas que percibió durante 7 días. Una persona que sirve mesas en el restaurante del hotel PLAZA VERACRUZ de Veracruz, Veracruz, registra las propinas que percibió durante 7 días. Día $

121 ANALISIS ¿Cuánto te haces de propina en un día? X = $ Moda : no hay Mediana: 15,16,19,21,22,24,80 = $ 21 ¿Cuál seria el valor más característico o representativo de este conjunto de datos? ¿Cuál seria el valor más característico o representativo de este conjunto de datos? 121

122 EJEMPLO 7 Datos de producción de tres operarios. Número de artículos producidos por día Día de trabajo Operario día 1 día 2 día 3 día 4 día 5 día 6 día 7 día 8 día 9 día 10 A A B B C C

123 MODAMEDIAMEDIANA OPERARIO A OPERARIO B OPERARIO C ¿Qué operario elegirías para que continuara en el puesto? ¿Te ayudaría el rango a reafirmar tu decisión? ¿Qué mas observas? 123

124 MEDIDAS DE DISPERSION Este tipo de medidas también reciben el nombre de Medidas De Variación.Este tipo de medidas también reciben el nombre de Medidas De Variación. Las Medidas de Dispersión o Variación se emplean para saber si los valores están relativamente cercanos uno al otro o si se encuentran dispersos. Todas las medidas de dispersión exceptuando la de Amplitud o Rango toman a la media como punto de referencia.Las Medidas de Dispersión o Variación se emplean para saber si los valores están relativamente cercanos uno al otro o si se encuentran dispersos. Todas las medidas de dispersión exceptuando la de Amplitud o Rango toman a la media como punto de referencia. 124

125 MEDIDAS DE DISPERSION Las medidas de dispersión son: Rango o Amplitud de VariaciónRango o Amplitud de Variación Desviación Media o Promedio de DesviaciónDesviación Media o Promedio de Desviación VarianzaVarianza Desviación EstándarDesviación Estándar 125

126 RANGO O AMPLITUD DE VARIACION Es la diferencia entre el mayor valor y el menor de todos ellos.Es la diferencia entre el mayor valor y el menor de todos ellos. El rango es una medida limitada puesto que considera a los valores extremos de un conjunto y no proporciona mayor información respecto a los demás valores del mismo.El rango es una medida limitada puesto que considera a los valores extremos de un conjunto y no proporciona mayor información respecto a los demás valores del mismo. 126

127 DESVIACION MEDIA O PROMEDIO DE DESVIACION Se emplea para medir el promedio de los alejamientos de los datos observados en la muestra respecto a la media de estos datos.Se emplea para medir el promedio de los alejamientos de los datos observados en la muestra respecto a la media de estos datos. Para un conjunto de valores se obtiene al restar la media de cada valor del grupo, eliminando el signo negativo (esto se logra por medio del valor absoluto) dividida entre el número total de observaciones.Para un conjunto de valores se obtiene al restar la media de cada valor del grupo, eliminando el signo negativo (esto se logra por medio del valor absoluto) dividida entre el número total de observaciones. 127

128 DESVIACION MEDIA O PROMEDIO DE DESVIACION Sus formulas son:Para una distribuciónSus formulas son:Para una distribución de frecuencias: N = numero total de datos.N = numero total de datos. x = Marcas de clasex = Marcas de clase X = MediaX = Media f = frecuencias de clasef = frecuencias de clase DM = x-X N DM = f x-X N 128

129 VARIANZA La varianza de una muestra se determina en forma similar que la desviación media pero con las siguiente diferencia:La varianza de una muestra se determina en forma similar que la desviación media pero con las siguiente diferencia: Las desviaciones se elevan al cuadrado antes de ser sumadas. Las desviaciones se elevan al cuadrado antes de ser sumadas. 129

130 VARIANZA Sus formulas son:Para una distribución de frecuenciasSus formulas son:Para una distribución de frecuencias Donde:Donde: N = numero total de datos.N = numero total de datos. x = Marcas de clase o datosx = Marcas de clase o datos X = MediaX = Media f = frecuencias de clasef = frecuencias de clase S 2 = (x-X) 2 N S 2 = f (x-X) 2 N 130

131 DESVIACION ESTANDAR La desviación estándar es la raíz cuadrada positiva de la varianza. Para obtener la desviación estándar se debe calcular la varianza y hallar su raíz cuadrada positiva.La desviación estándar es la raíz cuadrada positiva de la varianza. Para obtener la desviación estándar se debe calcular la varianza y hallar su raíz cuadrada positiva. La desviación estándar queda representada por la letra mayúscula S.La desviación estándar queda representada por la letra mayúscula S. La desviación estándar es una de las medidas mas importantes dentro de la Estadística.La desviación estándar es una de las medidas mas importantes dentro de la Estadística. 131

132 DESVIACION ESTANDAR Sus formulas son: Para una distribución de frecuenciasSus formulas son: Para una distribución de frecuenciasDonde: N = numero total de datos.N = numero total de datos. x = Marcas de clase o datosx = Marcas de clase o datos X = MediaX = Media f = frecuencias de clasef = frecuencias de clase S = (x-X) 2 N S = f (x-X) 2 N 132

133 DESVIACION ESTANDAR El 68% de los valores cae dentro del rango de una vez la desviación estándar con respecto de la media.El 68% de los valores cae dentro del rango de una vez la desviación estándar con respecto de la media. En cualquier conjunto de valores graficados que se ajusten a una curva normal, el 95% de los valores quedan dentro de dos desviaciones típicas respecto del valor de la media del conjunto.En cualquier conjunto de valores graficados que se ajusten a una curva normal, el 95% de los valores quedan dentro de dos desviaciones típicas respecto del valor de la media del conjunto. Generalmente en un rango de 3 desviaciones típicas con respecto a la media queda contenido el 100% de los valores del conjunto. Esta información tiene uso inmediato en la aplicación de tolerancia o medidas de control de calidad de artículos manufacturados.Generalmente en un rango de 3 desviaciones típicas con respecto a la media queda contenido el 100% de los valores del conjunto. Esta información tiene uso inmediato en la aplicación de tolerancia o medidas de control de calidad de artículos manufacturados. 133

134 68 % LA MEDIA, LA MODA Y LA MEDIANA SON IGUALES PUNTOS DE INFLEXION UNA DESVIACION TÍPICA O ESTANDAR REPRESENTACION DE LA DESVIACION ESTANDAR DOS DESVIACIONES TÍPICAS O ESTANDAR 134

135 EJEMPLO DE MEDIDAS DE DISPERSION En un experimento aleatorio se obtuvo la muestra de elementos:En un experimento aleatorio se obtuvo la muestra de elementos: 17, 15, 25, 23, 18, 18, 20, 19, 20, 20, 20, 21, 20, 20 17, 15, 25, 23, 18, 18, 20, 19, 20, 20, 20, 21, 20, 20Determinar Desviación MediaDesviación Media VarianzaVarianza Desviación estándar.Desviación estándar. 135

136 OBTENIENDO LA DISTRIBUCION DE FRECUENCIAS xff.x N = 14fx=

137 MEDIA Media = fx / N = 276/14 =

138 xmediaDesvx-XFF.x-X N = 14 F.x-X =

139 DESVIACION MEDIA DESV. MEDIA

140 CALCULO DE LA DESV. ESTANDAR Y LA VARIANZA Desviación x-X(x-X) 2 ff(x-X) N = 14 f(x-X) 2 =

141 DESVIACION ESTANDAR Y VARIANZA varianza Desv. Estandar

142 CUARTILES, DECILES Y PERCENTILES. Los cuartiles, deciles y percentiles se asemejen mucho a la mediana porque también subdividen una distribución de mediciones de acuerdo con la proporción de frecuencias observadas y ordenadas.Los cuartiles, deciles y percentiles se asemejen mucho a la mediana porque también subdividen una distribución de mediciones de acuerdo con la proporción de frecuencias observadas y ordenadas. Mientras la mediana divide una distribución en dos mitades, los cuartiles la dividen en cuatro cuartos, los deciles la dividen en 10 décimos y los puntos percentiles la dividen en 100 partes.Mientras la mediana divide una distribución en dos mitades, los cuartiles la dividen en cuatro cuartos, los deciles la dividen en 10 décimos y los puntos percentiles la dividen en 100 partes. 142

143 Considerando que el lugar de la mediana se puede encontrar por:Considerando que el lugar de la mediana se puede encontrar por: Lugar de la mediana: n/2 + ½ Para el primer cuartil será:Para el primer cuartil será: n/4 + ½ Para el tercer decil será:Para el tercer decil será: 3n/10 + ½ Para el septuagésimo percentil será:Para el septuagésimo percentil será: 70n/100 + ½ 143

144 EJEMPLO Si ocho empresas vendieron las siguientes cantidades de unidades de aire acondicionado, 5, 8, 8, 11, 11, 11, 14, 16.Si ocho empresas vendieron las siguientes cantidades de unidades de aire acondicionado, 5, 8, 8, 11, 11, 11, 14, 16. Busque la posición del tercer cuartel para esta distribución; C3 = 3n/4 + ½ C3 = 3(8)/4 + ½= 6.5 Lo cual nos indica que el tercer cuartel se encuentra ubicado entre el sexto y séptimo valor del grupo ordenado. O sea:Lo cual nos indica que el tercer cuartel se encuentra ubicado entre el sexto y séptimo valor del grupo ordenado. O sea: ( )/ 2 =

145 DESVIACION CUARTIL Es la medida de dispersión más usada en relación con la mediana; también es llamada rango semiintercuartil. Se simboliza por Q y se le define por la fórmula:Es la medida de dispersión más usada en relación con la mediana; también es llamada rango semiintercuartil. Se simboliza por Q y se le define por la fórmula: en la cual Q1 y Q3 son los puntos bajo los cuales se halla el 25% y el 75% de los datos, respectivamente, como ya se había visto anteriormente.en la cual Q1 y Q3 son los puntos bajo los cuales se halla el 25% y el 75% de los datos, respectivamente, como ya se había visto anteriormente. 145

146 146


Descargar ppt "ESTADÍSTICA I Prof. MSc. Edwin Gerardo Acuña Acuña San José. Costa Rica. 2013 1."

Presentaciones similares


Anuncios Google