Prof. MSc. Edwin Gerardo Acuña Acuña

Slides:



Advertisements
Presentaciones similares
Juan F. Velazquez Mayra E. Beltran Jaime Lopez
Advertisements

VALORES AGRUPADOS EN INTERVALOS.
PRIMERA SECCION TEMA: BALANCE DE LA POLITICA PUBLICA PARA LA ATENCION INTEGRAL AL DESPLAZAMIENTO FORZADO EN COLOMBIA ENERO 2004 – ABRIL 2007 PARTE I ANALI8SIS.
Conocimiento, Uso y Evaluación de Medicamentos Genéricos
Los números del 0 al cero uno dos tres cuatro cinco 6 7 8
Noviembre 2007Estudio Rostros de Noticias 2007Collect-GfKWikén Estudio Rostros de Noticias de la TV Chilena Desarrollados para Revista Wikén El Mercurio.
Curso de Bioestadística Parte 14 Análisis de datos binarios pareados
RELACIÓN POSTULADOS POR SEXO
Comisión Mixta Octubre Ejercicio crediticio Al 22 de Octubre de 2006 Crédito 99%
Comisión Mixta Agosto Ejercicio crediticio Al 27 de Agosto de 2006 Crédito 99.5% POA incluyendo la parte proporcional para Crédito Económico, Cofinavit.
Comisión Mixta Junio Ejercicio crediticio Al 25 de Junio de 2006 Crédito 103% POA incluyendo la parte proporcional de la bolsa reservada para crédito.
1 LA UTILIZACION DE LAS TIC EN LAS MICROEMPRESAS GALLEGAS. AÑO mayo 2005.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO de Junio de 2005.
TEMA 2 MÚLTIPLOS Y DIVISORES
02- Plan Organización Docente v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
01- OFERTA FORMATIVA v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
Aladdín-respuestas 1.Vivía 2.Era 3.Amaba 4.Quería 5.Gustaban 6.Se sentía 7.Salía 8.Tenía 9.Decidió 10.escapó 11. Se vistió 12. Conoció 13. Vio 14. Pensó
Modas Página Internet: Correo Electrónico:
Unidad de competencia II Estadística descriptiva:
Estructura Económica de México (parte 2)
Estructura Económica de México Prof. Abelardo Mariña Flores trimestre 2010-P.
William Shakespeare ( greg.), fue un dramaturgo, poeta y actor inglés. Conocido en ocasiones como el Bardo de Avon (o.
DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADISTICA5 Libertad y Orden DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADISTICA CENSO GENERAL 2005 REPÚBLICA.
Imagen N° 54: Vista panorámica y de ubicación de la Calicata CB-27
Estadísticas e Indicadores de Deserción Estudiantil Diana Marcela Durán Coordinadora Grupo de Fomento a la Permanencia Bucaramanga Abril 13 de
Grupo de Sequía del Servicio Meteorológico Nacional
SATISFACCIÓN DE CLIENTES Comparativa Convocatorias Finalizadas en 2009.
Ensayo de Rendimiento DISTRIBUCIÓN DE ESTADÍSTICOS MUESTRALES.
PRINCIPALES RESULTADOS INFANCIA Y ADOLESCENCIA. Población de Niños, Niñas y Adolescentes, año 2003 (Población menor de 18 años sobre la población total)
Grupos de Edad Ocupación Nivel Socioeconómico.
Impacto en la regulación de asientos para niños Rosa Gallego Coordinador Proyectos, Fundación Gonzalo Rodriguez Uruguay
Visual basic Curso de Habilitación Laboral IV. ¿Qué es Visual Basic Visual Basic es uno de los tantos lenguajes de programación que podemos encontrar.
Análisis de la Dinámica no Lineal y Cambios de Complejidad en
PROYECTO FIN DE CARRERA
CONSTRUCCIÓN Y ARQUITECTURA DEL SOFTWARE
Superintendencia de Electricidad y Combustibles Ranking 2007 de Calidad de Servicio de las Empresas de Distribución de Electricidad. Octubre 2007.
Medición de la Satisfacción del Cliente 2010 Marzo de 2011.
Sistema de Información INDICES 2011
Análisis transversal. Tablas de mortalidad
CONCEPTOS DE PROBABILIDAD
Evolución Tasas de Interés Promedio del Sistema Financiero *
Vocabulario querer comerlo -paja por supuesto - madera
FUNCIONES DE UNA VARIABLE REAL
Química U.2 Unión entre átomos y propiedades de las sustancias
MUESTRARIO 2 Del Diseño 62- al diseño 97. Muestrario 2 Diseño 62Diseño 63.
Indicadores CNEP Escuela
Profr. Ricardo A. Castro Rico
ARANCEL DE ADUANAS luism ortegon.
Stand con aire comprimido
¡Primero mira fijo a la bruja!
Química U.2 Unión entre átomos y propiedades de las sustancias
MINIMO COMÚN MÚLTIPLO DE DOS NÚMEROS a y b
1. Datos prensa. Fuente: ACEM
Química U.2 Unión entre átomos y propiedades de las sustancias
By: Nicholas, Rayna, Nathaniel, Calvin
Los números. Del 0 al 100.
Por fin veo cumplido un deseo, desde hace tiempo soñado: elaborar 150 presentaciones (PPS) con los salmos de la Biblia, utilizando la traducción oficial.
1. 3 ATENCIÓN ELOGIO EXTINCIÓN ¿POR QUÉ SE MANTIENE LA CONDUCTA? Análisis de: 9.
Vocabulario: (Los números)
Vocabulario: Para Empezar (Numbers & Colors)
uno cero dos seis siete nueve Los Números DIEZ cinco ocho tres
Los Numeros.
OFERTAS ESPECIALES LATÓN.
Facultad de Ingeniería Carrera de Ingeniería Industrial
TEMA Nº 1 CAPÍTULO V ¿Cómo se define la Contabilidad Nacional?
Vocabulario lonchera perseguir valiente simpático/a menear miedo
Diagrama CAUSA_EFECTO ó ISHIKAWA ó ESPINA DE PESCADO
1 8 de febrero del Chapter 5 Encoding 3 Figure 5-1 Different Conversion Schemes.

Herramienta FRAX Expositor: Boris Inturias.
Transcripción de la presentación:

Prof. MSc. Edwin Gerardo Acuña Acuña ESTADÍSTICA I Prof. MSc. Edwin Gerardo Acuña Acuña San José. Costa Rica. 2013

¿Qué es estadística?

La estadística es una rama de las matemáticas, que a través de un conjunto de técnicas, métodos, normas, reglas y procedimientos que se ocupan en observar, reunir, agrupar, cuantificar y organizar los datos de una muestra, permita no solo describir un hecho o comportamiento de un fenómeno, también analizar y evaluar conclusiones acerca de una población.

Cualquier persona recibe información en forma de datos a través de los periódicos, la televisión u otros medios; y a menudo es necesario obtener alguna conclusión a partir de la información contenida en los datos.

Ejemplos de aplicación de la Estadística.

Ejercicio 1 Se desea investigar durante el mes de enero de este año, la opinión de los costarricenses mayores de 18 años sobre los distintos casos de corrupción que involucra a expresidentes.

Ejercicio 2 Se desea conocer el porcentaje de personas que observó el último encuentro de fútbol de la selección nacional, para ello se realizará un estudio telefónico en el Gran Área Metropolitana, entre personas mayores de 12 años.

Ejercicio 3 Ingreso salarial neto de los empleados del ICE. El número de citas que atiende una clínica. El grado académico de un profesor universitario. El distrito de residencia de los costarricenses. El número de personas que mueren a causa del SIDA cada año. Si una persona ha visitado el parque Simón Bolívar. Nivel de rating de una emisora radial Número de placa de un vehículo

OBJETIVOS DE LA ESTADÍSTICA Proporcionar las técnicas, métodos y procedimientos requeridos para describir y analizar un conjuntos de datos y así simplificar sus resultados. Permite describir sus características y analizar el estudio de los fenómenos, de los datos destacados (HOLGUIN, 1993, Pág. 14) Obtener conclusiones de una población, a partir de la descripción y análisis realizados a una muestra. (SANDOVAL, 2001, P. 15)

SE CLASIFICA EN DOS RAMAS CLASIFICACIÓN DE LA ESTADÍSTICA Las técnicas estadísticas utilizadas para interpretar los datos de una investigación pueden ser clasificadas en dos grandes grupos en función de que su objetivo sea describir las características observadas de una muestra o inferir conclusiones sobre la población de la que dicha muestra ha sido extraída. SE CLASIFICA EN DOS RAMAS DESCRIPTIVA INFERENCIAL

ESTADÍSTICA DESCRIPTIVA La estadística descriptiva es una rama de la estadística, que se encarga en representar a un fenómeno refiriendo variables que caracterizan los datos de la muestra de una población. El proceso que sigue la estadística descriptiva para el estudio de una cierta población consta de los siguientes pasos: PROCESO

ESTADÍSTICA DESCRIPTIVA PROCESO DE LA ESTADÍSTICA DESCRIPTIVA Selección de variables e indicadores (es una manifestación, observable y medible de los componentes de una variable) (Quivy, 2000) Mediante la recolección de datos se obtiene el valor de cada individuo en los caracteres seleccionados de la muestra. Elaboración de tablas de frecuencias, mediante la adecuada ordenación, clasificación y distribución de los datos del fenómeno estudiado. Representación gráfica de los resultados.

ESTADÍSTICA INFERENCIAL La estadística inferencial, extrae y analiza las características de los datos obtenidos de una muestras formados por individuos de una población. A partir del estudio de la muestra se pretende conducir a un resultado de los aspectos relevantes de toda la población. Para cuyo estudio se requiere de conocimientos de estadística, probabilidad y matemáticas. (Esta rama de la estadística se estudia en la asignatura Estadística Aplicada a la Investigación Social II)

Concepto de estadística descriptiva e Inferencial.

POBLACION Es un conjunto de valores posibles o el recuento de todos los elementos que presentan una característica común que toma de un colectivo o universo de objetos, ideas, acontecimientos o individuos, al cual se refiere el estudio que se pretende realizar. El termino población, se usa para denotar el conjunto de elementos del cual extrae una muestra.

MUESTRA Muestra aleatoria: Es un subconjunto de una población la cual nos puede servir para generalizar acerca de la población de estudio. Muestra aleatoria: Esta se obtiene cuando seleccionamos una muestra de una población en la que todos los elementos son INDEPENDIENTES Y tienen IGUAL oportunidad de ser seleccionados

MUESTRA La muestra nos sirve para poder representar el comportamiento de la población con alto grado de confianza. El éxito del proyecto depende de la forma en que se seleccione al elemento que participará en el estudio.

Por qué emplear muestras? La población es infinita Población finita pero muy grande, sería imposible o muy costoso estudiarla. La unidad estadística se transforma o destruye al ser analizada Los resultados que se obtendrían al realizar una encuesta por muestreo serían suficientes y precisos.

MUESTREO Es un proceso que determina cómo serán seleccionados los elementos de una parte de la población, para que se puedan obtener conclusiones fiables a partir de la muestra, es importante tanto su tamaño como el modo en que han sido extraídos los objetos, ideas, acontecimientos o individuos que componen el estudio. Existen diferentes tipos de diseño de muestreo, cada uno de ellos tienen características que se pueden ocupar según el tipo de población y el objetivo la investigación.

Tipos de muestras Aleatorias: Muestreo simple al azar Muestreo sistemático Muestreo estratificado Muestreo por conglomerados No aleatorias: Muestreo por cuotas Muestreo por criterio Muestreo por conveniencia

Error de muestreo Se presenta sólo en muestras aleatorias. Es la diferencia entre el resultado dado por la muestra y el resultado que se hubiera obtenido si se hubiera hecho un censo. Ventaja: se puede medir haciendo uso de la teoría de la probabilidad.

Sesgo Error sistemático (se da en todas las observaciones) en un sólo sentido. No es medible. Tipos Sesgo de selección. Sesgo de medición.

DATO Se le conoce como dato u observación, a cada resultado que se obtiene al realizar un experimento.

INFORMACION A menudo se tiene que organizar los hechos para que te digan algo. Es en ese momento en que habrás convertido los datos en información.

I N S T R U M E N T O Un instrumento es un mecanismo por el cual se recopilan datos con las variables que pretende medir a través de: la observación encuesta entrevista o cuestionario basados en los objetivos de la investigación. EL INSTRUMENTO TIENE QUE TENER LAS PROPIEDADES DE: VALIDEZ CONFIABILIDAD

VALIDEZ Validez de contenido Validez de criterio El termino “validez” denota la utilidad científica de un instrumento de medida en el que puede establecer ampliamente qué tan bien mide lo que pretende medir. A la validez se le ha dado tres significados principales: Validez de contenido Validez de criterio Validez de constructo

Se basa en algún juicio externo (expertos) VALIDEZ DE CONTENIDO Se refiere al grado en que la medición abarca la gama de significados que comprende el concepto (marco teórico) VALIDEZ DE CRÍTERIO Se basa en algún juicio externo (expertos) VALIDEZ DE CONSTRUCTO Se refiere al grado en que una medición se relaciona consistentemente con otras mediciones. En la medida en que la variable es abstracta y observable se le denomina de constructo.

C O N F I A B I L I D A D Medidas de estabilidad (Test-retest) El termino “confiabilidad” es una medida práctica de que tan consistente y estable podría ser un instrumento de medición o prueba. Existen diversos procedimientos para calcular la confiabilidad de un instrumento de medición entre los más utilizados son: Medidas de estabilidad (Test-retest) Método de formas alternativas o paralelas Método de mitades partidas (Split-Halves) Coeficiente alfa de Cronbach Coeficiente KR-20 Kuder y Richardson

Fuentes de información Fuentes primarias: Publican o suministran datos recogidos por ellas mismas. Fuentes secundarias: Toman datos recogidos o publicados anteriormente por otras.

Técnicas de Recolección de la información Requieren Cuestionario estructurado ENTREVISTA Personal Telefónica CUESTIONARIO AUTOADMINISTRADO OBSERVACION Y MEDICION REGISTRO

ENTREVISTA PERSONAL Alto costo Motiva al entrevistado Desconfianza del entrevistado Longitud limitada (en ocasiones) Influencia del entrevistador puede ser un elemento distorsionador Motiva al entrevistado Permite aclarar preguntas y/o verificar respuestas. Alto porcentaje de respuesta Permite accesar a todos los elementos de la población

ENTREVISTA TELEFONICA Bajo costo Alto porcentaje de respuesta Permite verificar las respuestas Más flexible con respecto a la hora de la entrevista Longitud limitada No permite accesar a todos los elementos de la población (no todos tienen teléfono)

CUESTIONARIO AUTOADMINSTRADO Porcentaje de respuesta bajo Dificulta la aclaración de dudas Requiere informantes con nivel educativo alto Requiere un sistema de correo eficiente Bajo costo Longitud ilimitada Libertad de respuesta Mayor tiempo para responder Permite tratar temas delicados o embarazosos

OBSERVACION Y MEDICION Neutralidad u objetividad Errores en la observación Instrumento mal calibrado Instrumento mal utilizado Alto costo en algunos casos No se pueden verificar los datos

REGISTRO Bajo costo Información real y objetiva Puede tener información desactualizada o incompleta La información disponible no siempre coincide con los fines estadísticos.

El Cuestionario Identificación Párrafo introductorio Tamaño Numeración Caracteres tipográficos (Tipo de letra, Negrita) Símbolos de ayuda (-->, * ) 4

El Cuestionario Clasificación de las preguntas Cerradas Abiertas De escogencia única De escogencia múltiple De rangos De notas Abiertas Abiertas con alguna clasificación 1

El Cuestionario Precodificación Prueba del cuestionario Revisión y Crítica Codificación Tabulación 5

El Cuestionario Longitud del cuestionario Orden o secuencia de las preguntas Iniciales Flujo de los temas Delicadas Estilo de redacción de las preguntas Clara, comprensible, precisa y lo más específica posible. No debe incomodar al entrevistado Debe referirse a un solo aspecto No debe inducir las respuestas 4

Fases de una investigación estadística Planteamiento del problema. Diseño del instrumento de recolección Obtención de la información. Preparación de la información Análisis e Interpretación. Presentación de resultados. 6

Presentación de la Información Presentación Textual “En comparación con 1998, la economía experimentó en 1999 una reducción en la tasa de crecimiento, pues alcanzó apenas el 2.5%, mientras que el promedio anual entre 1985 y 1998 había sido de 4.9%” 2

Presentación de la Información Presentación semitabular “En el último mes, la mayoría de los bancos ha disminuido los intereses para vivienda, como se puede apreciar a continuación: Se espera que esta reducción de intereses incentive el sector de la producción.” 3

Presentación tabular: Cuadros Muestran la información de forma ordenada por filas y por columnas, de manera visualmente agradable. Permiten presentar y divulgar la información de una manera fácil de interpretar y útil para el usuario. 7

Componentes de un cuadro Número de cuadro Título Columna matriz Encabezados Cuerpo o contenido Nota introductoria o preliminar Nota al pie Fuente 9

CUERPO Cuadro # TITULO (nota introductoria) Columna Matriz Encabezados Nota al pie FUENTE 8

SEGÚN CANTÓN DE RESIDENCIA POR TIPO DE DROGA, COSTA RICA, 2,000 CUADRO 2 CONSUMO DE DROGAS SEGÚN CANTÓN DE RESIDENCIA POR TIPO DE DROGA, COSTA RICA, 2,000 (Valores Porcentuales) * * Datos preliminares FUENTE: Consumo de alcohol, tabaco y otras drogas. Distribución geográfica 2001. I.A.F.A.

EXPERIMENTO Actividad planeada cuyos resultados producen un conjunto de datos.

PARÁMETRO Valor numérico que resume toda la información de una población completa. Promedio, moda, mediana, desviación estándar, rango, etc.

Existen diferentes tipos de variables, entre las más utilizadas son: Una variable es susceptible de medir cualquier característica de un objeto que pueda tomar diferentes valores de un conjunto de datos (Un dato es una medida que se realiza sobre los sujetos de un experimento). Existen diferentes tipos de variables, entre las más utilizadas son: VARIABLES CUALITATIVAS CUANTITATIVAS

EJEMPLO: Sexo, estado civil, o la profesión de una persona. VARIABLE CUALITATIVA Una variable cualitativa, también llamada no numérica, se denomina por sus atributos porque expresa distintas cualidades, características o modalidades, que son susceptibles de describirse mediante palabras, cuya medición solo puede ser por una escala nominal u ordinal. EJEMPLO: Sexo, estado civil, o la profesión de una persona.

Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre TIPOS DE VARIABLES CUALITATIVAS Dicotómicas: Sólo hay dos categoría, que son excluyentes una de la otra Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre Nominal: tiene mas de dos categorías y no hay orden entre ellas. Ejemplo: color de los ojos, grupo sanguíneo Ordinal: tiene varias categorías y hay orden entre ellas. Ejemplo: grado tumoral, calificación del riesgo en anestesia.

VARIABLE CUANTITATIVA Una variable cuantitativa, también llamada numérica, es aquella susceptible de ser expresada numéricamente, cuya medición puede ser utilizada con una escala de intervalo o de razón según el objetivo de la investigación. EJEMPLO: A los pacientes atendidos en la Institución Musas de Metal se les pregunta el ingreso mensual de sus familias. $0 a $5,999 b) $6,000 a $11,999 c)$12,000 a $17,999 d)$18,000 a $23,999

TIPOS DE VARIABLES CUANTITATIVAS Continuas: números infinito no numerables de elementos. Tiene asociado el concepto de medida Ejemplo: Presión arterial, Edad, peso. Discretas: números finitos o infinitos numerables de elementos. Se asocia con el concepto de conteo. Ejemplo: N° de hijos, N° de casos de tuberculosis por estado.

Hay ocasiones en las que las medidas cuantitativas continuas son transformadas en ordinales mediante la utilización de uno o varios puntos de corte. Ejemplo: La variable peso es codificada en varias categorías y se utiliza en términos como: Bajo-peso, peso-normal, Sobrepeso, Obesidad

Las descripciones numéricas de datos suelen ser importantes Las descripciones numéricas de datos suelen ser importantes. Dado un conjunto de n observaciones La estadística descriptiva nos puede ayudar mediante resúmenes numéricos, que son medidas de tendencia central, o también llamadas de posición y medidas de dispersión

RECOPILACION DE DATOS Es el proceso mediante el cual obtenemos los datos u observaciones de una muestra. Posteriormente los datos se organizarán de acuerdo al uso que se les de. Experimento, encuesta, censo.

ORGANIZAR Si se tiene una serie de datos, primero hay que organizarlos en forma ordenada y en subconjuntos que presenten características similares. Los datos agrupados se pueden resumir gráficamente o en tablas y mediante medidas numéricas (parámetros) que obtendremos posteriormente como la media, la mediana, la desviación estándar, etc.

Los datos ordenados en grupos o categorías reciben el nombre de: distribución de frecuencias. Para obtener el rango de una distribución de frecuencias, se realiza la diferencia entre el mayor y el menor valor de los datos. Cuando se tiene un gran número de datos, habrá que distribuirlos en : clases, categorías.

CUADROS O TABLAS DE FRECUENCIA La distribución de datos ó de frecuencias la cual es la presentación de cuadros o tablas estadísticas. El objetivo principal de una distribución de frecuencias consiste en presentar los datos de un modo que facilite su comprensión e interpretación. Frecuencia Absoluta. Frecuencia Relativa. Frecuencia Porcentual. Frecuencia Acumulada. Algunos tipos de distribución EJEMPLO Marca de Clase

FRECUENICA ABSOLUTA VARIABLE FRECUENCIA ABSOLUTA AHORRO F 09-12 18 13-15 26 16-18 7 19-21 4 22-24 1 25-27 Total 60 La frecuencia absoluta, es el número de veces que se repite un determinado valor o una determinado atributo de la variable. Está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta y la suma de las frecuencias absolutas debe ser igual al número total de los datos en estudio. . Tabla No 1.3 Datos de la encuesta del ahorro mensual de acuerdo al salario que perciben los trabajadores. (pesos mexicanos)

FRECUENCIA RELATIVA F Frecuencia del intervalo N Suma de frecuencias La frecuencia relativa consiste en la proporción del número total de datos que aparece en cada intervalo, la suma de la frecuencia es siempre la unidad (1). Se obtiene al dividir la frecuencia absoluta de cada intervalo entre el número total de datos o elementos del conjunto. La frecuencia relativa también se expresa, en ocasiones, en tanto por ciento FR = F Frecuencia del intervalo N Suma de frecuencias SE OBTIENE

FRECUENCIA PORCENTUAL La frecuencia porcentual, consiste en calcular el porcentaje de la relación que se establece entre una de las partes con respecto al todo multiplicándolas por 100, que pertenece a cada intervalo o categoría. La frecuencia porcentual también se expresa, en ocasiones en frecuencia relativa. La palabra porcentaje significa por cien. PORCENTAJE = ( F / N ) X 100 Ó PORCENTAJE = FR X 100

FRECUENCIA ACUMULADA VARIABLE FRECUENCIA ABSOLUTA ACUMULADA AHORRO F FA 09-10 18 13-15 26 44 16-18 7 51 19-21 4 55 22-24 1 56 25-27 60 Total La frecuencia acumulada, indica cómo se van concentrando los datos de un valor de cada intervalo o una determinada modalidad del atributo. Puede incluir a cualquiera de las frecuencias: absoluta, relativa o porcentual; sugiriendo se calcule sólo la que sea necesaria para los fines de la investigación. Tabla No. 1.6 Datos de la encuesta del ahorro mensual de acuerdo al salario que perciben los trabajadores. (pesos mexicanos)

MARCA DE CLASE La marca de clase, solo es aplicable a datos agrupados y es: Es el punto medio de cada intervalo de clase. Es el valor que representa a todos los datos que puedan estar integrados en éste. Marca de clase = ( Límite inferior + Límite superior ) / 2 9 - 12 10.5 Intervalos de clase Con clasificación continua Marca de Clase X

ORGANIZACIÓN DE DATOS 9-12 18 0,3 30 10,5 13-15 26 0,43 42 44 14 16-18 VARIABLE FRECUENCIA MARCA DE CLASE ABSOLUTA RELATIVA PORCENTUAL ACUMULADA AHORRO F FR % FA MC 9-12 18 0,3 30 10,5 13-15 26 0,43 42 44 14 16-18 7 0,12 12 51 17 19-21 4 0,07 55 20 22-24 1 0,02 2 56 23 25-27 60 Total 100 Tabla No. 1.7 Se ha realizado una encuesta a 60 personas a las que se les ha preguntado cuanto dinero ahorran mensualmente de acuerdo al salario que perciben, obteniéndose los siguientes resultados (pesos mexicanos)

GRÁFICAS Las gráficas se basa por completo en una tabla de datos y sirve para visualizar la forma de distribución de los datos, porque permite mostrar, explicar, interpretar y describir de manera sencilla, clara y efectiva, los datos estadísticos mediante formas geométricas tales como líneas, áreas, volúmenes. Para la descripción gráfica, podrá disponer de una amplia galería de gráficas entre las más utilizadas son: POLIGONOS DE FRECUENCIA HISTOGRAMA OJIVA DIAGRAMA DE BARRAS SECTORIAL

Fig. No. 1 Histograma Ahorro (colones) Se considera uno de las más sencillas y útiles de representar los datos cuantitativos (numéricas) Representa a los niveles de medición ordinal, de intervalo o de razón Se puede graficar con la frecuencia: absoluta, porcentual ó relativa, según los objetivos de la investigación Frecuenc ia Fig. No. 1 Histograma Ahorro (colones) Cuantitativa I n t e r v a l o

HISTOGRAMA

Fig. No. 2 Diagrama de Barras Percepción del ahorro (colones) Es una gráfica más utilizada por su sencillez, para representar las características cuantitativas (numérica) y cualitativas (no numérica) Representa a los niveles de medición nominal u ordinal Se puede graficar con la frecuencia: absoluta, porcentual o relativa Fig. No. 2 Diagrama de Barras Percepción del ahorro (colones) Cualitativa C a t e g o r i a

Fig. No. 3 Gráfica sectorial Ahorro (dólares) Se utilizada para representar principalmente variables cualitativas (no numéricas) Representa al nivel de medición nominal Se puede graficar con la frecuencia: porcentual o relativa Resultan adecuado cuando hay pocos valores Para ello se utiliza la siguiente expresión aritmética: Total de grados = ( porcentaje ) ( 360 ) Fig. No. 3 Gráfica sectorial Ahorro (dólares) Cualitativas Porcentajes

POLIGONOS DE FRECUENCIA Se utiliza para representar principalmente variables cuantitativas (numéricas) Representa al nivel de medición de intervalo o de razón Se puede graficar con la frecuencia: marca de clase Frecuenc ia Fig. No. 4 Polígono de Frecuencia Ahorro (euros)

POLIGONO DE FRECUENCUA

Fig. No. 5 Ojiva Ahorro (colones) Los polígonos de frecuencia pueden emplearse asimismo para representar frecuencia acumulada que en tal caso resulta designar como ojiva. Es aplicable a variables ordinales. Representa a la distribución de frecuencias acumuladas, sean absolutas, porcentuales o relativas. Es una gráfica ascendente. OJIVA Fig. No. 5 Ojiva Ahorro (colones)

CLASE Ó CATEGORIA La utilidad de lo anterior, es que se puede analizar con mayor facilidad un conjunto de números sin que se tenga que considerar cada número. Una categoría o clase recibe el nombre de : intervalo de clase.

INTERVALO DE CLASE Los valores extremos de un intervalo de clase reciben el nombre de: limites de clase. (inferior y superior) Existen otros limites de gran importancia llamados limites reales de clase. Para hallar el limite real inferior se suma el limite inferior mas el número anterior y esto se divide entre dos.

Para hallar el limite real superior se suma el limite superior mas el número que le sigue y esto se divide entre dos. Tamaño o anchura de clase: basta con realizar la diferencia entre los limites reales considerando primero el superior. Marca de clase: se obtiene sumando los limites superior e inferior y dividiendo entre dos.

Con la información anterior podemos formar las distribuciones de frecuencia con mayor facilidad si consideramos primero el rango. Después de calcularlo, lo dividimos en un número conveniente de intervalos de clase del mismo tamaño y considerando al mismo tiempo que las marcas de clase coincidan en lo posible con los datos que fueron observados. Por último indicamos la frecuencia de clase.

Al construir una distribución de frecuencias podemos representarla gráficamente, ya sea por medio de un histograma (rectángulo sobre el eje X) o por un polígono de frecuencias (gráfico de línea trazado sobre las marcas de clase)

II semana

EJEMPLO 1 DIA 24 Se tiene el número de accidentes que ocurren día a día durante un periodo de 50 días en la autopista Veracruz-Xalapa. 2 9 6 7 0 8 2 5 4 2 4 4 5 4 4 2 5 6 7 3 8 3 8 4 4 7 4 7 5 6 4 7 3 5 1 7 3 8 0 6 1 5 2 3 0 6 5 6 3 6

Considerando 5 intervalos de clase: (Rango + 1)/5 = (9+1)/5=10/5=2 Observar que los datos constan de enteros. Puesto que el mayor número de accidentes es 9 y el menor es 0, por lo tanto el : rango: 9 – 0 = 9 Considerando 5 intervalos de clase: (Rango + 1)/5 = (9+1)/5=10/5=2 Podemos considerar que cada intervalo de clase constará de : 2 elementos.

1ºDIA 15 2ºDIA 22 Formando los intervalos de clase y contabilizando la cantidad de elementos en cada intervalo de clase obtenemos la siguiente distribución de frecuencia: INTERVALOS DE CLASE FRECUENCIA 0-1 5 2-3 11 4-5 16 6-7 13 8-9 Total ( N) = 50

Primer intervalo de clase: 0-1 Frecuencia de la tercera de clase: 16 Identificando las partes de la distribución de frecuencia: Primer intervalo de clase: 0-1 Frecuencia de la tercera de clase: 16 Limite inferior del primer intervalo de clase: 0 Limite superior del tercer intervalo de clase: 5 Tamaño de tercera la clase: 5.5-3.5= 2 Marca de la primer clase : (0+1)/2=.5 Marca de la quinta clase : (8+9)/2=8.5 …etc.

FRECUENCIA RELATIVA Es la frecuencia de clase dividida por el total de frecuencias de todas las clases. El resultado se expresa generalmente como porcentajes. F.R.= f/ N o bien: F.R.%=(f/N) * 100 Esto nos servirá para la representación gráfica circular o de pastel.

FRECUENCIA ACUMULADAS Este tipo de frecuencia está diseñada para mostrar el número o porcentajes de elementos que son menores que cierto valor específico o iguales a este.

DISTRIBUCION DE FRECUENCIA RELATIVA F.R. (0-1)= 5/50 = 0.10 o bien 10% F.R. (2-3)= 11/50= 0.22 o bien 22% F.R. (4-5)= 16/50= 0.32 o bien 32% F.R. (6-7)= 13/50= 0.26 o bien 26% F.R. (8-9)= 5/50 = 0.10 o bien 10% 1.00 100%

DISTRIBUCION DE FRECUENCIA ACUMULADA F.A. (0-1) 0.10 F.A. (2-3) 0.22+0.10=0.32 F.A. (4-5) 0.32+0.32=0.64 F.A. (6-7) 0.26+0.64=0.90 F.A. (8-9) 0.10+0.90=1.00 Se puede observar que el 64% de los días no excedió de 5 accidentes y que el 90% de los días no excedió de 7 accidentes.

HISTOGRAMA DE FRECUENCIAS RELATIVAS

POLIGONO DE FRECUENCIAS ACUMULADAS

CONSIDEREMOS LA EDAD DE CIEN EJEMPLO 2 CONSIDEREMOS LA EDAD DE CIEN ADULTOS MAYORES QUE VARIAN ENTRE 60 Y 74 AÑOS 62 72 72 69 69 69 61 68 71 71 64 67 64 67 60 64 67 62 64 67 65 64 74 64 73 65 63 74 64 63 73 64 67 73 71 71 67 65 67 67 67 63 63 63 64 71 64 74 71 71 70 67 70 66 70 67 70 66 70 66 66 68 66 66 69 67 67 68 68 68 68 66 68 70 70 66 67 66 66 70 68 68 68 70 67 67 68 68 67 69 67 67 67 70 70 70 70 61 70 70

RESOLUCION DE EJEMPLO 2 Rango 74-60= 14 años Dividiremos todo en cinco intervalos de clase. intervalos de clase (AÑOS) 60-62 63-65 66-68 69-71 72-74

RESOLUCION DE EJEMPLO 2 60 Limite inferior del primer intervalo de clase. 62 Limite superior de primer intervalo de clase. (59+60)/2 = 59.5 Limite real inferior. (62+63)/2 = 62.5 Limite real superior. Tamaño C = 62.5 - 59.5 = 3 C = 65.5 - 62.5 = 3, …….., etc.

DISTRIBUCION DE FRECUENCIAS (AÑOS) ( ADULTOS MAYORES) INTERVALOS DE CLASE FRECUENCIAS 60-62 5 63-65 18 66-68 42 69-71 27 72-74 8 100

RESOLUCION DE EJEMPLO 2 Marca de Clase (60+62)/2 = 61 (63+65)/2 = 64, ……., etc

DISTRIBUCION DE FRECUENCIAS AÑOS ADULTOS MAYORES MARCAS DE CLASE FRECUENCIA 61 5 64 18 67 42 70 27 73 8 N= 100

DISTRIBUCIÓN DE FRECUENCIA RELATIVA. “ “ 0.42 “ “ 0.27 “ “ 0.08 1.00

DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS F.A. (60-62) 0.05 F.A. (63-65) 0.18+0.05=0.23 F.A. (66-68) 0.42+0.23=0.65 F.A. (69-71) 0.27+0.65=0.92 F.A. (72-74) 0.08+0.92=1.00

MEDIDAS DE TENDENCIA CENTRAL Estas medidas se emplean para indicar un valor que tiende a ser el más representativo de un conjunto de números. Las tres medidas de mayor importancia son: Media Mediana Moda

X = x1+ x2+…+xn = ∑nj=1xj = ∑xj MEDIA De las 3 medidas está es la más importante. La media se determina al sumar los valores de un conjunto y dividir el resultado de esta suma entre el número de valores del mismo. X = x1+ x2+…+xn = ∑nj=1xj = ∑xj N N N

MEDIA Esta medida de tendencia central posee varias propiedades: Se puede calcular para un conjunto de números La media es única, es decir, existe una y solo una para un conjunto de datos. Si cambia algún valor del conjunto de números, entonces también cambia la media. La suma de desviaciones de los números a partir de la media es 0. ∑(xj-X) = 0

X = f1x1+ f2x2+…+fkxk = ∑kj=1fjxj = ∑fxj MEDIA Cuando se tiene una tabla de una distribución de frecuencias en donde hemos clasificado nuestros datos y deseamos calcular la media tenemos que considerar únicamente las marcas de clase de cada intervalo. Estas marcas de clase multiplicadas por las frecuencias y divididas entre la frecuencia total, nos da como resultado la media. X = f1x1+ f2x2+…+fkxk = ∑kj=1fjxj = ∑fxj N N N

EJEMPLO 3 En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un “cuadro mágico”. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos . Los resultados fueron los siguientes: Minutos x 1 2 3 4 5 6 7 Alumnos f 1 2 3 0 4 6 9

X = f1x1+ f2x2+…+fkxk = ∑kj=1fjxj = ∑fxj HALLANDO LA MEDIA X = f1x1+ f2x2+…+fkxk = ∑kj=1fjxj = ∑fxj N N N X = 1(1)+2(2)+3(3)+0(4)+4(5)+6(6)+9(7)= 133= 25 25 X= 5.32 min.

MEDIANA La característica de mayor importancia es que divide un conjunto ordenado en dos grupos iguales, es decir, la mediana de un conjunto de datos ordenados en orden de magnitud, es el valor medio o la media de los valores medios. Una regla para obtener la mediana es: Clasificación u ordenamiento de los datos.

MEDIANA Contar para conocer si existen un numero par o impar de datos. Si se tiene un numero impar de valores, la mediana es el valor intermedio. Para un numero par de valores, la mediana es la media de los valores intermedios.

MEDIANA Considerando una distribución de frecuencias para datos agrupados, la mediana se obtiene mediante: Donde: L1 = Limite real inferior de la clase mediana (esto es, la clase que contiene la mediana). N = Frecuencia Total (Numero total de Datos) (∑f)1=Suma dde las frecuencias de todas las clases que se encuentran debajo de la clase mediana. Fmediana = Frecuencia de la clase mediana C= Tamaño del intervalo de la clase mediana. Mediana = L1 + N/2 – (∑F )1 Fmediana C

EJEMPLO 4 En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un “cuadro mágico”. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos . Los resultados fueron los siguientes: Minutos x 1 2 3 4 5 6 7 Alumnos f 1 2 3 0 4 6 9

HALLANDO LA MEDIANA Mediana = L1 + N/2 – (∑F )1 c Fmediana Recuerde que gráficamente la mediana es el valor que corresponde a la mitad de la frecuencia total. 25/2= 12.5 = N/2 La ∑ de la “f” hasta la quinta clase es 10 : (∑F )1 La ∑ de la “f” hasta la sexta clase es 16 En esta clase se localiza la mediana. Clase mediana : sexta clase

HALLANDO LA MEDIANA Limite real inferior de la sexta clase: Fmediana = 6 C= 1 N/2= 12.5 Mediana: 5.5 + 12.5-10 (1) 6 Mediana=5.5 +0.416 = 5.916 min.

MODA La moda es el valor que mayor número de veces se presenta en un conjunto de números. Existen algunos casos en los cuales no existe la moda y otros en los cuales existen mas de una moda. Una distribución que cuenta con una moda se le conoce como unímodal.

MODA Para una distribución de frecuencias, la moda es el valor o los valores máximos de la curva y se puede calcular por medio de Donde: L1 = Limite real inferior de clase de la clase modal. La clase modal es aquella donde se localiza la moda. Δ1 = Es la diferencia entre la frecuencia de la clase modal y la frecuencia anterior o premodal Δ2 = Es la diferencia entre la frecuencia de la clase modal y la frecuencia siguiente o posmodal C = Tamaño del intervalo de clase modal Moda = L1 + Δ1 Δ1 + Δ2 C

EJEMPLO 5 En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un “cuadro mágico”. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos . Los resultados fueron los siguientes: Minutos x 1 2 3 4 5 6 7 Alumnos f 1 2 3 0 4 6 9 Moda: 7 min.

EJEMPLO MEDIDAS DE TENDENCIA CENTRAL En una compañía automotriz hay 100 trabajadores los cuales producen refacciones. Algunos por sus capacidades y experiencias construyen mas que otros al termino de cada mes. La distribución de frecuencias es la siguiente:

Intervalo de Clase Frecuencia(f) x 45-47 2 46 48-50 4 49 51-53 15 52 54-56 21 55 57-59 39 58 60-62 5 61 63-65 14 64

MEDIA, MEDIANA Y MODA MEDIA X =56.86 refacciones producidas MEDIANA =57.11 refacciones producidas MODA= 57.53 refacciones producidas

MEDIA Promedio aritmético del conjunto de datos. Un dato extremo disperso afecta al resultado de la media.

MEDIANA Es el número del medio del conjunto de datos, establece un punto que divide al conjunto de datos en dos grupos de la misma cantidad.

MODA Es el número más popular en el conjunto de datos. “Es importante saber la marca de cereales que se vende más de manera que se pueda estar seguro de tener suficiente en el almacén.

MEDIA Y MEDIANA Para un conjunto de datos con dos o más modas, será mejor usar la media o la mediana como característica del grupo, recordando que al haber un extremo disperso, es mejor el uso de la mediana.

EJEMPLO 6 Una persona que sirve mesas en el restaurante del hotel “PLAZA VERACRUZ” de Veracruz, Veracruz, registra las propinas que percibió durante 7 días. Día 1 2 3 4 5 6 7 $ 24 15 22 80 16 21 19

ANALISIS ¿Cuánto te haces de propina en un día? X = $ 28.14 Moda : no hay Mediana: 15,16,19,21,22,24,80 = $ 21 ¿Cuál seria el valor más característico o representativo de este conjunto de datos?

EJEMPLO 7 Datos de producción de tres operarios. Número de artículos producidos por día Día de trabajo Operario día 1 día 2 día 3 día 4 día 5 día 6 día 7 día 8 día 9 día 10 A 1 2 2 3 3 4 5 4 5 5 B 6 1 2 5 3 2 2 2 7 1 C 7 6 5 4 2 3 2 3 2 2

¿Qué operario elegirías para que continuara en el puesto? MODA MEDIA MEDIANA OPERARIO A 5 3.5 3.4 OPERARIO B 2 2.5 3.2 OPERARIO C 3 3.6 ¿Qué operario elegirías para que continuara en el puesto? ¿Te ayudaría el rango a reafirmar tu decisión? ¿Qué mas observas?

MEDIDAS DE DISPERSION Este tipo de medidas también reciben el nombre de Medidas De Variación. Las Medidas de Dispersión o Variación se emplean para saber si los valores están relativamente cercanos uno al otro o si se encuentran dispersos. Todas las medidas de dispersión exceptuando la de Amplitud o Rango toman a la media como punto de referencia.

MEDIDAS DE DISPERSION Las medidas de dispersión son: Rango o Amplitud de Variación Desviación Media o Promedio de Desviación Varianza Desviación Estándar

RANGO O AMPLITUD DE VARIACION Es la diferencia entre el mayor valor y el menor de todos ellos. El rango es una medida limitada puesto que considera a los valores extremos de un conjunto y no proporciona mayor información respecto a los demás valores del mismo.

DESVIACION MEDIA O PROMEDIO DE DESVIACION Se emplea para medir el promedio de los alejamientos de los datos observados en la muestra respecto a la media de estos datos. Para un conjunto de valores se obtiene al restar la media de cada valor del grupo, eliminando el signo negativo (esto se logra por medio del valor absoluto) dividida entre el número total de observaciones.

DESVIACION MEDIA O PROMEDIO DE DESVIACION Sus formulas son: Para una distribución de frecuencias: N = numero total de datos. x = Marcas de clase X = Media f = frecuencias de clase DM = ∑ x-X N DM = ∑f x-X N

VARIANZA La varianza de una muestra se determina en forma similar que la desviación media pero con las siguiente diferencia: Las desviaciones se elevan al cuadrado antes de ser sumadas.

VARIANZA Sus formulas son: Para una distribución de frecuencias Donde: N = numero total de datos. x = Marcas de clase o datos X = Media f = frecuencias de clase S2 = ∑(x-X)2 N S2 = ∑f (x-X)2 N

DESVIACION ESTANDAR La desviación estándar es la raíz cuadrada positiva de la varianza. Para obtener la desviación estándar se debe calcular la varianza y hallar su raíz cuadrada positiva. La desviación estándar queda representada por la letra mayúscula S. La desviación estándar es una de las medidas mas importantes dentro de la Estadística.

√ √ DESVIACION ESTANDAR Sus formulas son: Para una distribución de frecuencias Donde: N = numero total de datos. x = Marcas de clase o datos X = Media f = frecuencias de clase √ √ S = ∑(x-X)2 N S = ∑f (x-X)2 N

DESVIACION ESTANDAR El 68% de los valores cae dentro del rango de una vez la desviación estándar con respecto de la media. En cualquier conjunto de valores graficados que se ajusten a una curva normal, el 95% de los valores quedan dentro de dos desviaciones típicas respecto del valor de la media del conjunto. Generalmente en un rango de 3 desviaciones típicas con respecto a la media queda contenido el 100% de los valores del conjunto. Esta información tiene uso inmediato en la aplicación de tolerancia o medidas de control de calidad de artículos manufacturados.

REPRESENTACION DE LA DESVIACION ESTANDAR LA MEDIA, LA MODA Y LA MEDIANA SON IGUALES PUNTOS DE INFLEXION PUNTOS DE INFLEXION 68 % UNA DESVIACION TÍPICA O ESTANDAR DOS DESVIACIONES TÍPICAS O ESTANDAR

EJEMPLO DE MEDIDAS DE DISPERSION En un experimento aleatorio se obtuvo la muestra de elementos: 17, 15, 25, 23, 18, 18, 20, 19, 20, 20, 20, 21, 20, 20 Determinar Desviación Media Varianza Desviación estándar.

OBTENIENDO LA DISTRIBUCION DE FRECUENCIAS x f f.x 15 1 17 18 2 36 19 20 6 120 21 23 25 N = 14 ∑fx= 276

MEDIA Media = ∑fx / N = 276/14 = 19.714

x media Desv│x-X│ F F.│x-X│ 15 19.7142857 4.7142857 1 17 2.7142857 18 1.7142857 2 3.4285714 19 0.7142857 20 0.2857143 6 1.7142858 21 1.2857143 23 3.2857143 25 5.2857143 N = 14 ∑ F.│x-X │= 23.1428572

DESVIACION MEDIA DESV. MEDIA 1.65306123

CALCULO DE LA DESV. ESTANDAR Y LA VARIANZA Desviación │x-X│ (x-X)2 f f(x-X)2 4.7142857 22.2244897 1 2.7142857 7.36734686 1.7142857 2.93877546 2 5.87755092 0.7142857 0.51020406 0.2857143 0.08163266 6 0.48979597 1.2857143 1.65306126 3.2857143 10.7959185 5.2857143 27.9387757 N = 14 ∑ f(x-X)2 = 76.8571429

DESVIACION ESTANDAR Y VARIANZA 5.48979592 Desv. Estandar 2.340309

CUARTILES, DECILES Y PERCENTILES. Los cuartiles, deciles y percentiles se asemejen mucho a la mediana porque también subdividen una distribución de mediciones de acuerdo con la proporción de frecuencias observadas y ordenadas. Mientras la mediana divide una distribución en dos mitades, los cuartiles la dividen en cuatro cuartos, los deciles la dividen en 10 décimos y los puntos percentiles la dividen en 100 partes.

Considerando que el lugar de la mediana se puede encontrar por: Lugar de la mediana: n/2 + ½ Para el primer cuartil será: n/4 + ½ Para el tercer decil será: 3n/10 + ½ Para el septuagésimo percentil será: 70n/100 + ½

EJEMPLO Si ocho empresas vendieron las siguientes cantidades de unidades de aire acondicionado, 5, 8, 8, 11, 11, 11, 14, 16. Busque la posición del tercer cuartel para esta distribución; C3 = 3n/4 + ½ C3 = 3(8)/4 + ½= 6.5 Lo cual nos indica que el tercer cuartel se encuentra ubicado entre el sexto y séptimo valor del grupo ordenado. O sea: (11 + 14)/ 2 = 12.5

DESVIACION CUARTIL Es la medida de dispersión más usada en relación con la mediana; también es llamada rango semiintercuartil. Se simboliza por Q y se le define por la fórmula: en la cual Q1 y Q3 son los puntos bajo los cuales se halla el 25% y el 75% de los datos, respectivamente, como ya se había visto anteriormente.

¡Gracias por su participación!