Elementos de Estadística descriptiva

Slides:



Advertisements
Presentaciones similares
Unidad I. Conceptos Básicos y Estadística Descriptiva
Advertisements

Tema. 2. Conceptos básicos. Medida en Psicología
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA.
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
Administración de la seguridad I
UNIVERSIDAD TECNICA DE AMBATO
CLASE 1: Recordando algunos conceptos previos de Estadística
CARACTERÍSTICAS BÁSICAS DE LOS DATOS ESTADÍSTICOS
ESCUELA PROFERSIONAL DE INGENIERÍA EMPRESARIAL.
Conceptos Introductorios de Estadística
PRESENTACIÓN DE LA INFORMACIÓN
Estadística Descriptiva Tema I. Conceptos Básicos
RECOLECCIÓN DE LA INFORMACIÓN Información primaria y secundaria.
Unidad III. Conceptos Básicos de Estadística
Tema 1: Introducción a la Estadística.
ESTADISTICA 3 ro. SECUNDARIA.
Tabla de Frecuencia según tipo de tipo de variables
Estadística Descriptiva
Mt. Martín Moreyra Navarrete.
ESTADÍSTICA DESCRIPTIVA
DISTRIBUCION DE FRECUENCIAS DESPUES DE LA RECOPILACION DE LOS DATOS,
Introducción a la Estadística Informática
TABLAS DE FRECUENCIAS Primero Medio
2.- Organización de los Datos
ESTADÍSTICA 4° MEDIO
Unidad VII: Datos y Azar
Elaboración de gráficas
ESTADÍSTICAS DESCRIPTIVA
GRÁFICOS ESTADÍSTICOS
Obtención, Medición y Representación de Datos Estadística E.S.O.
ANÁLISIS DE LA INFORMACIÓN Descripción de los datos
ESTADÍSTICA DESCRIPTIVA
Estadísticas Datos y Azar
ANÁLISIS DE LA INFORMACIÓN Descripción de los datos
ESTADÍSTICA.
Profesora: Daniela Gaete Pino
Estadística Al hacer Un sondeo de opinión
INTRODUCCIÓN A LA ESTADÍSTICA
Introducción Estadística ¿Qué es la estadística?
ESTADÍSTICA Conceptos Básicos Pf. F.Abad.
1-1 Capítulo dos Descripción de los datos: distribuciones de frecuencias y representaciones gráficas OBJETIVOS Al terminar este capítulo podrá: UNO Organizar.
TEMA N°2 Nociones básicas de probabilidad y estadística
Estadística descriptiva y probabilidades LIC. SUJEY HERRERA RAMOS
Métodos Cuantitativos
LOS ALUMNOS REPROBADOS
ESTADÍSTICA TEMA: CUADROS Y GRÁFICOS ESTADÍSTICOS
Tablas de estadística.
Fundamentos Básicos de Estadística
ESTADÍSTICA UNIDIMENSIONAL
Por: sandra Milena Pachón Peralta Lic. UPN
JUAN LUIS CHAMIZO BLÁZQUEZ
Distribución de frecuencias y gráficos
MEDIDAS DE TENDENCIA CENTRAL
Diagrama de Tallos Y Hojas
Conceptos Básicos y Estadística Descriptiva
Diseño: Mtro Domingo Villavicencio Aguilar
ESTADÍSTICA DESCRIPTIVA
Por: Agustín Audor Julian Tole
ESTADÍSTICA Conceptos Básicos Carmen Liliana Cadenillas Montenegro
REPUBLICA DE VENEZUELA UNIVERSIDAD ALONSO DE OJEDA VICERRECTORADO ACÁDEMICO FACULTAD DE INGENIERIA ESTADISTICA I DISTRIBUCIÓN DE FRECUENCIAS Y GRÁFICOS.
Análisis de tablas y gráficos IV medio
Facultad de Turismo y Gastronomía Material audiovisual Licenciatura en Gastronomía Unidad de aprendizaje : Estadística Descriptiva Sexto periodo El siguiente.
Estadística descriptiva
Representaciones Gráficas.
CONCEPTOS BÁSICOS, TABULACIÓN, GRÁFICOS
ESTADÍSTICA DOCENTE :JUDITH PATRICIA MARTÍN HERMOSILLO MULTIVERSIDAD LATINOAMERICANA CAMPUS TONALÁ BLOQUE IX. APLICA LA ESTADÍSTICA ELEMENTAL.
ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO.
Estadística Profesora: Mariela Palma Hernández. Objetivo: Calcular e interpretar las medidas de tendencia central.
Estadística y probabilidad
Transcripción de la presentación:

Elementos de Estadística descriptiva Ing. Gonzalo Flores C

Esto nos da la posibilidad de tomar decisiones acertadas y a tiempo, así como realizar proyecciones del comportamiento del suceso. Sólo se realizan los cálculos y el análisis con los datos obtenidos de una muestra de la población y no con toda la población.

Actualmente el INEC es el encargado de concentrar y publicar la información estadística del estado y del país.

Conceptos básicos Estadística: Es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos para después obtener conclusiones. Se divide en Estadística Descriptiva y Estadística Inferencial. Estadística descriptiva: Se encarga de la recolección, organización, presentación y análisis de los datos de una población.

Estadística inferencial: Se encarga de analizar la información presentada por la estadística descriptiva mediante técnicas que nos ayuden a conocer, con determinado grado de confianza, a la población. Lo que nos permite tomar decisiones.

Población: Conjunto definido de TODOS los INDIVIDUOS, de donde se observa cierta característica. Al número de integrantes de la población se llama tamaño de la población y se representa con la letra N. Las poblaciones pueden ser finitas o infinitas.

Población Estadística: Conjunto de TODOS los DATOS que se obtienen al realizar la medición de una variable en los elementos de una población. Muestra: Subconjunto de una población, que intenta reflejar las características de la población lo mejor posible. El número de individuos que integran la muestra, llamado tamaño de la muestra se representa con la letra n.

Individuo: Es el elemento de la población o de la muestra que aporta información sobre lo que se estudia. Variable: Característica o propiedad de los individuos que se desea estudiar y se puede medir o calificar; cambia o varía con el tiempo en un individuo dado, o cambia o varía de elemento a elemento. Ej. Edad, peso, sexo, estado civil, número de hijos, etc.

Dato: Valor que se obtiene al realizar la medición de la característica de la variable en estudio. Pueden ser univariados, bivariados o multivariados. La naturaleza de los datos pueden ser datos cuantitativos o datos cualitativos.

Datos Cuantitativos (números): Valores obtenidos al medir peso, estatura, temperatura, número de hijos. Datos Cualitativos (categorías): Se obtienen al calificar la característica en cuestión como el sexo, estado civil, grado máximo de estudios.

Variable Dicotómica: Sólo puede tomar dos valores (sí – no, 0 – 1, hombre – mujer, bueno – malo, encendido – apagado). En la variable CUANTITATIVA se pueden distinguir dos tipos: continua y discreta.

Variable Continua: Si la variable puede tomar cualquier número real entre dos valores dados (decimal o entero). Ej. El peso de un individuo. Variable Discreta: Si la variable sólo puede tomar números enteros. Ej. El número de hijos de un individuo.

Escalas de Medición Escala Nominal Escala Ordinal Escala de Intervalo Escala de Razón

Escala Nominal: Está asociada a variables cualitativitas y es denominada de este modo si no se pueden hacer operaciones aritméticas entre sus valores, pues éstos son únicamente ETIQUETAS. Ejemplo: sexo, código postal, estado civil, número telefónico, número al correr en un maratón, deporte favorito, carrera a estudiar, etc.

Escala Ordinal: Los valores de la variable que tienen un ORDEN con un nivel específico, pero no se pueden hacer operaciones aritméticas entre ellas. Ejemplo: Pésimo – Malo – Regular – Bueno – Excelente Primaria – Secundaria – Preparatoria - Licenciatura

Escala de Intervalo: En ella existe un orden entre los valores de la variable y además una NOCIÓN DE DISTANCIA aunque no se puedan realizar operaciones. El cero o punto de inicio no es único, es más bien un punto de referencia. Ejemplo: Escalas de temperatura, la edad de la Tierra, la línea del tiempo de la humanidad.

Escala de Razón: La magnitud tiene SENTIDO FÍSICO, existe el cero absoluto, existe orden, se puede determinar cuántas veces es mayor uno que otro. Ejemplo: peso, estatura, edad, distancia, dinero, etc.

Fuentes de información Encuesta: Recopilar los datos mediante el uso de cuestionarios o entrevistas. Experimento: Procedimiento utilizado en la investigación científica para obtener información que permita conocer el comportamiento de algún proceso.

Fuentes de Información Investigación Documental: Procedimiento para obtener datos mediante la consulta de información ya escrita y concentrada en documentos que se localicen en libros o revistas en bibliotecas, hemerotecas, o en centros virtuales.

Orden de datos La ordenación es el proceso mediante el cual los datos están acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos. Hay dos métodos comunes: Listado en orden ascendente Método de tallo y hojas

Peso de 25 estudiantes (en kg) Ejemplo Considera que la variable de estudio es el peso de 25 estudiantes. Los pesos se encuentran en la siguiente tabla: Peso de 25 estudiantes (en kg) 40 43 48 51 49 56 44 42 55 52 62 50 59 63 45 57 66 58

Listado en orden ascendente El proceso consiste en ordenarlos de menor a mayor Peso de 25 estudiantes (en kg) 42 40 48 51 49 56 44 43 55 52 62 50 59 63 45 57 66 58 Peso de 25 estudiantes (en kg) 40 42 43 44 44 45 48 49 50 50 51 51 52 52 55 55 56 56 57 58 59 62 63 63 66

Método de tallo y hojas Si los números de los datos están formados por dos dígitos, se hace una columna con el primer dígito (decenas) y a la derecha de cada uno de ellos se escribe, en fila, sólo el segundo dígito (unidades) de cada uno de los datos que tengan el mismo primer dígito.

Peso de 25 estudiantes (en kg) Datos sin ordenar: Datos ordenados: Peso de 25 estudiantes (en kg) 42 40 48 51 49 56 44 43 55 52 62 50 59 63 45 57 66 58 4 5 6 2,0,8,9,4,3,4,5 1,6,5,2,2,0,9,0,6,5,7,1,8 2,3,6,3 4 5 6 0,2,3,4,4,5,8,9 0,0,1,1,2,2,5,5,6,6,7,8,9 2,3,3,6

Doble tallo Una variante de este método es en lugar de dividir en un grupo las decenas, se divide en dos grupos. El primero abarcando los dígitos del 0 al 4 y el segundo del 5 al 9. El ejemplo anterior queda: 4 0,2,3,4,4 5,8,9 5 0,0,1,1,2,2, 5,5,6,6,7,8,9 6 2,3,3

Caso de variables cualitatitivas El procedimiento es: Se identifican todos los valores diferentes y se acomodan en columna. Se agrega una segunda columna en donde se van registrando, mediante una línea vertical, la veces que aparece el valor dado.

Ejemplo Considera que la variable de estudio es el color de playera de 25 estudiantes. Los colores se encuentran en la siguiente tabla: rosa azul blanco gris café negro verde

Azul Blanco Café Gris Negro Rosa Verde rosa azul blanco gris café Color Frecuencia Azul Blanco Café Gris Negro Rosa Verde rosa azul blanco gris café negro verde I I I I I I I I I I I I I I I I I I I I I I I I

Tabla de Frecuencia de Datos Una vez que se tenga ordenados los datos, se acomodan en la “Tabla de distribución de frecuencias o tabla de frecuencias”. La tabla es básicamente una tabla de valores x-y, dónde “x” representa el dato y “y” representa la frecuencia.

La frecuencia es el número de veces que aparece cada dato. Hay dos clases de tablas de frecuencias: Para datos NO agrupados. Para datos agrupados.

Tabla de frecuencias para datos NO agrupados Está formada por dos columnas: una para la variable “xi” y la otra para su frecuencia “f”, a esta frecuencia se le llama frecuencia absoluta o frecuencia observada.

Peso de 25 estudiantes (en kg) Ejemplo Tabla de frecuencias de los pesos en kg de 25 alumnos. xi f 40 42 43 44 45 48 49 50 51 xi f 52 55 56 57 58 59 62 63 66 Total Peso de 25 estudiantes (en kg) 1 2 1 2 40 42 43 44 44 1 2 45 48 49 50 50 2 1 51 51 52 52 55 1 1 55 56 56 57 58 1 1 59 62 63 63 66 1 1 2 2 1 2 25

Frecuencia relativa y acumulada Por lo regular, se agregan dos columnas: la de la frecuencia relativa “fr” y la de la frecuencia acumulada “fa”. La frecuencia relativa se obtiene mediante el cociente de la frecuencia y el número total de datos, esto es fr = f/n. La frecuencia acumulada se obtiene sumando las frecuencias anteriores a las frecuencias de un dato dado.

Siempre es el número total Ejemplo 1/25 xi f fr fa 40 1 42 43 44 2 45 48 49 50 51 xi f fr fa 52 2 55 56 57 1 58 59 62 63 66 Total 25 1 0.04 0.08 14 2 0.04 0.08 16 2/25 3 0.08 18 0.04 0.08 5 0.04 19 0.04 6 0.04 20 0.04 7 0.04 21 Siempre es el número total 8 0.04 0.04 22 10 0.08 0.08 24 0.08 12 0.04 25 1 Siempre es 1

Intervalo de clase En ocasiones es conveniente acomodar los datos en pequeños grupos de igual tamaño, llamados intervalos de clase. El punto medio o marca de clase “xi”, se obtiene con: El tamaño del intervalo se obtiene mediante la diferencia de los límites superior e inferior. Límite inferior + límite superior Marca de clase = 2

+5 +5 +5 Ejemplo Intervalo de clase Punto medio “xi” 38 – 42 40 Lím inf + Lim sup Límite inferior Límite superior 2 Intervalo de clase Punto medio “xi” 38 – 42 40 43 – 47 45 48 – 52 50 53 – 57 55 58 – 62 60 63 – 67 65 +5 +5 +5

Límite verdadero del intervalo Frontera de clase o límite verdadero del intervalo: Intervalo de clase Punto medio “xi” 37.5 – 42.5 40 42.5 – 47.5 45 47.5 – 52.5 50 52.5 – 57.5 55 57.5 – 62.5 60 62.5 – 67.5 65 5/2 = 2.5 40 – 2.5 40 + 2.5 +5 +5

Tabla de intervalos con límites verdaderos Usando símbolos de desigualdad Usando paréntesis y corchetes Está incluido No está incluido Está incluido No está incluido Intervalo de clase Punto medio “xi” 37.5 ≤ x < 42.5 40 42.5 ≤ x < 47.5 45 47.5 ≤ x < 52.5 50 52.5 ≤ x < 57.5 55 57.5 ≤ x < 62.5 60 62.5 ≤ x < 67.5 65 Intervalo de clase Punto medio “xi” [37.5 , 42.5) 40 [42.5 , 47.5) 45 [47.5 , 52.5) 50 [52.5 , 57.5) 55 [57.5 , 62.5) 60 [62.5 , 67.5) 65 El tamaño del intervalo es de 5

Si por alguna razón no es fácil decidir el ancho del intervalo y el número de ellos, se pueden utilizar las siguientes fórmulas: K = 1 + 3.3 log (n) Donde K = número aproximado de clases n = número de datos. Amplitud de los intervalos = Rango / K Donde Rango = diferencia entre el dato mayor y el dato menor.

Ejemplo Para el ejemplo de los datos de los pesos de 25 alumnos, el valor de K: Y la amplitud de los intervalos sería: K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6. Por lo tanto se requieren aproximadamente 6 intervalos. Amplitud = Rango / K = (66 – 40) / 5.6 = 4.64. Aproximadamente 5 unidades es la amplitud de los intervalos.

Tabla de distribución de frecuencias para datos agrupados Se elabora con los intervalos de clase, sus puntos medios y las frecuencias correspondientes para cada uno de los intervalos. Datos agrupados xi f 40 1 42 43 44 2 45 48 49 50 51 52 2 55 56 57 1 58 59 62 63 66 Total 25 Intervalo de clase Punto medio “xi” f 38 – 42 40 43 – 47 45 48 – 52 50 53 – 57 55 58 – 62 60 - 67 65 Total 2 Datos sin agrupar 4 8 5 3 3 25

Se agregan las columnas de frecuencia relativa “fr” y frecuencia acumulada “fa”: Intervalo de clase Punto medio “xi” f fr Fa 38 – 42 40 2 43 – 47 45 4 48 – 52 50 8 53 – 57 55 5 58 – 62 60 3 - 68 65 Total 25 2/25 4/25 0.08 2 8/25 0.16 6 0.32 14 0.20 19 0.12 22 0.12 25 1

Por último se agregan las columnas: Frecuencia porcentual, “f%” ó “%f”, se obtiene multiplicando la frecuencia relativa “fr” x 100. Frecuencia relativa acumulada “fra”, se obtiene sumando las frecuencias relativas anteriores a un dato dado. Frecuencia porcentual acumulada, “f%a”, se obtiene sumando las frecuencias porcentuales acumuladas a un dato dado.

Tablas de frecuencias absoluta, relativa y acumulada 0.08 x 100 0.08 x 100 2/25 Intervalo de clase Punto medio “xi” f fr f% fa fra f%a 38 – 42 40 2 0.08 43 – 47 45 4 0.16 6 48 – 52 50 8 0.32 14 53 – 57 55 5 0.20 19 58 – 62 60 3 0.12 22 - 68 65 25 Total 1 8 0.08 8 16 0.24 24 32 0.56 56 20 0.76 76 12 0.88 88 1 100 12 100

Gráfica de Datos Existen dos tipos de gráficas mas usuales: Polígono de Frecuencias Histograma Otros gráficos: Gráfica de barras Pictograma Gráfico Circular o de pastel.

Polígono de Frecuencias Es la representación mediante un gráfico de línea. En él se muestra la distribución de frecuencias y está formado por segmentos de línea que unen los puntos correspondientes a la frecuencia de cada una de las clases. El eje “x” representa el dato “xi” y el eje “y” las frecuencias.

Ejemplo Intervalo de clase Punto medio “xi” f 38 – 42 40 2 43 – 47 45 48 – 52 50 8 53 – 57 55 5 58 – 62 60 3 - 68 65 Total 25

El eje “y” puede ser sustituido por las frecuencias relativas o porcentuales. Polígono de Frecuencia Relativa fr xi

Polígono de Frecuencia Porcentual xi

Histograma Es la representación gráfica de los datos mediante una sucesión de rectángulos. Está formado por rectángulos cuya anchura representa a cada uno de los intervalos y la altura corresponde a la frecuencia. En el eje “x” estarán los límites verdaderos, los puntos medios y en el eje “y” las frecuencias.

Ejemplo Intervalo de clase Punto medio “xi” f 38 – 42 40 2 43 – 47 45 48 – 52 50 8 53 – 57 55 5 58 – 62 60 3 - 68 65 Total 25

También podemos usar la frecuencia relativa y la frecuencia porcentual. xi

% f xi

Pirámide Poblacional Una variante en el histograma es colocar en el eje “x” de tal manera que las columnas quedarán en forma horizontal, es muy común en datos poblacionales.

Ojiva Es la representación gráfica de las frecuencias acumuladas mediante un gráfico de línea. Se muestra la distribución de frecuencias acumuladas de los datos. En el eje “x” estarán los puntos medios y en el eje “y” las frecuencias acumuladas.

Ejemplo Intervalo de clase Punto medio “xi” f fr fa 38 – 42 40 2 0.08 43 – 47 45 4 0.16 6 48 – 52 50 8 0.32 14 53 – 57 55 5 0.20 19 58 – 62 60 3 0.12 22 - 68 65 25 Total 1

Usando la frecuencia acumulada y la frecuencia porcentual. Intervalo de clase Punto medio “xi” f fr f% fa fra f%a 38 – 42 40 2 0.08 8 43 – 47 45 4 0.16 16 6 0.24 24 48 – 52 50 0.32 32 14 0.56 56 53 – 57 55 5 0.20 20 19 0.76 76 58 – 62 60 3 0.12 12 22 0.88 88 - 68 65 25 1 100 Total

Gráfico Circular También es llamado gráfico de pastel. Sólo se representan datos de frecuencias relativas o frecuencias porcentuales. Se debe dividir el área del círculo de manera proporcional a las frecuencias.

Agregaremos una columna a nuestra tabla de frecuencias “Frecuencia relativa al círculo”, multiplicando (fr)(360°), para mostrar la parte proporcional de círculo medida en grados que corresponde a cada intervalo.

Ejemplo 1 Intervalo de clase Punto medio “xi” f fr (fr ) (360°) 38 – 42 40 2 0.08 43 – 47 45 4 0.16 48 – 52 50 8 0.32 53 – 57 55 5 0.20 58 – 62 60 3 0.12 - 68 65 Total 25 1 0.16 x 360° 28.8° 57.6° 115.2° 72° 43.2° 43.2° 360°

Ejemplo 2 Azul 4 Blanco 7 Café 3 Gris Negro 2 Rosa Verde 1 I I I I Color Frecuencia Conteo Azul 4 Blanco 7 Café 3 Gris Negro 2 Rosa Verde 1 I I I I I I I I I I I I I I I I I I I I I I I I

Otros Gráficos La gráfica de barras se traza similar al Histograma, sólo que las barras se dibujan separadas unas de otras. La escala en el eje “x” es para mostrar categorías o intervalos de números NO consecutivos.

Carrera Alumnos Medicina 8 Mecánica 11 Civil Agronomía 3 Físico - Matemáticas Leyes 6 Contaduría

Pictograma Similar al de barras, sólo que se sustituyen por figuras, generalmente relacionadas con la variable estudiada.