ESTADISTICA DESCRIPTIVA

Slides:



Advertisements
Presentaciones similares
Estadística Descriptiva
Advertisements

AREA ESTADÍSTICA. ACTIVIDAD 1 En un ensayo de sanidad vegetal se estudia el efecto de una nueva formulación química para el control de una plaga en ajos.
Rodrigo Ferrer Urbina Universidad de Tarapacá.  Una distribución (empírica) son todos los valores que aparecen en la medición realizada (todas las observaciones).
ESTADÍSTICA ÍNDICE 1.Introducción.Introducción. 2.Población y muestra.Población y muestra. 3.Variables estadísticas:Variables estadísticas: Cualitativas.
Capítulo 1.4: Distribución de frecuencias unidimensionales Introducción Descripción numérica Representación gráfica.
REPASANDO…………… ESTADISTICA APLICADA. ¿Qué hemos visto? Tipos de variables Niveles de medición de las variables Tabulación y representación gráfica de.
Bioestadística Escala Cuantitativa.. Trabajadores en una fábrica. RegistroSexoEdad (años)Talla (m)Peso (kg) 1Fem Masc Masc
Medidas de tendencia central Profesor Alberto Alvaradejo IVº Medio 2016 Estadística y Probabilidad.
INACS / PG1 Curso Estadística y Diseño de Análisis de Experimentos Dr. Porfirio Gutiérrez González Correo:
TEMA 2: PARÁMETROS ESTADÍSTICOS. INDICE 1. Parámetros estadísticos: 1.1 Definición 1.2 Medidas de Centralización: Medias, moda y Mediana 1.3 Medidas de.
ESTADISTICA I Ing. Jahaziel Acosta. CUANTILES Los cuantiles son medidas de tendencia no centrales, que permiten determinar la proporci ó n de la poblaci.
Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados.
ESTADÍSTICAS DESCRIPTIVAS REPRESENTACIONES GRÁFICAS Psic. Gerardo A. Valderrama M:
PPTCES046MT22-A16V1 Clase Medidas de tendencia central y posición MT-22.
Tema 2. Parámetros estadísticos. Indice 1. Parámetros estadísticos. Tipos: 1.1 Medidas de centralización(medias y moda) 1.2 Medidas de posición(mediana,
República Bolivariana de Venezuela Instituto Universitario Politécnico “Santiago Mariño" Estadísticas I - OV Estadística Profesor : Bachiller: Pedro Beltrán.
Carrera de Administración Área Recursos Humanos Diseñó: Arturo Corona PeguerosEne-abr 17 Medidas de Medidas de Tendencia Central Tendencia Central Medidas.
1.3.1Media aritmética, geométrica y ponderada 1.3.2Mediana 1.3.2Moda Regresar.
Epidemiología y estadística descriptivas e indicadores
 Los datos que a continuación se presentan corresponden al número de llamadas telefónicas que un grupo de personas realiza durante el día. 0, 1, 2, 4,
Normatividad relativa a la calidad
Medidas de tendencia central
TABLAS DE FRECUENCIAS CON DATOS AGRUPADOS 8° BÁSICO
Profesora: Susana Abraham C.
ESTADÍSTICA UNIDIMENSIONAL
UNIDAD 4: ESTADÍSTICA Y PROBABILIDAD
Medidas de Tendencia Central
ESTADÍSTICA UNIDIMENSIONAL
ESTADÍSTICA UNIDIMENSIONAL
CONCEPTOS BASICOS ESTADISTICA.-Conjunto de métodos que nos permiten tomar decisiones en momentos de incertidumbre (duda). Tiene como objetivo que la información.
Estadística: conceptos básicos y definiciones.
Medidas de Tendencia Central 7° BÁSICO
Percentiles –cuartiles y rango intercuartil
INTERVALOS ES EL RECORRIDO DE TODOS LOS DATOS DENTRO DE UNA CLASE (Li-Ls) CANTIDAD DE CLASES: Raíz cuadrada N AMPLITUD DEL INTERVALO: 1. POR CONVENIENCIA.
Clase 5: Medidas de Variación
ESTADÍSTICA UNIDIMENSIONAL
ASIMETRÍA.
GRÁFICOS DE CAJAS VALORES ATIPICOS MEDIDAS DE DISPERSIÓN
MEDIDAS DE POSICION NO CENTRALES
estadistica
Estadística Básica Curso de Estadística Básica MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE.
Estadística.
Estadística Unidimensional Conceptos básicos.
MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS Y PARA TABLAS
DISTRIBUCIÓN MUESTRAL DE UNA MEDIA.
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS Y PARA TABLAS.
Aplicaciones Estadísticas a las Finanzas
UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS ADMINISTRATIVAS
ESTADÍSTICA BÁSICA.
Cuartiles, deciles, percentiles.
Introducción a la Estadística Descriptiva
ESTADÍSTICA DESCRIPTIVA
PROBABILIDAD Y ESTADISTICA APLICADA A LOS NEGOCIOS
MEDIDAS DE DISPERSIÓN.
ESTADÍSTICA.
Estadística Descriptiva
Dr. Carlomagno Araya Alpízar
Medidas de dispersión Por E. Skerrett.
Dr. Carlomagno Araya Alpízar
Calculo de Media Aritmética de datos agrupados
ESTADÍSTICA UNIDIMENSIONAL
Apuntes de Matemáticas 3º ESO
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I 1º BTO A
“Medidas de dispersión”
CARTA CONTROL DE MEDIAS INDIVIDUALES Y RANGOS MOVILES
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
Estadística Descriptiva
Estadística Asignatura obligatoria 5 créditos CBU 2015 Sexto semestre Módulo II. Medidas de tendencia central y de posición Universidad Autónoma del.
DISEÑO Y ANALISIS DE EXPERIMENTOS
Mediana, Moda y Media Aritmética
Transcripción de la presentación:

ESTADISTICA DESCRIPTIVA Mat. Jessica Jacqueline Machuca Vergara

POBLACIÓN, MUESTRA, PÁRAMETROS Y ESTADISTICOS. Inferir Estadísticos Estimados 𝒙 𝑺 𝑺 𝟐 Parámetros generalmente desconocidos µ 𝝈 𝝈 2

MEDIDAS DE TENDENCIA CENTRAL Media aritmética o promedio 𝑿 = 𝒙 𝟏 + 𝒙 𝟐 + 𝒙 𝟑 + 𝒙 𝟒 +…+ 𝒙 𝒋 𝒏 = 𝒋=𝟏 𝒏 𝒙 𝒋 𝒏 Por ejemplo: Se tienen las siguientes estaturas 1.50, 1.45, 1.55, 1.50, 1.40, 1.60 Promedio= 1.50+1.45+1.55+1.50+1.40+1.60 6 = 9 6 =1.50

Mediana Es un conjunto de números ordenados en orden de magnitud ascendente, es decir de menor a mayor; el dato que ocupa la posición central corresponde a la mediana. Por ejemplo: Se tienen las siguientes estaturas 1.40, 1.45, 1.50, 1.50, 1.55, 1.60 Mediana =1.50

Moda En un conjunto de números es el valor que ocurre con mayor frecuencia, es decir, es el valor más frecuente. La moda puede no existir en la distribución e incluso puede tener 2 o más. En el caso de una moda la distribución es unimodal; cuando existen dos modas es bimodal; tres modas, trimodal; y así sucesivamente. Por ejemplo: Se tienen las siguientes estaturas 1.40, 1.45, 1.50, 1.50, 1.55, 1.60 Moda=1.50

MEDIDAS DE DISPERSIÓN O VARIABILIDAD La dispersión o variabilidad de los datos es una medida de qué tan esparcidos se encuentran los datos de una población o proceso.

Desviación estándar o varianza Rango o amplitud El rango es la diferencia entre el valor máximo y el mínimo de un conjunto de datos. 𝑹𝒂𝒏𝒈𝒐= 𝑴𝒂𝒙𝒊𝒎𝒐 − 𝑴𝒊𝒏𝒊𝒎𝒐 Ejemplo de las estaturas: 1.40, 1.45, 1.50, 1.50, 1.55, 1.60 Rango =1.60 -1.40=0.20 Desviación estándar o varianza Indica qué tan dispersos están los datos con respecto a la media. Mientras mayor sea la desviación estándar o varianza, mayor será la dispersión de los datos, dependiendo de la escala de medida de los datos. 𝑺= 𝒊=𝟏 𝒏 𝑿 𝒊 − 𝑿 𝟐 𝒏−𝟏 Varianza = 𝑆 2 = 𝑖=1 𝑛 𝑋 𝑖 − 𝑋 2 𝑛−1

Desviación estándar o Varianza Ejemplo de las estaturas: 1.40, 1.45, 1.50, 1.50, 1.55, 1.60 𝑿 =𝟏.𝟓𝟎 Desviación estándar: 𝑺= 1.40−1.50 2 + 1.45−1.50 2 + 1.50−1.50 2 + 1.50−1.50 2 + 1.55−1.50 2 + 1.60−1.50 2 (6−1) 𝑺= 0.025 5 = 0.005 =0.070710 Varianza: 𝑺 𝟐 = 𝑖=1 𝑛 𝑋 𝑖 − 𝑋 2 𝑛−1 𝑺 𝟐 = 0.025 5 =0.005 𝑺= 𝒊=𝟏 𝒏 𝑿 𝒊 − 𝑿 𝟐 𝒏−𝟏

EJEMPLO 1 41.77 39.28 40.31 39.36 38.83 39.02 39.67 42.12 45.22 40.47 39.52 40.39 42.83 41.66 42.94 37.49 43.59 38.08 39.70 40.38 41.47 39.14 41.03 37.68 41.75 39.81 42.71 33.12 46.5 38.82 Un producto debe tener un % vol. de alcohol de 40%, con una tolerancia de ±5%. De los muestreos para evaluar la calidad se obtienen los siguientes datos:

Estadística descriptiva de los productos Recuento 30 Promedio 40.48 Mediana 40.34 Moda   Varianza 6.38 Desviación Estándar 2.52 Mínimo 33.12 Máximo 46.5 Rango 13.18 Estadística descriptiva de los productos

El promedio de % Volumen es 40 El promedio de % Volumen es 40.48, con esto puedo afirmar que, si se evalúan a otros 30 . ¿Se esperaría que el promedio fuera de 40.48? ¿Se esperaría que la desviación estándar fuera de 2.52?

REGLA EMPIRICA Los datos de una población se encuentran en los siguientes intervalos: 𝑥 −𝑆 a 𝑥 +𝑆 68% 𝑥 −2𝑆 a 𝑥 +2𝑆 95% 𝑥 −3𝑆 a 𝑥 +3𝑆 99.7%

Regla empírica para los % vol. de alcohol del producto anterior 𝑥 −3𝑆 = 40.48 - 3(2.52) = 32.92 𝑥 +3𝑆 = 40.48 + 3(2.52) = 48.04 El 99.7% de los productos del proceso o de la población tienen % vol. de alcohol se encuentran entre los valores de 32.92 a 48.04 Tolerancias de 35 a 45 ¿Se cumple con las especificaciones a 3 desviaciones estándar ? Promedio 40.48 Desviación Estándar 2.52

HISTOGRAMA El histograma es una gráfica de las frecuencias observadas de un conjunto de datos (Montgomery D.C., 1991); es uno de los métodos gráficos más comúnmente usados para ver la distribución de los datos. Tiene varias ventajas, una de ellas es que podemos observar la tendencia central y su dispersión.

PROCEDIMIENTO PARA EL HISTOGRAMA Ejemplo 2, consideremos el ejemplo de los volúmenes de tequila del ejemplo 1. Paso 1: ordenar los datos de menor a mayor 33.12 37.49 37.68 38.08 38.82 38.83 39.02 39.14 39.28 39.36 39.52 39.67 39.70 39.81 40.31 40.38 40.39 40.47 41.03 41.47 41.66 41.75 41.77 42.12 42.71 42.83 42.94 43.59 45.22 46.50 Paso 2. Calcular el rango de los datos. Rango= Dato mayor – Dato menor = 46.5 – 33.12=13.38

PROCEDIMIENTO PARA EL HISTOGRAMA Paso 3. Determinar el número de clases. Hay varias maneras de determinar el número de clases, el cual varía entre 5 y 15 dependiendo del número de datos. Uno de los más comunes es que el número de clases sea aproximadamente igual a la raíz cuadrada del número de datos. 𝟑𝟎 =𝟓.𝟒𝟕 Entonces, se recomienda un histograma con 5 o 6 clases, por lo cual tomaremos el numero 6. Paso 4. Fijar la longitud de clase. Una forma de asignar la misma importancia a todas las clases es tomando la longitud de clase (lc), que se obtiene de 𝒍𝒄= 𝒓𝒂𝒏𝒈𝒐 𝒏𝒖𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆𝒔 = 𝟏𝟑.𝟑𝟖 𝟔 =𝟐.𝟐𝟑

PROCEDIMIENTO PARA EL HISTOGRAMA Paso 3. Determinar el número de clases. Hay varias maneras de determinar el número de clases, el cual varía entre 5 y 15 dependiendo del número de datos. Uno de los más comunes es que el número de clases sea aproximadamente igual a la raíz cuadrada del número de datos. 𝟑𝟎 =𝟓.𝟒𝟕 Entonces, se recomienda un histograma con 5 o 6 clases, por lo cual tomaremos el numero 6. Paso 4. Fijar la longitud de clase. Una forma de asignar la misma importancia a todas las clases es tomando la longitud de clase (lc), que se obtiene de 𝒍𝒄= 𝒓𝒂𝒏𝒈𝒐 𝒏𝒖𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆𝒔 = 𝟏𝟑.𝟑𝟖 𝟔 =𝟐.𝟐𝟑

PROCEDIMIENTO PARA EL HISTOGRAMA PASO 5. Construir los intervalos de clase. Los intervalos se obtienen dividiendo el total de los datos en seis intervalos de igual longitud de clase, como se muestra en la siguiente tabla: CLASE INTERVALO 1 33.12-35.35 2 35.35-37.58 3 37.58-39.81 4 39.81-42.04 5 42.04-44.27 6 44.27-46.50

PROCEDIMIENTO PARA EL HISTOGRAMA PASO 6. Cuantificar la frecuencia de cada clase. Realizar el conteo de los datos que caen en cada intervalo de clase y especificar su frecuencia, como se ilustra en la siguiente tabla CLASE INTERVALO FRECUENCIA 1 33.12-35.35 2 35.35-37.58 3 37.58-39.81 12 4 39.81-42.04 9 5 42.04-44.27 6 44.27-46.50

PROCEDIMIENTO PARA EL HISTOGRAMA PASO 7. Las frecuencias relativas de cada intervalo de clase. Las frecuencias relativas se obtienen dividiendo cada frecuencia por el total de datos, como se puede ver en la tabla siguiente CLASE INTERVALO FRECUENCIA FRECUENCIA RELATIVA 1 33.12-35.35 0.033 2 35.35-37.58 3 37.58-39.81 12 0.4 4 39.81-42.04 9 0.3 5 42.04-44.27 0.16 6 44.27-46.50 0.066

PROCEDIMIENTO PARA EL HISTOGRAMA PASO 8. Hacer el histograma de frecuencias o de frecuencias relativas. El histograma consiste en una serie de barras cuya longitud de las bases son los intervalos de clase y la altura representa la frecuencia o la frecuencia relativa de los datos contenida en cada clase.

DIAGRAMA DE CAJA PARA EL %Vol. DE ALCOHOL 33.12 37.49 37.68 38.08 38.82 38.83 39.02 39.14 39.28 39.36 39.52 39.67 39.70 39.81 40.31 40.38 40.39 40.47 41.03 41.47 41.66 41.75 41.77 42.12 42.71 42.83 42.94 43.59 45.22 46.50 Calculo de cuartiles: Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 30 resulta que 30/4 = 7.5, el primer cuartil es valor siguiente del valor que esta en la posición 7, en este caso es 39.14. Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como 30/2 =15; como N es un numero par, la mediana es el valor promedio del quinceavo dato mas el dato que le sigue, 𝑿 = Q2 = (40.31+40.38)/ 2 =40.345

DIAGRAMA DE CAJA PARA EL %Vol. DE ALCOHOL 33.12 37.49 37.68 38.08 38.82 38.83 39.02 39.14 39.28 39.36 39.52 39.67 39.70 39.81 40.31 40.38 40.39 40.47 41.03 41.47 41.66 41.75 41.77 42.12 42.71 42.83 42.94 43.59 45.22 46.50 Calculo de cuartiles: Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En este caso, como (3 / 4)*(30) = 22.5, resulta que 41.77 es el tercer cuartil. Rango Intercuantil Q3-Q1=41.77-39.14=2.63

DIAGRAMA DE CAJA PARA EL %Vol. DE ALCOHOL Valor mínimo Punto atípico Valor máximo Cuartil Inferior Cuartil superior Mediana