La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Curso de Estadística Básica

Presentaciones similares


Presentación del tema: "Curso de Estadística Básica"— Transcripción de la presentación:

1 Curso de Estadística Básica
SESION 2 PRESENTACIÓN GRÁFICA DE DATOS MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez

2 Objetivo Aprender cómo presentar y describir conjuntos de datos

3 Agenda Sesión 2 Presentación gráfica de datos
Diagramas de pastel y gráficas de barras Diagrama de Pareto Gráfica de Puntos Distribución de frecuencia Histogramas

4 Resultados del examen de matemáticas…
Calificación: 78 E: ¿Cuál fue la calificación promedio del examen? I: el promedio del salón fue de 68 E: ¿cuán próxima del máximo está mi calificación? I: las calificaciones variaron de 42 a 87 puntos. 42 68 78 87

5 Resultados del examen de matemáticas…
Calificación: 78 E: ¿Cómo están distribuidas las calificaciones? I: la mitad del grupo obtuvo calificaciones entre 65 y 75. Conclusión del estudiante: su calificación es buena

6 Reflexión… Conjunto de datos: Estadísticas descriptivas:
Calificaciones del examen Estadísticas descriptivas: calificación promedio y calificaciones máxima y mínima Con esta información los estudiantes pueden obtener conclusiones sobre su éxito relativo

7 Estadística descriptiva
Medidas de tendencia central Medidas de dispersión Medidas de posición Tipos de distribución

8 Gráficas Una vez recolectado los datos de la muestra, es necesario “familiarizarse” con ellos. Aplicar una técnica inicial exploratoria de análisis de datos que produzca una representación visual. Las representaciones visuales revelan patrones de comportamiento de la variable de estudio. Existen muchas formas gráficas (visuales) para describir los datos. El método que se aplique es determinado por el tipo de datos y el concepto a representar. NOTA: Cuando se elabora una representación gráfica no existe solamente una respuesta correcta. El juicio del analista y las circunstancias que rodean al problema desempeñan un papel primordial en el desarrollo de la gráfica.

9 Diagramas de pastel Gráficas que se utilizan para resumir datos de atributo (cualitativos). Los diagramas de pastel muestran la cantidad de datos que pertenecen a cada categoría como una parte proporcional de un círculo.

10 Ejemplo En la tabla se muestra el número de casos de cada tipo de operación realizada en el Hospital General, el año pasado

11 Ejemplo Estos datos se muestran en un diagrama de pastel, donde cada tipo de operación está representado por una proporción relativa del círculo identificada con un porcentaje.

12 Diagramas de barras Gráficas que se utilizan para resumir datos de atributo (cualitativos). Las gráficas de barras muestran la cantidad de datos que pertenecen a cada categoría como áreas rectangulares de tamaño proporcional.

13 Ejemplo En la figura se presentan los mismos datos sobre el “tipo de operación” en forma de gráfica de barras

14 Pregunta En su opinión, con qué gráfica, diagrama de pastel o gráfica de barras, se obtiene una mejor representación de la información?

15 Respuesta La gráfica de círculo facilita la comparación visual de los tamaños relativos de las partes entre sí y el tamaño de cada parte con respecto al todo.

16 Diagrama de Pareto Gráfica de barras con éstas dispuestas de la categoría más numerosa a la menos numerosa. Incluye una gráfica hecha a base de rectas que muestra los porcentajes acumulados y la cantidad de datos representada por cada barra. Es una representación gráfica de los datos obtenidos sobre un problema, que ayuda a identificar cuáles son los problemas prioritarios que hay que tratar

17 Ejemplo

18 Consejos para elaborar y usar los diagramas de Pareto
No es conveniente que la categoría de “otros” represente un porcentaje de los más altos. De ser así, se debe utilizar un método diferente de clasificación. Es preferible representar los datos (si es posible) en valores monetarios. Si un factor se puede solucionar fácilmente debe afrontarse de inmediato aunque sea de poca importancia. Es imprescindible realizar un diagrama de causas si se quieren realizar mejoras

19 Ejercicio Se tienen los datos de una inspección final de defectos para la línea de ensamble A12 organizados en la siguiente tabla: Representar los datos en un diagrama de pareto

20 Pareto de la línea de ensamble A12

21 Ejercicio propuesto Utilizando como herramienta el diagrama de Pareto, analice las pérdidas por rechazos en una fábrica de papel, teniendo en cuenta que se han detectado los conceptos que se muestran en la tabla siguiente, en la que también se indican los costes asociados a cada concepto.

22 Gráficas para datos cuantitativos
Una razón fundamental para elaborar una gráfica de datos cuantitativos es mostrar la distribución de éstos. Distribución Patrón de variabilidad mostrado por los datos de una variable. La distribución muestra la frecuencia de cada valor de la variable.

23 Gráfica de puntos Presenta los datos de una muestra mediante la representación de cada porción de datos con un punto ubicado a lo largo de una escala. Esta escala puede ser vertical u horizontal. La frecuencia de los valores está representada a lo largo de la otra escala.

24 Gráfica de puntos La gráfica de puntos es una técnica que conviene utilizar al inicio del análisis de los datos. Esta representación da por resultado una imagen y una clasificación de los datos en orden numérico. (Clasificar datos es ordenarlos según el valor numérico)

25 Ejercicio Se eligió una muestra aleatoria de 50 estudiantes universitarios. Sus pesos fueron obtenidos de sus registros médicos. En la siguiente tabla se muestran los datos resultantes: obtener el diagrama de puntos y una conclusión

26 Distribuciones de frecuencia
Los listados de grandes conjuntos de datos no presentan una imagen valiosa. A veces se desea condensar los datos en una forma más manejable. Esto puede lograrse con ayuda de una distribución de frecuencia. Distribución de frecuencias Listado, a menudo expresado en forma de diagrama, que asocia cada valor de una variable con su frecuencia.

27 Ejemplo Se tiene el siguiente conjunto de datos:
Si x representa una variable, puede usarse una distribución de frecuencias para representar este conjunto de datos enumerando los valores x con sus frecuencias. Por ejemplo, el valor 1 se presenta tres veces en la muestra; por tanto, la frecuencia de x = 1 es 3.

28 Frecuencia La frecuencia f es el número de veces que aparece el valor x en la muestra. La tabla anterior es una distribución de frecuencias no agrupadas, porque cada valor de x en la distribución permanece solo. Cuando un gran conjunto de datos tiene muchos valores x distintos, es posible agrupar los valores en un conjunto de clases y elaborar una distribución de frecuencias agrupadas.

29 Ejercicio Forme una distribución de frecuencias no agrupadas de los datos resultantes: 1, 2, 1, 0, 4, 2, 1, 1, 0, 1, 2, 4

30 Distribución de frecuencias Agrupadas y No Agrupadas
De un grupo grande se extrajo aleatoriamente una muestra de 19 calificaciones de un examen: 50 o más hasta menos que 60 60 o más hasta menos que 70 70 o más hasta menos que 80 80 o más hasta menos que 90 90 o más hasta menos que 100 Distribución de frecuencias agrupadas Distribución de frecuencias no agrupadas

31 Distribución de frecuencias Agrupadas y No Agrupadas
Distribución de frecuencias no agrupadas Distribución de frecuencias agrupadas

32 Procedimiento para elaborar una distribución de frecuencias agrupadas
Cada clase debe ser del mismo ancho Las clases deben estar dispuestas de modo que no se superpongan y que cada porción de información pertenezca exactamente a una clase La raíz cuadrada de n es un lineamiento razonable para el número de clases con muestras de menos de 150 datos. Utilizar un sistema que aproveche un patrón numérico, para garantizar precisión Cuando sea conveniente, un ancho de clase par suele ser ventajoso

33 Ejemplo Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación se muestran los puntajes:

34 Procedimiento Identifique los puntajes máximo y mínimo y determine el rango. Máx = 98, Mín = 39. Rango = Máx – Mín = 98 – 39 = 59 Elija un número de clases m y un ancho de clase c de modo que el producto mc sea ligeramente mayor que el rango m = raíz cuadrada de n = 50 m = 7 c = 10 mc = 70 Es mayor que el rango = 59

35 Procedimiento Elija un punto inicial, que debe ser algo menor que el puntaje más bajo (min). Posteriormente se cuenta a partir de ahí en incrementos del ancho de clase. Cada número obtenido se denomina límites de clase.

36 Procedimiento Una vez establecidas las clases, es necesario clasificar los datos en dichas clases. El método utilizado para realizar la clasificación depende del formato actual de los datos: si los datos están ordenados, es posible contar las frecuencias; si los datos no están ordenados, se efectúa un conteo de éstos para determinar los números de frecuencia. Cuando se efectúa la clasificación de los datos, es de utilidad usar un diagrama estándar.

37 Notas Si se han ordenado los datos (en forma de lista, gráfica de puntos o representación de tallo y hojas) el conteo es innecesario; simplemente se cuentan los datos que pertenecen a cada clase. Si los datos no están ordenados, debe tenerse cuidado al efectuar el conteo. La frecuencia f para cada clase es el número de datos que pertenecen a esa clase. La suma de frecuencias debe ser exactamente igual al número de datos n (n = Σf). Esta sumatoria es una verificación aceptable.

38 Notas Cada clase requiere un solo valor numérico para representar todos los valores de datos que caen en esa clase. La marca de clase (algunas veces denominada punto medio de clase) es el valor numérico que está exactamente a la mitad de ésta y se encuentra al sumar los límites de clase y dividirlo entre 2.

39 Histograma Gráfica de barras que representa una distribución de frecuencias de una variable cuantitativa. Un histograma está integrado por los siguientes componentes: Un título, que identifica la población o la muestra de interés Una escala vertical, que identifica las frecuencias que hay en las diversas clases Una escala horizontal, que identifica la variable x. Los valores de los límites de una clase de las marcas de clase deben identificarse a lo largo del eje x. El empleo de cualquier método para identificar el eje presenta mejor a la variable.

40 Ejemplo

41 Forma de los histogramas
Simétrico, normal o triangular Uniforme o rectangular Sesgado a la derecha Sesgado a la izquierda En forma de J Bimodal


Descargar ppt "Curso de Estadística Básica"

Presentaciones similares


Anuncios Google