Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porNazario Riojas Modificado hace 9 años
1
Curso de Probabilidad y Estadística Tema: (7) Estadística Descriptiva
2
El campo de la Estadística
Recopilación, Presentación, Análisis y Uso de Información para resolver problemas, tomar decisiones, hacer estimaciones y diseñar productos y procedimientos
3
La variabilidad La Estadística sirve para presentar, describir y entender la variabilidad Un proceso produce un resultado, al repetirse un proceso, los resultados cambian a pesar de que el proceso se reprodujo aparentemente en las mismas circunstancias.
4
Población Colección de mediciones de un universo respecto al cual queremos obtener conclusiones o tomar decisiones. Ej. Conjunto de valores de consumo de energía (KWH) facturados en el primer bimestre de 2008
5
Tipos de datos Datos numéricos (continuos o discretos)
Datos categóricos (Ej. Sexo, marca, ..) Datos identificadores de unidades
6
Muestreo de datos Población Muestra Muestreo aleatorio
Nota: Si la muestra es igual a la población, al muestreo le llamamos censo
7
Estadística Descriptiva. Organización, resumen y presentación de datos
Inferencial. Llegar a una conclusión acerca de la población, el proceso o el modelo de asignación de las variables
8
Presentación gráfica de la información
Diagrama de puntos Gráficas de dispersión Diagramas de tallos y hojas Histogramas Diagramas de cajas con bigotes Gráficas de Pareto Series de tiempo
9
Diagrama de puntos Ejemplo: Datos de resistencia a la tensión de muestras de mortero Portland (Kg/cm2) con polímero agregado: mortero Portland sin modificar: * * ** * * * * * * * = Mortero modificado + = Mortero sin modificar
10
Graficas de dispersión
11
Gráfica de dispersión
12
Grafica de dispersión 3D
13
Gráfica de burbujas
14
Ejemplo: Resistencia a la tensión de 80 muestras de aleación Aluminio-Litio
15
Diagrama de tallos y hojas
Tallo Hoja Frecuencia
16
Tallos y Hojas ordenado
Tallo Hoja Frecuencia
17
Los datos ordenados Son 80 datos, como es un numero par, la mediana será el promedio de los que ocupan los lugares 40 y 41, o sea ( )/2=161.5 El primer cuartil es el valor en (0.25)*80+0.5=20.5, es decir, el promedio de los valores en los puestos 20 y 21, o sea ( )/2=144 El tercer cuartil es el promedio de los valores en los puestos 60 y 61, es decir, ( )/2=181
18
El rango intercuartil RIC=Q3-Q1 Es una medida de dispersión de datos
En el ejemplo anterior: RIC= =37
19
Tabla de Frecuencias Clase Frecuencia Frec. Relativa Frec. Rel. Acum.
20
Histograma
21
Ejercicio En un aeropuerto se registran los vuelos que arriban en una semana determinada y los datos se vuelcan en la siguiente tabla: Día Lunes Martes Miércoles Jueves Viernes Sábado Domingo Vuelos 25 37 45 50 32 40 30 Ordene en forma creciente y calcule mediana y cuartiles. ¿Cuántos vuelos hay el día que hay menos vuelos? ¿Cuántos vuelos hay el día que hay más vuelos?
22
Diagrama de Pareto Se ordenan la frecuencias en orden descendente
La escala horizontal no es necesariamente numérica La línea indica los porcentajes acumulados Útiles en análisis de datos de defectos en procesos de producción Muy usada en los programas de mejoramiento de calidad pues permite a los ingenieros concentrarse en los problemas realmente importantes
23
Ejemplo, Proceso de fabricación de un puerta de automóvil
Tipo de Defecto Cant Mancha 21 Rayón 35 Defecto en manija 17 Floja 29 Abollada 3 Defecto en vidrio 5 TOTAL 110 Tipo de Defecto Cant Rayón 35 Floja 29 Mancha 21 Defecto en manija 17 Otros 8 TOTAL 110 % 32 26 19 16 7 100
24
Diagrama de Pareto
25
Serie de tiempo
26
Descripción numérica de los datos
Media Varianza Moda Mediana Sesgo Curtosis Covarianza Factor de correlación
27
La media La media muestral La media de la población
28
La varianza La varianza muestral La varianza de la población
29
Varianzas muestrales, Covarianza muestral y correlación muestral
30
La moda El valor de mayor frecuencia
Si hay dos, la distribución es bi-modal
31
El rango dinámico La diferencia entre el máximo y el mínimo de los valores de la población
32
Sesgo y Curtosis
33
Regresión lineal Es una técnica estadística para investigar la relación entre dos o mas variables Se utiliza para realizar predicciones de una variable (respuesta) en términos de otras (regresivas) El término “regresión” fue acuñado por el frances Francis Galton quien lo usó en sus estudios de la herencia La regresión simple o bivariada consiste de hacer predicciones de una variable en términos de otra solamente En la regresión múltiple, la predicción se hace tomando en cuenta a varias variables
34
Regresión lineal simple
Asumimos que la relación entre la variable respuesta y la variable regresiva es una línea recta Cada observación cumple La suma de los cuadrados de los errores es
35
Regresión lineal simple
Para minimizar el error derivamos e igualamos a cero respecto a De la misma manera derivando respecto a Simplificando estas dos ecs:
36
Regresión lineal simple
Reconociendo que La ecuación Se convierte en Esto lo reemplazamos en Para obtener
37
Regresión lineal simple
De la ecuación Despejamos Para obtener
38
Regresión lineal simple
Es lo mismo que
39
Ejemplo Un Ingeniero está investigando el efecto de la temperatura sobre el rendimiento de un producto, sus experimentos arrojan los siguientes resultados Temp 100 110 120 130 140 150 160 170 180 190 Rend 45 51 54 61 66 70 74 78 85 89
40
La gráfica de dispersión
Esta gráfica nos indica una fuerte suposición de que la relación entre las dos variables puede ser lineal
41
Haciendo los cálculos
42
Finalmente
43
Perspectiva histórica de la teoría de la fiabilidad
Estudios para poder evaluar la mortalidad derivada de las epidemias. Compañías de seguros, para determinar los riesgos de sus pólizas de seguro de vida. Tablas de vida: La primera tabla de vida data de 1693 y es debida a Edmund Halley Orígenes: se utilizaban los métodos actuariales tanto para estimar la supervivencia de pacientes sometidos a distintos tratamientos como para estudiar la fiabilidad de equipamientos, en particular de los ferrocarriles. Siglo XX: En 1939 Waloddi Weibulll, cuando era profesor del Royal Institute of Technology en Suiza, propuso una distribución para describir la duración de materiales, que más tarde llevaría su nombre. En 1951 Epstein y Sobel empezaron a trabajar con la distribución exponencial como modelo probabilístico para estudiar el tiempo de vida de dispositivos
44
Estudiar Duraciones de Procesos que es común en muchas ciencias:
Herramientas de Fiabilidad Se estudia mediante el análisis estadístico de datos de supervivencia. ISO define fiabilidad como la probabilidad de que un componente o sistema, desarrolle durante un periodo de tiempo dado, la tarea que tiene encomendada sin fallos, y en las condiciones establecidas. Estudiar Duraciones de Procesos que es común en muchas ciencias: Duración de un componente (Fiabilidad) Supervivencia de un paciente a un tratamiento (Medicina) Duración del desempleo (Economía) Edad de las personas (Demografía y sociología)
45
Veamos, a partir de un histograma podemos desarrollar las cuatro funciones de importancia para la caracterización de la fiabilidad.
46
Pudiendo llamar a t1 y t2, -∞ y ∞ respectivamente
En estudios de mantenimiento necesitamos pasar del anterior histograma a funciones continuas, debido que la variable tiempo de fallo es continua. Esta funciones nos dan una idea clara de la distribución de fallos. Empezamos por la f(t) ó pdf que indica la densidad probable de fallas en cada intervalo t. Pudiendo llamar a t1 y t2, -∞ y ∞ respectivamente
47
F(t) ó CDF Cumulative Density Function:
aquí de -∞ a Tiempo t, seria la probabilidad de que la falla ocurra antes del tiempo t. el área bajo la curva - transcurrido t (Función Repartición ) cdf=14/48 Intervalo -∞ a t, la acumulación de fallas Tiempo t
48
R(t) Reliability (confiabilidad)
Esta es la probabilidad de éxito o sea que no ocurra la falla antes de t. Representando por el área bajo la curva desde t hasta infinito. R(t)= 1- F(t) Tiempo t
49
La tasa de falla del intervalo t1 a t2 se define como
Es la probabilidad de que ocurra una falla en el intervalo de t1 a t2 dado que no ha habido falla al tiempo t1 la función de Riesgo, o tasa de mortalidad h(t) es Y como R(t)=1-F(t), entonces R’(t)=-F’(t)=-f(t), de ahí Es muy común asumir que las fallas tienen una distribución exponencial, entonces: Y entonces se dice que la tasa de falla es constante, la constante λ
50
Función de Riesgo típica
(t) DOMINIO ELECTRONICO desclasificación Hipótesis exponencial constante 1 2 3 Edad t desarrollo obsolescencia Madurez (fallos aleatorios) Inicio utilización
51
Función de Riesgo típica
DOMINIO MECANICO (t) Influencia del desgaste sobre (t) Curva debida a los fallos precoces desclasificación Madurez 1 2 3 Edad t Puesta en servicio rodaje obsolescencia
52
Cuando la tasa de fallo del elemento responde a la curva de la bañera es conveniente realizar un ensayo acelerado del mismo (en condiciones de stress) para que supere la zona de mortalidad infantil o fallas infantiles. – determinar cuando comienza la vida útil del producto y ofrecer a los clientes una garantía de funcionamiento durante ese periodo de funcionamiento problemático. – Una vez superado el periodo crítico, la empresa está razonablemente segura de que el producto tiene una posibilidad de fallos reducida
53
La distribución de fallas de diferentes tipos de maquinaria no son las mismas. Aun varían en una misma maquina durante su operación. Sus formas pueden ser estudiadas a partir de las funciones pdf, cdf y tasa de falla de los datos reales de mantenimiento o de ensayos de fiabilidad. Estos dan forma a determinadas expresiones matemáticas conocidas como distribuciones obteniendo: Dist. Exponencial Dist. Normal Dist. Lognormal Dist. Weibull
54
EL MODELO EXPONENCIAL pdf cdf R(t) = h(t) f (t) = exp (-t), t 0
R(t) = exp (-t ), t 0 = h(t)
55
EL MODELO DE WEIBULL f (t) =5x) =0,5x) =3,6 =1x) f (x) =2,5x)
EL MODELO DE WEIBULL f (t) =5x) =0,5x) =3,6 =1x) f (x) =2,5x) parámetro de forma > 0; parámetro de escala > 0; parámetro de posición - < < + =2x) t (t) =4 3 2 2 1 1,5 0,5 1 0,5t t
56
Las características de la distribución de Weibull
57
Las características de la distribución de Weibull
58
Las características de la distribución de Weibull
f(t) - El parámetro de posición (en unidad de tiempo) Se llama también parámetro de diferenciación o de localización. Significado: indica la fecha de inicio de los fallos. -- si > 0, hay supervivencia total entre t = 0 y t = ; -- si = 0, los fallos empiezan en el origen del tiempo; -- si < 0, los fallos han empezado antes del origen del tiempo. 2 < 0 t 2 = 0 2 > 0
59
Ejemplo Obtención de la fiabilidad de neumáticos a través del Análisis de la degradación Siete marcas de neumáticos fueron controlados en su desgaste cada millas, midiendo la profundidad de cada uno. La tabla que contiene las mediciones desde su inicio hasta las millas f (t) = exp (-t), t 0 F(t) = 1 - exp(-t), t 0 R(t) = exp(-t ), t 0 Degradación Critica y= 2 mm
60
Ejemplo
61
Ejemplo
62
Ejemplo
63
Ejemplo
64
Diagrama de Ishikawa El diagrama de Ishikawa conocido también como causa-efecto, es una forma de organizar y representar las diferentes teorías propuestas sobre las causas de un problema. Nos permite, por tanto, lograr un conocimiento común de un problema complejo, sin ser nunca sustitutivo de los datos.
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.