La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ESTADÍSTICA PARA LA ADMINISTRACIÓN

Presentaciones similares


Presentación del tema: "ESTADÍSTICA PARA LA ADMINISTRACIÓN"— Transcripción de la presentación:

1 ESTADÍSTICA PARA LA ADMINISTRACIÓN

2 Introducción a la Estadística
La palabra estadística tiene 2 significados; Estadística 1; hechos numéricos sistemáticamente recolectados 2; Ciencia de recolectar, clasificar y utilizar estadísticas (Oxford Concise Dictionary) Por ejemplo……………….

3 Algunas definiciones de Estadistica.
Rama de las matemáticas que proporciona herramientas que permiten manejar grandes cantidades de datos, convirtiendolos en información útil. Forma de decir mentiras con fundamentos matemáticos.

4 DEFINICION: Es una ciencia, pues aplica el Método Científico al ocuparse de la recolección, organización, análisis, interpretación y presentación de datos, tanto para la deducción de conclusiones como para la toma de decisiones razonables de acuerdo a tales análisis.

5 Introducción (cont.) La ciencia de la Estadística utiliza;
· matemáticas (teoría de probabilidades) · ciencia de las computadoras (graficos and simulaciones) · filosofía Qué distingue a la Estadística de las matemáticas? · La estadística hace uso de las matemáticas

6 Introducción (cont.) La Estadística enfatiza la VARIABILIDAD NATURAL
De individuos (personas, plantas, ratas, ovejas, bombillas de luz, precios de acciones, etc). La Estadística es utilizada por: · científicos · biólogos · químicos · físicos · psicólogos · economistas

7 Introducción (cont.) La Estadística se usa para: Informar al publico
Proveer comparaciones Explicar resultados Influenciar decisiones Justificar un reclamo o afirmación Predecir futuros resultados Establecer una relación o asociación Estimar cantidades desconocidas

8 Introducción (cont.) Los Estadísticos (personas que estudian la estadística): Entienden la idea de la variabilidad de los individuos Se toman el tiempo siendo lógicos, profundos e imparciales cuando preparan resultados y reportes Se cuidan de no sacar conclusiones que están fuera de los límites de la pregunta que debe responderse mediante la estadística

9 UNIDAD DE ESTUDIO: Es el elemento mas pequeno al que podemos hacer referencia en un estudio estadistico. COLECTIVO: Es todo conjunto compuesto por mas de una unidad de estudio; un colectivo puede ser una MUESTRA o una POBLACION.

10 Datos Datos son piezas de información
Varias piezas de datos forman un conjunto de datos Los Datos se componen de los objetos que han sido medidos (eg personas, arboles, ratas) y los atributos que fueron registrados (edad, tamaño, ph, costo, peso, etc) objetos son aka sujetos, casos, entidades, etc Atributos son aka caracteristicas, variables, factores, etc

11 Variables Cuando medimos los atributos de un objeto, obtenemos un valor que varía entre objetos. Por ejemplo considere las personas en esta clase como objetos y su estatura como el atributo El atributo “altura” varía entre objetos, de ahí que los atributos son mas colectivamente conocidos como variables

12 TIPOS DE VARIABLES: DISCRETAS: Son aquellas que toman valores puntuales en una escala, ejemplo: No. de unidades producidas, No. de quintales transportados, etc. CONTINUA: Son aquellas que pueden tomar cualquier valor real en una escala, por ejemplo:Temperatura, peso, longitud, etc.

13 Tipos de Datos Las Variables pueden ser medidas en cuatro escalas diferentes Es escencial que sea capaz de identificar las cuatro diferentes escalas de medición y ejemplos de cada una

14 1 Escala Nominal de Medición
Los datos son medidos al nivel nominal donde cada caso es clasificado en una de un numero discreto de categorías EG Color, Partido Politico, Genero, etc

15 2 Escala Ordinal de Medición
Los datos son medidos en una escala ordinal si las categorías implican orden EG Rango Militar, Talla de ropa, etc La diferencia entre rangos es consistente en dirección, pero no en magnitud.

16 3 Escala de medición de Intervalo
Si las diferencias entre los valores tienen significado, los datos son medidos en la escala de Intervalo. La temperatura es el mejor ejemplo

17 4 Escala de medición de Ratio (rata)
Los datos medidos en una escala de ratio tienen diferencias que son significativas, y relativas a algun punto real de origen o cero. eg Peso, Altura, edad, etc Esta es la escala más común de medición.

18 Tipos de Datos (Cont.) Datos de tipo Ordinal, Intervalo y Ratio también se conocen como datos Cuantitativos Datos de tipo Nominal también son denominados datos Cualitativos

19 Dos tipos de Estadística
Estadística Descriptiva métodos de resumir grandes cantidades de datos en una forma conveniente Estadística Inferencial Métodos para extraer conclusiones (hacer inferencias) respecto a las características de una población por ejemplo…….

20 POBLACION: Se le llama población o universo, al conjunto total de unidades de estudio que se desean investigar. MUESTRA: Es un subconjunto de una población. Se utiliza cuando la población es muy numerosa, infinita o muy difícil de examinar. MUESTRA ALEATORIA: Es cuando cada elemento tiene la misma oportunidad de ser escogido. Muestreo aleatorio estratificado: Muestreo aleatorio sistematico:

21 Poblaciones Un componente esencial de entender la ciencia de la estadística es entender estos términos La población consiste en el conjunto de todas las mediciones en que el investigador está interesado Un número que describe una población se denomina un parametro por ejemplo…………...

22 Muestras Una muestra es un subconjunto de datos de la población
Un numero que describe una muestra es un estadístico por ejemplo…………...

23 Inferencia Si tomamos una muestra y calculamos un estadístico, utilizamos ese estadístico para inferir algo respecto a la población de la cual la muestra fue extraída. EG: Comunmente, las muestras son utilizadas para inferir respecto a: Resultados de Elecciones Preferencias del consumidor Actitudes hacia aspectos sociales Se le ocurre algún otro ?????

24 CONTENIDO Estadistica Descriptiva Regresion y Correlacion
Distribuciones Control Estadistico de Procesos

25 ESTADISTICA DESCRIPTIVA:
Es la parte de la Estadística que trata solamente de describir y analizar un colectivo, sin sacar conclusiones o inferencias de un colectivo mayor, a partir de ella. La Estadística descriptiva incluye las técnicas que se relacionan con el resumen y la descripción de datos. Estos datos pueden ser representados en forma gráfica y pueden incluir análisis por computadora.

26 ESTADISTICA DESCRIPTIVA
MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE DISPERSION MEDIDAS DE ORDEN MEDIDAS DE FORMA REPRESENTACION GRAFICA

27 MEDIDAS DE TENDENCIA CENTRAL
MEDIA (ARITMETICA O PONDERADA) MODA MEDIANA

28 MEDIDAS DE DISPERSIÓN Rango Desviacion Media Varianza
Desviación Típica o standard

29 MEDIDAS DE ORDEN Cuartiles Deciles Percentiles

30 MEDIDAS DE FORMA Sesgo Curtosis Momentos

31 REPRESENTACION GRAFICA
Histograma de frecuencias Diagrama de Pareto Ojiva de Frecuencias Acumuladas Diagrama de Pastel Diagrama de Cajas Diagrama de Tallos y Hojas

32 MEDIA ARITMETICA

33 EJEMPLO

34 MEDIA PONDERADA

35 EJEMPLO

36 Mediana Valor que divide la serie de datos en dos partes iguales.
Si el numero de datos es impar, es el valor que está situado justo en medio. Si el número de datos es par, es el promedio aritmético de los dos datos de en medio.

37 EJEMPLO

38 Moda Es el valor que mas se repite en un conjunto de datos.
Puede no existir o puede existir mas de uno.

39 EJEMPLO

40

41 EJEMPLO

42

43 EJEMPLO

44

45 EJEMPLO

46

47 RESULTADO DEL PROCESO DE LLENADO
INDUSTRIAL DE REFRESCOS (en ml)

48 DATOS ORDENADOS

49 MEDIDAS DE TENDENCIA CENTRAL

50 MEDIDAS DE DISPERSION

51 CONSTRUCCION DE UNA TABLA DE FRECUENCIAS

52 TABLA DE FRECUENCIAS

53

54 HISTOGRAMA DE FRECUENCIAS

55

56 MEDIDAS DE ORDEN Son aquellas que nos permiten ubicar un dato de acuerdo a la posicion que ocupa dentro de la serie de datos. Nos permiten ordenar, clasificar y categorizar los datos. Tambien se conocen como fractilos porque dividen los datos en partes iguales.

57 FRACTILOS De acuerdo al numero de partes en que se dividan los datos los fractilos pueden ser: Cuartiles: si dividen a los datos en cuatro partes iguales. Deciles: si dividen a los datos en diez partes iguales. Percentiles o Centiles: si dividen a los datos en cien partes iguales.

58 FRACTILOS cont... Por ejemplo, los cuartiles dividen la distribucion de datos en cuatro partes iguales, cada una conteniendo el 25% de los datos. De lo anterior se deduce que, como se dijo anteriormente, si la mediana divide los datos en dos partes iguales, debe ser igual al cuartil 2, al decil 5 y al percentil 50.

59 FRACTILOS cont... Forma de calculo:
D = # de partes en que vamos a dividir los datos (para cuartiles 4, para deciles 10, para percentiles 100). F = # del fractilo a calcular, es decir, si queremos calcular el tercer cuartil, F es igual a 3, si queremos calcular el sexto decil, F es igual a 6, etc. N = # de datos en la distribucion.

60 FRACTILES cont... Entonces, la posicion del fractilo esta dada por:
F*N + (D-F) D Ejemplo: Para calcular el cuartil 3 de 50 datos: 3*50 + (4-3) 4 37.75, es decir que el tercer cuartil esta ubicado entre el dato 37 y el 38, a un 75% de la distancia entre ambos datos.

61 EJEMPLO Para continuar con el ejemplo de las dos maquinas llenadoras, vamos a calcular los cuartiles 1 y 3 para cada maquina, entonces: D = 4 N = 50 F = 1 y 3 1*50 + (4-1) 13.25 para el cuartil 1 3*50 + (4-3) 37.75 para el cuartil 3 Esto quiere decir que el cuartil 1 se encuentra entre el dato 13 y el 14 mientras que el cuartil 3 esta entre el dato 37 y 38.

62

63 OTRA MEDIDA DE DISPERSION
El Rango Intercuartil es otra medida de dispersion utilizada para poder determinar el rango de valores en el que se encuentra el 50% de los datos, excluyendo el 50% que se encuentre en los extremos, es decir, 25% en el extremo superior y 25% en el extremo inferior.

64 RANGO INTERCUARTIL El rango intercuartil es la diferencia entre el cuartil 3 y el cuartil 1: RI = Q3 - Q1

65 EJEMPLO Para las maquinas llenadoras: Maquina 1: Maquina 2:
22.5 Maquina 2: 6

66 DIAGRAMA DE CAJAS Esta es una herramienta sumamente util para comparar distintos grupos de datos, ya que permite ver en una sola grafica, la tendencia central y la dispersion, asi como detectar datos atipicos o sospechosos.

67 EJEMPLO

68 PASOS PARA CONSTRUIR UN DIAGRAMA DE CAJAS
Calcular los cuartiles 1,2 y 3. Graficar una linea para cada uno de los cuartiles. La caja queda definida por el rango intercuartil y la linea dentro de la caja identifica la mediana. Calcular el rango intercuartil (Q3 - Q1) al que se denomina RI. Calcular dos valores: Valor Adyacente Superior y Valor Adyacente Inferior (VAS y VAI).

69 Estos valores se calculan de la siguiente manera:
VAS = Q *RI VAI = Q *RI Luego, encontrar en los datos dos valores: m y M tal que: m = max(Xi | Xi <= VAS) M = min(Xi | Xi >= VAI) Estos valores se grafican como los limites de los alambres que nos sirven para identificar datos atipicos del conjunto de datos.

70 EJEMPLO

71

72 PARETO: Forma de separar los pocos vitales de los muchos triviales, que significa en esencia analizar la causas y efectos que constituyen en el 80% de un problema y obviar el 20% que suelen ser causas triviales. Este enfatiza en la mayoría de los casos que pocas causas pueden ser provocadoras del 80% de efectos de un problema.

73 Ejemplo: Se presenta a continuación una tabla con las causas a las que se atribuye el bajo rendimiento de los alumnos en los programas de maestria que imparte FISICC. Construya un diagrama de pareto para identificar cuales son los principales problemas que afrontan los estudiantes.

74

75

76 APLICACIONES DE LAS MEDIDAS DE TENDENCIA CENTRAL Y DISPERSION
¿Cuál es la clase más homogénea? ¿En cuál espera que existan menos alumnos que pierdan la clase? ¿En cuál parece que hay más problemas? ¿Comparando las clases A,B y D, En cuál seguramente hay notas más altas?

77

78 Problema: Exámenes de curso
¿Cuál cree Ud. Que fue el examen más difícil? ¿Cuál cree Ud. Que fue el más fácil?

79 MEDIDAS DE FORMA Las medidas de forma sirven para darnos una idea respecto a la simetria y la agudez de la distribucion de los datos. Las medidas de forma mas importantes son: Sesgo Curtosis

80 SESGO Si el resultado es positivo esta sesgada a la derecha Si el resultado es negativo esta sesgada a la izquierda OTRAS FORMULAS: 3*(MEDIA - MEDIANA) SESGO= DESVIACION

81 Curtosis: También se le denomina grado de agudez, y es el grado de apuntamiento de una distribución. Existen 3 tipos: Normal o mesocurtica:Distribución no muy apuntalada ni achatada, o sea normal. Leptocurtica: Tiene apuntamiento. Platicúrtica: Más achatada que la Normal.

82

83 AGRUPACION DE DATOS: Rango= Dato mayor -Dato menor
Número de clases (K) K= Log N (usar entre 3 y 12 intervalos como máximo) Intervalos de clase (i) i= Rango/K Número de observaciones y número de celdas recomendado: De: celdas De: celdas De: Celdas De: Celdas De: celdas De: 1000 en adelante 11 a 15 celdas

84 MEDIANA Lri = Limite inferior de la celda donde esta la mediana
n = Número total de observaciones Fa = Frecuencia acumulativa anterior a la celda donde esta la mediana FMe = Frecuencia de la celda de la mediana i = Ancho del intervalo de la celda.

85 MODA Lri = Limite inferior de la clase modal
= Diferencia con la clase anterior = Diferencia con la clase posterior i = Ancho del intervalo de la celda.

86 Calculo de Medidas de Tendencia Central

87

88 Cálculo de la MODA Cálculo de la Mediana

89

90

91

92

93

94

95 EJEMPLO Con los datos del problema anterior, encuentre: a) varianza (s2), b) desviación típica (s), c) desviación estándar (s’), d) coeficiente de variación (V).

96

97 Ejemplos de uso de la Desviación típica, y Varianza

98 MOMENTOS Se utilizan para producir valores que sirven el cálculo de las medidas de asimetría y agudez. Existen de 3 clases: Con respecto del origen Con respecto a la media. Con respecto a cualquier punto.

99 Datos no agrupados: Respecto al origen Respecto a la media
Con respecto a cualquier punto.

100 Datos agrupados:

101 Coeficiente de asimetría Dado en función del momento 3
+ Asimetria positiva 0 Simétrica -Asimetria negativa.

102 METODO DE OCHO PASOS PARA RESOLVER PROBLEMAS
“UNA PERSONA VALIENTE NO ES EL QUE NO TIENE MIEDO, SINO AQUEL QUE A PESAR DEL TEMOR LO SUPERA Y SE ENFRENTA A SUS PROBLEMAS”

103 Los problemas nunca se acaban
Pero todo en la vida tiene solución y los problemas empresariales no son la excepción. Sin embargo, hay que saberlos tratar para que se resuelvan de manera efectiva y, de ser posible, para siempre. “Mil cortes en las hojas del árbol del mal equivalen a uno sólo en las raíces” Thoreau

104 ¿Qué es un problema? SITUACIÓN EN DONDE EL RENDIMIENTO O
COMPORTAMIENTO DE UN SISTEMA NO SA- TISFACE LAS EXPECTATIVAS. En general, podríamos decir que existe un problema cuando algo no ofrece el resultado que esperamos.

105 Los ocho pasos Definición del problema Acción momentánea
Definición del origen Acción correctiva definitiva Comprobación Estandarización Documentación Conclusiones

106 1. Definición del problema
A) El tiempo en que ocurre B) El tipo de problema C) El síntoma presentado D) Aspectos circunstanciales E) Incluir información que no pueda ser presentada en forma de datos (gráficas y diagramas) F) Considerar cuándo, cuánto, qué, quién, dónde, etcétera)

107 2. Acción momentánea Es la acción para solucionar el problema temporalmente y así garantizar que, a pesar de que el problema existe, éste no va a afectar al cliente. Busque una acción momentánea a realizar para cada problema mientras lo resuelve de forma definitiva.

108 3. Definición del origen del problema
Definir dónde exactamente se originó un problema es la clave para encontrar la solución más acertada. A) Generar lluvia de ideas: Un mismo problema puede ser visualizado de muy distintas maneras por diferentes personas. Importante: Debe realizarse en un clima de amistad. Todas las ideas son importantes. B) Elaborar diagrama de causa-efecto (Ishikawa): Relación entre un problema o resultado y las causas que lo ocasionaron.

109 Construcción de un diagrama de causa-efecto
1) Definir el problema 2) Identificar las causas mayores ayudados por una lluvia de ideas. 3) Identificar las subcausas. 4) Ponderar las causas antes de evaluarlas 5) Evaluar las causas más probables 6) Tomar una solución.

110 Diagrama de causa-efecto
R.R. H.H. EQUIPO LIDERAZGO DESUNION EQUIPO DE COMPUTO OPORTUNIDAD RESPONSABILIDAD IDENTIFICACION CON LA INSTITUCION TELEFONOS DESIGUALDAD CONFIANZA REL. INTERNAS ACTITUD COMUNICACIÓN INADECUADA CARGAS AUTORIDAD RIGIDA TRABAJO EXCESO DE PERSONAS DECISIONES TIEMPOS RIGIDEZ CLARIDAD VENTILACION PROCESOS ESPACIO INFORMACION DEFINICIÓN REDUCIDO OBJETIVOS FORMA DE TRANSMITIR DISPONIBILIDAD MEDIO AMBIENTE CLAROS METODOS

111 4. Acción correctiva definitiva
A) Actividades a realizar B) Responsables C) Involucrados D) Tiempos E) Recursos 5. Comprobación A) Tiempo de revisión B) Frecuencia C) Responsable 6. Estandarización Los cambios deberán establecerse de manera formal para asegurar su correcta aplicación en adelante.

112 7. Documentación 8. Conclusiones
Recopilar toda la información, hechos, decisiones, etcétera, que se llevaron a cabo desde que apareció el problema hasta su solución definitiva. 8. Conclusiones Aunque el problema resuelto sea el mismo, la experiencias de cada una de las personas es diferente; cada quien ve el problema desde su propia perspectiva. Compartir experiencias es una forma de aprendizaje muy enriquecedora.

113 Probabilidad: Posibilidad de que algo llegue a suceder
Frecuencia de un evento dentro de un todo (población). P= (NA/N) Donde: NA= # de veces que ocurre el evento A N= # total de posibles resultados.

114 FORMULAS: P(AUB)= P(A) + P(B) , para sucesos mutuamente excluyentes (Si uno sucede es imposible que el otro se produzca). P(AUB)= P(A) + P(B) - P(A B) Para eventos no mutuamente excluyentes. Si A y B son eventos independientes: P(A B)= P(A)*P(B) Si los sucesos son dependientes: P(A B)= P(A)*P(B/A)

115 PERMUTACION: COMBINACION:
Es una disposición ordenada de un conjunto de objetos. COMBINACION: Si la forma como se ordenan es irrelevante entonces se le llama combinación, (no importa el orden)

116 DISTRIBUCIONES DE PROBABILIDAD Y FRECUENCIA
Experimento: En estadistica, se denomina experimento a cualquier actividad que se realice con el fin de comprobar una hipotesis. Evento: Es el resultado de un experimento.

117 Variables Aleatorias:
Es aquella que toma valores diferentes como resultado de un experimento aleatorio TIPOS: DISCRETA: toma valores puntuales en una escala de medicion. CONTINUA: Puede tomar cualquier valor dentro de una escala de medicion o de valores. VALOR ESPERADO DE UNA VARIABLE ALEATORIA: Es un promedio pesado del valor de cada resultado posible multiplicado por la probabilidad de dicho resultado

118 DISTRIBUCIONES DE PROBABILIDADES:
Están relacionadas con las distribuciones de frecuencias, generalmente se piensa como una distribución de frecuencia teórica cuando se habla de distribución de probabilidades. TIPOS: DISCRETAS: Cuando los datos y la variable toma números limitados de valores. CONTINUAS: Cuando los datos y la variable (toma valores en un rango a utilizar) y la población se puede decir que es muy grande (infinita) DISTRIBUCIONES DISCRETAS: Entre las funciones de distribución de probabilidades que más utilizamos están: HIPERGEOMETICA BINOMIAL POISSON

119 LA DISTRIBUCION BINOMIAL:
HIPERGEOMETICA: Se utiliza cuando la muestra de la población es finita y se toma la muestra sin reemplazo Para fines de la carrera es muy poco utilizado. LA DISTRIBUCION BINOMIAL: Se utiliza en probabilidad discreta, cuyo número de elementos es infinito, es usada cuando tenemos atributos, ejemplo: aceptable, no aceptable, éxito o fracaso, falla o no falla, etc. Esta describe resultados de un proceso de Bernoulli (este proceso dice que las probabilidades solo pueden ser p= éxito, cara, etc q=1-p, lo contrario de p. La probabilidad de este evento permanece fijo respecto al tiempo. Los eventos son estadísticamente independientes.

120 Formula de la Binomial:
P(Probabilidad de r éxitos en n ensayos)= p= probabilidad de tener éxito q= probabilidad de no tener éxito r= # de éxitos deseados n= # de intentos hechos.

121 DISTRIBUCION DE POISSON:
Se utiliza en probabilidad discreta, se aplica a diversas situaciones que aplican la realización de observaciones por unidad de tiempo. Ejemplo contar el número de vehículos que llegan a una caseta de control, contar el número de máquinas descompuestas durante 1 día, distribución de llamadas telefónicas que llegan a un conmutador, la demanda de pacientes que necesitan servicios, etc. CARACTERISTICAS: Con el ejemplo del número de vehículos que pasan por una sola caja de una caseta de cobro, daremos las características: La media del número de vehículos que llegan por hora pico puede estimarse a partir de datos sobre tráfico que se tengan disponibles. Si dividimos la hora pico en períodos (intervalos) de un segundo cada uno, encontraremos las siguientes afirmaciones: A) La probabilidad de que exactamente un vehículo llegue a una caja por segundo es muy pequeño.

122 B) La probabilidad de que dos o más vehículos lleguen en un intervalo de un segundo es muy pequeña.
C) El número de vehículos que llegan a un intervalo dado de un segundo es independiente de que dicho intervalo se presente en la hora pico. El número de llegadas en cualquier intervalo de un segundo no depende del número de llegadas en cualquier otro intervalo de un segundo. FORMULA: Donde: = Número medio de presentaciones por intervalos de tiempo. X= Valor de variable.

123 FUNCIONES CONTINUAS: La más utilizada es la Normal y es sobre la cual esta soportada muchas aplicaciones. Definimos: Donde: xi= Dato = Media

124 ANALISIS DE REGRESION Y CORRELACION
El término regresión, se uso por primera vez como un concepto estadístico por Sir Francis Galton. Galton hizo un estudio que mostró que, la altura de los niños de los padres altos tiende a bajarse, o "regresar", hacia la altura media de la población. El designó la palabra "regresión" como el nombre del proceso general de predecir una variable (la altura de los niños), a partir de otra (la altura de los padres). Posteriormente, los estadísticos usaron el término regresión múltiple para describir el proceso mediante el cual se usan varias variables para predecir otra. En el análisis de regresión, se desarrollará una ecuación de estimación, es decir, una fórmula matemática que relaciona las variables conocidas con la variable desconocida

125 TIPOS DE RELACIONES DE CURVAS DE REGRESION
Los análisis de regresión y correlación, están basados en la relación o asociación entre dos o más variables. La variable conocida es llamada variable independiente. La variable que se está tratando de predecir es la variable dependiente. REGRESION LINEAL La ecuación de la relación lineal es: Y = ao + a1X Donde ao & a1 son parámetros estadísticos que se deben calcular.

126 METODO DE MINIMOS CUADRADOS
Consideremos los puntos representados por (X1,Y1), (X2,Y2), ..., (Xn,Yn). Para un valor de Xi, existirá una diferencia Di entre Yi y el valor que da la ecuación de ajuste. Cada diferencia Di, se conoce como desviación, error o residuo; la cual, puede ser positiva, negativa o cero. De todas las curvas de aproximación a una serie de datos puntuales, la curva que tiene la propiedad de que: D12 + D DN2 es mínimo se conoce como la mejor curva de ajuste. Así una recta con esta propiedad se llama recta de mínimos cuadrados y tiene la ecuación: Y = ao + a1X donde las constantes ao y a1 se determinan mediante el sistema de ecuaciones simultáneas: S Y = ao (N) + a1 (S X) S XY = ao (S X) + a1 (S X2) que son llamadas ecuaciones normales para la recta de mínimos cuadrados. Si se resuelve el sistema en forma general, entonces se obtienen las siguientes fórmulas:

127 Formulas para calcular los valores

128 CORRELACION CORRELACION LINEAL
La correlación, es el grado de relación que existe entre las variables, y un análisis de correlación determina en que medida una ecuación lineal o de otro tipo describe o explica de una forma adecuada la relación entre las dos variables. Si todos los valores de las variables satisfacen exactamente una ecuación, se dice que las variables están correlacionadas perfectamente o que hay correlación perfecta entre ellas. Así las áreas "A" y los radios "r" de todos los círculos están correlacionados perfectamente, puesto que A = p * r2. Las variables altura y peso de los individuos muestran cierta correlación. CORRELACION LINEAL Consideremos el diagrama de dispersión de la figura 4.3, si "Y" tiende a incrementarse cuando "X" aumenta, como en (a), la correlación se dice positiva o correlación directa. Si "Y" tiende a disminuir cuando se incrementa "X", como en (b), la correlación se dice negativa o correlación inversa. Si no hay ninguna relación entre las variables, como en (c), se dice que no hay correlación entre ellas, es decir, no están correlacionadas.

129 COEFICIENTE DE CORRELACION LINEAL
Si se supone una relación lineal entre las dos variables, el coeficiente de correlación se calcula como: Donde r esta en el rango entre -1 y 1, si r=1 se dice que es una buena correlación y si r=0, no hay correlación

130 COEFICIENTE DE DETERMINACION
Al cuadrado del coeficiente de correlacion se le denomina “coeficiente de determinacion”. Aunque el mas utilizado es el coeficiente de correlacion, es el coeficiente de determinacion el que tiene un significado mas concreto. El coeficiente de determinacion representa la fraccion (o el porcentaje) de la variacion de “y” que es explicada por la variacion de “x”. Por ejemplo, si obtenemos un coeficiente de correlacion de 0.95 y lo elevamos al cuadrado obtenemos , es decir que la variacion de la variable independiente (x) explica el 90.25% de la variacion de la variable dependiente (y). El otro 10% de la variacion de “y” es atribuible a otras causas que pueden incidir en dicha variable.

131 EJEMPLO Los siguientes datos son las mediciones de velocidad del aire y del coeficiente de evaporación de las gotitas de combustible en una turbina de propulsión. Velocidad del aire Coeficiente de evaporación X (cm/seg) Y (mm2/seg) Encuentre: a) la ecuación de la recta de mínimos cuadrados, b) utilice la ecuación anterior, para estimar el coeficiente de evaporación de una gotita cuando la velocidad del aire es de 190 cm/seg, c) coeficiente de correlación.

132 SOLUCION: a) Recta de regresión "Y" sobre "X": X Y X Y XY , , , , , , , , , 2, , ,175.4

133 N = 10 datos S X = 2,000 S X2 = 532,000 S Y = S XY = 2,175.40 Sustituyendo en las ecuaciones normales: S Y = ao N + a1 S X S XY = ao S X + a1 S X2 = ao a1 2, (1) 2, = ao 2, a1 532, (2) Resolviendo las ecuaciones (1) y (2) en forma simultánea tenemos: ao = ; a1 = , sustituyendo en Y = ao + a1 X, obtenemos la ecuación de la recta de regresión de "Y" sobre "X": Y = X (3) b) para X = 190 el coeficiente de evaporación será: Y = (190) = 0.79 Y = 0.79 mm2/seg

134 c) el coeficiente de correlación es :
Ö [10(532,000)-(2,000)2][10(9.1097) - (8.35)2] El valor del coeficiente de correlación nos indica: que la correlación es positiva, debido al signo del coeficiente, que la relación entre X & Y es bastante buena, ya que el coeficiente es bastante cercano a 1, en valor absoluto, cuando el coeficiente es bastante cercano a cero, se dice que no hay correlación entre las variables X & Y.

135 d) el coeficiente de determinacion es :
r^2 = ^ 2 = equivalente a 90.25% El valor del coeficiente de determinacion nos indica: Que podemos atribuir en un 90.25% la variacion de Y a la variacion de X y un 9.75% de la variacion es atribuible a otros factores que no fueron considerados en el modelo matematico. Cuando el porcentaje es bajo, digamos abajo del 80%, debemos escoger otra variable independiente o agregar una variable mas al modelo y realizar un analisis de regresion multiple.

136 CURVE EXPERT Es uno de tantos programas disponibles para realizar analisis de regresion y correlacion. Tiene la ventaja de tener predetermina-dos una gran cantidad de modelos, aparte de los que el usuario quiera definir. Es un Shareware que se encuentra disponible en internet.


Descargar ppt "ESTADÍSTICA PARA LA ADMINISTRACIÓN"

Presentaciones similares


Anuncios Google