ESTADÍSTICA PARA LA ADMINISTRACIÓN

Slides:

Advertisements

Presentaciones similares

DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE

Advertisements

REGRESION LINEAL SIMPLE

CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?

Estadística Unidad III

ESTADÍSTICA DESCRIPTIVA

FRANCISCO JAVIER RODRÍGUEZ

Capítulo I. Introducción

HERRAMIENTAS PARA EL CONTROL ESTADÍSTICO DE CALIDAD.

1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:

MEDIDAS DE DISPERSIÓN:

COMPORTAMIENTO DE LAS DISTRIBUCIONES DE

Estadística Descriptiva

ANALISIS DE DATOS CON EXCEL

Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.

Mt. Martín Moreyra Navarrete.

Estadística Descriptiva continuación

DISTRIBUCIONES DE MUESTREO

Gerenciamiento Técnico de Proyectos

Datos: Estadística.

Tema 2: Parámetros Estadísticos

ESTADÍSTICAS DESCRIPTIVA

FACILITADOR JOSE HERIBERTO CRUZ GARCÍA

Coeficiente de Variación

Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.

Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.

Laboratorio de Estadística administrativa

Medidas de Posición y Centralización Estadística E.S.O.

SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO

Inferencia Estadística

Construcción de gráficas: Forma manual y con programados

ESTADÍSTICA DESCRIPTIVA

Tratamiento de datos y azar

TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.

MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.

Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.

Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión

LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014

UNIDAD 1.- EVALUACIÓN DE DATOS ANALITICOS

Qué es una Variable Aleatoria??????????

LA ESTADÍSTICA.

Pruebas de hipótesis.

1-1 Capítulo dos Descripción de los datos: distribuciones de frecuencias y representaciones gráficas OBJETIVOS Al terminar este capítulo podrá: UNO Organizar.

Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.

Métodos Cuantitativos

SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.

Estimación y contraste de hipótesis

Estadística II Regresión Lineal.

Análisis de los Datos Cuantitativos

Unidad 1: Generalidades sobre estadística

Aplicaciones Estadísticas a las Finanzas Clase 1

Estadística Reporte Ejecutivo

CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL

MEDIDAS DE TENDENCIA CENTRAL

Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.

Características de las distribuciones estadísticas

INFERENCIA ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA

UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONOMICAS INFERENCIA ESTADISTICA TEMA: ESTIMACION PUNTUAL, PROPIEDADES DE LAS ESTIMACIONES;

Aplicaciones Estadísticas a las Finanzas Clase 1

Coeficiente de variación

Análisis de tablas y gráficos IV medio

ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.

DIPLOMADO DE POSTGRADO

Estadística descriptiva

MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.

Estadística descriptiva

TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.

CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión.

Estadística y probabilidad

TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.

Transcripción de la presentación:

ESTADÍSTICA PARA LA ADMINISTRACIÓN

Introducción a la Estadística La palabra estadística tiene 2 significados; Estadística 1; hechos numéricos sistemáticamente recolectados 2; Ciencia de recolectar, clasificar y utilizar estadísticas (Oxford Concise Dictionary) Por ejemplo……………….

Algunas definiciones de Estadistica. Rama de las matemáticas que proporciona herramientas que permiten manejar grandes cantidades de datos, convirtiendolos en información útil. Forma de decir mentiras con fundamentos matemáticos.

DEFINICION: Es una ciencia, pues aplica el Método Científico al ocuparse de la recolección, organización, análisis, interpretación y presentación de datos, tanto para la deducción de conclusiones como para la toma de decisiones razonables de acuerdo a tales análisis.

Introducción (cont.) La ciencia de la Estadística utiliza; · matemáticas (teoría de probabilidades) · ciencia de las computadoras (graficos and simulaciones) · filosofía Qué distingue a la Estadística de las matemáticas? · La estadística hace uso de las matemáticas

Introducción (cont.) La Estadística enfatiza la VARIABILIDAD NATURAL De individuos (personas, plantas, ratas, ovejas, bombillas de luz, precios de acciones, etc). La Estadística es utilizada por: · científicos · biólogos · químicos · físicos · psicólogos · economistas

Introducción (cont.) La Estadística se usa para: Informar al publico Proveer comparaciones Explicar resultados Influenciar decisiones Justificar un reclamo o afirmación Predecir futuros resultados Establecer una relación o asociación Estimar cantidades desconocidas

Introducción (cont.) Los Estadísticos (personas que estudian la estadística): Entienden la idea de la variabilidad de los individuos Se toman el tiempo siendo lógicos, profundos e imparciales cuando preparan resultados y reportes Se cuidan de no sacar conclusiones que están fuera de los límites de la pregunta que debe responderse mediante la estadística

UNIDAD DE ESTUDIO: Es el elemento mas pequeno al que podemos hacer referencia en un estudio estadistico. COLECTIVO: Es todo conjunto compuesto por mas de una unidad de estudio; un colectivo puede ser una MUESTRA o una POBLACION.

Datos Datos son piezas de información Varias piezas de datos forman un conjunto de datos Los Datos se componen de los objetos que han sido medidos (eg personas, arboles, ratas) y los atributos que fueron registrados (edad, tamaño, ph, costo, peso, etc) objetos son aka sujetos, casos, entidades, etc Atributos son aka caracteristicas, variables, factores, etc

Variables Cuando medimos los atributos de un objeto, obtenemos un valor que varía entre objetos. Por ejemplo considere las personas en esta clase como objetos y su estatura como el atributo El atributo “altura” varía entre objetos, de ahí que los atributos son mas colectivamente conocidos como variables

TIPOS DE VARIABLES: DISCRETAS: Son aquellas que toman valores puntuales en una escala, ejemplo: No. de unidades producidas, No. de quintales transportados, etc. CONTINUA: Son aquellas que pueden tomar cualquier valor real en una escala, por ejemplo:Temperatura, peso, longitud, etc.

Tipos de Datos Las Variables pueden ser medidas en cuatro escalas diferentes Es escencial que sea capaz de identificar las cuatro diferentes escalas de medición y ejemplos de cada una

1 Escala Nominal de Medición Los datos son medidos al nivel nominal donde cada caso es clasificado en una de un numero discreto de categorías EG Color, Partido Politico, Genero, etc

2 Escala Ordinal de Medición Los datos son medidos en una escala ordinal si las categorías implican orden EG Rango Militar, Talla de ropa, etc La diferencia entre rangos es consistente en dirección, pero no en magnitud.

3 Escala de medición de Intervalo Si las diferencias entre los valores tienen significado, los datos son medidos en la escala de Intervalo. La temperatura es el mejor ejemplo

4 Escala de medición de Ratio (rata) Los datos medidos en una escala de ratio tienen diferencias que son significativas, y relativas a algun punto real de origen o cero. eg Peso, Altura, edad, etc Esta es la escala más común de medición.

Tipos de Datos (Cont.) Datos de tipo Ordinal, Intervalo y Ratio también se conocen como datos Cuantitativos Datos de tipo Nominal también son denominados datos Cualitativos

Dos tipos de Estadística Estadística Descriptiva métodos de resumir grandes cantidades de datos en una forma conveniente Estadística Inferencial Métodos para extraer conclusiones (hacer inferencias) respecto a las características de una población por ejemplo…….

POBLACION: Se le llama población o universo, al conjunto total de unidades de estudio que se desean investigar. MUESTRA: Es un subconjunto de una población. Se utiliza cuando la población es muy numerosa, infinita o muy difícil de examinar. MUESTRA ALEATORIA: Es cuando cada elemento tiene la misma oportunidad de ser escogido. Muestreo aleatorio estratificado: Muestreo aleatorio sistematico:

Poblaciones Un componente esencial de entender la ciencia de la estadística es entender estos términos La población consiste en el conjunto de todas las mediciones en que el investigador está interesado Un número que describe una población se denomina un parametro por ejemplo…………...

Muestras Una muestra es un subconjunto de datos de la población Un numero que describe una muestra es un estadístico por ejemplo…………...

Inferencia Si tomamos una muestra y calculamos un estadístico, utilizamos ese estadístico para inferir algo respecto a la población de la cual la muestra fue extraída. EG: Comunmente, las muestras son utilizadas para inferir respecto a: Resultados de Elecciones Preferencias del consumidor Actitudes hacia aspectos sociales Se le ocurre algún otro ?????

CONTENIDO Estadistica Descriptiva Regresion y Correlacion Distribuciones Control Estadistico de Procesos

ESTADISTICA DESCRIPTIVA: Es la parte de la Estadística que trata solamente de describir y analizar un colectivo, sin sacar conclusiones o inferencias de un colectivo mayor, a partir de ella. La Estadística descriptiva incluye las técnicas que se relacionan con el resumen y la descripción de datos. Estos datos pueden ser representados en forma gráfica y pueden incluir análisis por computadora.

ESTADISTICA DESCRIPTIVA MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE DISPERSION MEDIDAS DE ORDEN MEDIDAS DE FORMA REPRESENTACION GRAFICA

MEDIDAS DE TENDENCIA CENTRAL MEDIA (ARITMETICA O PONDERADA) MODA MEDIANA

MEDIDAS DE DISPERSIÓN Rango Desviacion Media Varianza Desviación Típica o standard

MEDIDAS DE ORDEN Cuartiles Deciles Percentiles

MEDIDAS DE FORMA Sesgo Curtosis Momentos

REPRESENTACION GRAFICA Histograma de frecuencias Diagrama de Pareto Ojiva de Frecuencias Acumuladas Diagrama de Pastel Diagrama de Cajas Diagrama de Tallos y Hojas

MEDIA ARITMETICA

EJEMPLO

MEDIA PONDERADA

EJEMPLO

Mediana Valor que divide la serie de datos en dos partes iguales. Si el numero de datos es impar, es el valor que está situado justo en medio. Si el número de datos es par, es el promedio aritmético de los dos datos de en medio.

EJEMPLO

Moda Es el valor que mas se repite en un conjunto de datos. Puede no existir o puede existir mas de uno.

EJEMPLO

EJEMPLO

EJEMPLO

EJEMPLO

RESULTADO DEL PROCESO DE LLENADO INDUSTRIAL DE REFRESCOS (en ml)

DATOS ORDENADOS

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE DISPERSION

CONSTRUCCION DE UNA TABLA DE FRECUENCIAS

TABLA DE FRECUENCIAS

HISTOGRAMA DE FRECUENCIAS

MEDIDAS DE ORDEN Son aquellas que nos permiten ubicar un dato de acuerdo a la posicion que ocupa dentro de la serie de datos. Nos permiten ordenar, clasificar y categorizar los datos. Tambien se conocen como fractilos porque dividen los datos en partes iguales.

FRACTILOS De acuerdo al numero de partes en que se dividan los datos los fractilos pueden ser: Cuartiles: si dividen a los datos en cuatro partes iguales. Deciles: si dividen a los datos en diez partes iguales. Percentiles o Centiles: si dividen a los datos en cien partes iguales.

FRACTILOS cont... Por ejemplo, los cuartiles dividen la distribucion de datos en cuatro partes iguales, cada una conteniendo el 25% de los datos. De lo anterior se deduce que, como se dijo anteriormente, si la mediana divide los datos en dos partes iguales, debe ser igual al cuartil 2, al decil 5 y al percentil 50.

FRACTILOS cont... Forma de calculo: D = # de partes en que vamos a dividir los datos (para cuartiles 4, para deciles 10, para percentiles 100). F = # del fractilo a calcular, es decir, si queremos calcular el tercer cuartil, F es igual a 3, si queremos calcular el sexto decil, F es igual a 6, etc. N = # de datos en la distribucion.

FRACTILES cont... Entonces, la posicion del fractilo esta dada por: F*N + (D-F) D Ejemplo: Para calcular el cuartil 3 de 50 datos: 3*50 + (4-3) 4 37.75, es decir que el tercer cuartil esta ubicado entre el dato 37 y el 38, a un 75% de la distancia entre ambos datos.

EJEMPLO Para continuar con el ejemplo de las dos maquinas llenadoras, vamos a calcular los cuartiles 1 y 3 para cada maquina, entonces: D = 4 N = 50 F = 1 y 3 1*50 + (4-1) 4 13.25 para el cuartil 1 3*50 + (4-3) 4 37.75 para el cuartil 3 Esto quiere decir que el cuartil 1 se encuentra entre el dato 13 y el 14 mientras que el cuartil 3 esta entre el dato 37 y 38.

OTRA MEDIDA DE DISPERSION El Rango Intercuartil es otra medida de dispersion utilizada para poder determinar el rango de valores en el que se encuentra el 50% de los datos, excluyendo el 50% que se encuentre en los extremos, es decir, 25% en el extremo superior y 25% en el extremo inferior.

RANGO INTERCUARTIL El rango intercuartil es la diferencia entre el cuartil 3 y el cuartil 1: RI = Q3 - Q1

EJEMPLO Para las maquinas llenadoras: Maquina 1: Maquina 2: 365.75 - 343.25 22.5 Maquina 2: 343 - 337 6

DIAGRAMA DE CAJAS Esta es una herramienta sumamente util para comparar distintos grupos de datos, ya que permite ver en una sola grafica, la tendencia central y la dispersion, asi como detectar datos atipicos o sospechosos.

EJEMPLO

PASOS PARA CONSTRUIR UN DIAGRAMA DE CAJAS Calcular los cuartiles 1,2 y 3. Graficar una linea para cada uno de los cuartiles. La caja queda definida por el rango intercuartil y la linea dentro de la caja identifica la mediana. Calcular el rango intercuartil (Q3 - Q1) al que se denomina RI. Calcular dos valores: Valor Adyacente Superior y Valor Adyacente Inferior (VAS y VAI).

Estos valores se calculan de la siguiente manera: VAS = Q3 + 1.5*RI VAI = Q1 - 1.5*RI Luego, encontrar en los datos dos valores: m y M tal que: m = max(Xi | Xi <= VAS) M = min(Xi | Xi >= VAI) Estos valores se grafican como los limites de los alambres que nos sirven para identificar datos atipicos del conjunto de datos.

EJEMPLO

PARETO: Forma de separar los pocos vitales de los muchos triviales, que significa en esencia analizar la causas y efectos que constituyen en el 80% de un problema y obviar el 20% que suelen ser causas triviales. Este enfatiza en la mayoría de los casos que pocas causas pueden ser provocadoras del 80% de efectos de un problema.

Ejemplo: Se presenta a continuación una tabla con las causas a las que se atribuye el bajo rendimiento de los alumnos en los programas de maestria que imparte FISICC. Construya un diagrama de pareto para identificar cuales son los principales problemas que afrontan los estudiantes.

APLICACIONES DE LAS MEDIDAS DE TENDENCIA CENTRAL Y DISPERSION ¿Cuál es la clase más homogénea? ¿En cuál espera que existan menos alumnos que pierdan la clase? ¿En cuál parece que hay más problemas? ¿Comparando las clases A,B y D, En cuál seguramente hay notas más altas?

Problema: Exámenes de curso ¿Cuál cree Ud. Que fue el examen más difícil? ¿Cuál cree Ud. Que fue el más fácil?

MEDIDAS DE FORMA Las medidas de forma sirven para darnos una idea respecto a la simetria y la agudez de la distribucion de los datos. Las medidas de forma mas importantes son: Sesgo Curtosis

SESGO Si el resultado es positivo esta sesgada a la derecha Si el resultado es negativo esta sesgada a la izquierda OTRAS FORMULAS: 3*(MEDIA - MEDIANA) SESGO= DESVIACION

Curtosis: También se le denomina grado de agudez, y es el grado de apuntamiento de una distribución. Existen 3 tipos: Normal o mesocurtica:Distribución no muy apuntalada ni achatada, o sea normal. Leptocurtica: Tiene apuntamiento. Platicúrtica: Más achatada que la Normal.

AGRUPACION DE DATOS: Rango= Dato mayor -Dato menor Número de clases (K) K= 1 + 3.3. Log N (usar entre 3 y 12 intervalos como máximo) Intervalos de clase (i) i= Rango/K Número de observaciones y número de celdas recomendado: De: 20 - 50 6 celdas De: 51 - 100 7 celdas De: 101 - 200 8 Celdas De: 201 - 500 9 Celdas De: 501 - 1000 10 celdas De: 1000 en adelante 11 a 15 celdas

MEDIANA Lri = Limite inferior de la celda donde esta la mediana n = Número total de observaciones Fa = Frecuencia acumulativa anterior a la celda donde esta la mediana FMe = Frecuencia de la celda de la mediana i = Ancho del intervalo de la celda.

MODA Lri = Limite inferior de la clase modal = Diferencia con la clase anterior = Diferencia con la clase posterior i = Ancho del intervalo de la celda.

Calculo de Medidas de Tendencia Central

Cálculo de la MODA Cálculo de la Mediana

EJEMPLO Con los datos del problema anterior, encuentre: a) varianza (s2), b) desviación típica (s), c) desviación estándar (s’), d) coeficiente de variación (V).

Ejemplos de uso de la Desviación típica, y Varianza

MOMENTOS Se utilizan para producir valores que sirven el cálculo de las medidas de asimetría y agudez. Existen de 3 clases: Con respecto del origen Con respecto a la media. Con respecto a cualquier punto.

Datos no agrupados: Respecto al origen Respecto a la media Con respecto a cualquier punto.

Datos agrupados:

Coeficiente de asimetría Dado en función del momento 3 + Asimetria positiva 0 Simétrica -Asimetria negativa.

METODO DE OCHO PASOS PARA RESOLVER PROBLEMAS “UNA PERSONA VALIENTE NO ES EL QUE NO TIENE MIEDO, SINO AQUEL QUE A PESAR DEL TEMOR LO SUPERA Y SE ENFRENTA A SUS PROBLEMAS”

Los problemas nunca se acaban Pero todo en la vida tiene solución y los problemas empresariales no son la excepción. Sin embargo, hay que saberlos tratar para que se resuelvan de manera efectiva y, de ser posible, para siempre. “Mil cortes en las hojas del árbol del mal equivalen a uno sólo en las raíces” Thoreau

¿Qué es un problema? SITUACIÓN EN DONDE EL RENDIMIENTO O COMPORTAMIENTO DE UN SISTEMA NO SA- TISFACE LAS EXPECTATIVAS. En general, podríamos decir que existe un problema cuando algo no ofrece el resultado que esperamos.

Los ocho pasos Definición del problema Acción momentánea Definición del origen Acción correctiva definitiva Comprobación Estandarización Documentación Conclusiones

1. Definición del problema A) El tiempo en que ocurre B) El tipo de problema C) El síntoma presentado D) Aspectos circunstanciales E) Incluir información que no pueda ser presentada en forma de datos (gráficas y diagramas) F) Considerar cuándo, cuánto, qué, quién, dónde, etcétera)

2. Acción momentánea Es la acción para solucionar el problema temporalmente y así garantizar que, a pesar de que el problema existe, éste no va a afectar al cliente. Busque una acción momentánea a realizar para cada problema mientras lo resuelve de forma definitiva.

3. Definición del origen del problema Definir dónde exactamente se originó un problema es la clave para encontrar la solución más acertada. A) Generar lluvia de ideas: Un mismo problema puede ser visualizado de muy distintas maneras por diferentes personas. Importante: Debe realizarse en un clima de amistad. Todas las ideas son importantes. B) Elaborar diagrama de causa-efecto (Ishikawa): Relación entre un problema o resultado y las causas que lo ocasionaron.

Construcción de un diagrama de causa-efecto 1) Definir el problema 2) Identificar las causas mayores ayudados por una lluvia de ideas. 3) Identificar las subcausas. 4) Ponderar las causas antes de evaluarlas 5) Evaluar las causas más probables 6) Tomar una solución.

Diagrama de causa-efecto R.R. H.H. EQUIPO LIDERAZGO DESUNION EQUIPO DE COMPUTO OPORTUNIDAD RESPONSABILIDAD IDENTIFICACION CON LA INSTITUCION TELEFONOS DESIGUALDAD CONFIANZA REL. INTERNAS ACTITUD COMUNICACIÓN INADECUADA CARGAS AUTORIDAD RIGIDA TRABAJO EXCESO DE PERSONAS DECISIONES TIEMPOS RIGIDEZ CLARIDAD VENTILACION PROCESOS ESPACIO INFORMACION DEFINICIÓN REDUCIDO OBJETIVOS FORMA DE TRANSMITIR DISPONIBILIDAD MEDIO AMBIENTE CLAROS METODOS

4. Acción correctiva definitiva A) Actividades a realizar B) Responsables C) Involucrados D) Tiempos E) Recursos 5. Comprobación A) Tiempo de revisión B) Frecuencia C) Responsable 6. Estandarización Los cambios deberán establecerse de manera formal para asegurar su correcta aplicación en adelante.

7. Documentación 8. Conclusiones Recopilar toda la información, hechos, decisiones, etcétera, que se llevaron a cabo desde que apareció el problema hasta su solución definitiva. 8. Conclusiones Aunque el problema resuelto sea el mismo, la experiencias de cada una de las personas es diferente; cada quien ve el problema desde su propia perspectiva. Compartir experiencias es una forma de aprendizaje muy enriquecedora.

Probabilidad: Posibilidad de que algo llegue a suceder Frecuencia de un evento dentro de un todo (población). P= (NA/N) Donde: NA= # de veces que ocurre el evento A N= # total de posibles resultados.

FORMULAS: P(AUB)= P(A) + P(B) , para sucesos mutuamente excluyentes (Si uno sucede es imposible que el otro se produzca). P(AUB)= P(A) + P(B) - P(A B) Para eventos no mutuamente excluyentes. Si A y B son eventos independientes: P(A B)= P(A)*P(B) Si los sucesos son dependientes: P(A B)= P(A)*P(B/A)

PERMUTACION: COMBINACION: Es una disposición ordenada de un conjunto de objetos. COMBINACION: Si la forma como se ordenan es irrelevante entonces se le llama combinación, (no importa el orden)

DISTRIBUCIONES DE PROBABILIDAD Y FRECUENCIA Experimento: En estadistica, se denomina experimento a cualquier actividad que se realice con el fin de comprobar una hipotesis. Evento: Es el resultado de un experimento.

Variables Aleatorias: Es aquella que toma valores diferentes como resultado de un experimento aleatorio TIPOS: DISCRETA: toma valores puntuales en una escala de medicion. CONTINUA: Puede tomar cualquier valor dentro de una escala de medicion o de valores. VALOR ESPERADO DE UNA VARIABLE ALEATORIA: Es un promedio pesado del valor de cada resultado posible multiplicado por la probabilidad de dicho resultado

DISTRIBUCIONES DE PROBABILIDADES: Están relacionadas con las distribuciones de frecuencias, generalmente se piensa como una distribución de frecuencia teórica cuando se habla de distribución de probabilidades. TIPOS: DISCRETAS: Cuando los datos y la variable toma números limitados de valores. CONTINUAS: Cuando los datos y la variable (toma valores en un rango a utilizar) y la población se puede decir que es muy grande (infinita) DISTRIBUCIONES DISCRETAS: Entre las funciones de distribución de probabilidades que más utilizamos están: HIPERGEOMETICA BINOMIAL POISSON

LA DISTRIBUCION BINOMIAL: HIPERGEOMETICA: Se utiliza cuando la muestra de la población es finita y se toma la muestra sin reemplazo Para fines de la carrera es muy poco utilizado. LA DISTRIBUCION BINOMIAL: Se utiliza en probabilidad discreta, cuyo número de elementos es infinito, es usada cuando tenemos atributos, ejemplo: aceptable, no aceptable, éxito o fracaso, falla o no falla, etc. Esta describe resultados de un proceso de Bernoulli (este proceso dice que las probabilidades solo pueden ser p= éxito, cara, etc q=1-p, lo contrario de p. La probabilidad de este evento permanece fijo respecto al tiempo. Los eventos son estadísticamente independientes.

Formula de la Binomial: P(Probabilidad de r éxitos en n ensayos)= p= probabilidad de tener éxito q= probabilidad de no tener éxito r= # de éxitos deseados n= # de intentos hechos.

DISTRIBUCION DE POISSON: Se utiliza en probabilidad discreta, se aplica a diversas situaciones que aplican la realización de observaciones por unidad de tiempo. Ejemplo contar el número de vehículos que llegan a una caseta de control, contar el número de máquinas descompuestas durante 1 día, distribución de llamadas telefónicas que llegan a un conmutador, la demanda de pacientes que necesitan servicios, etc. CARACTERISTICAS: Con el ejemplo del número de vehículos que pasan por una sola caja de una caseta de cobro, daremos las características: La media del número de vehículos que llegan por hora pico puede estimarse a partir de datos sobre tráfico que se tengan disponibles. Si dividimos la hora pico en períodos (intervalos) de un segundo cada uno, encontraremos las siguientes afirmaciones: A) La probabilidad de que exactamente un vehículo llegue a una caja por segundo es muy pequeño.

B) La probabilidad de que dos o más vehículos lleguen en un intervalo de un segundo es muy pequeña. C) El número de vehículos que llegan a un intervalo dado de un segundo es independiente de que dicho intervalo se presente en la hora pico. El número de llegadas en cualquier intervalo de un segundo no depende del número de llegadas en cualquier otro intervalo de un segundo. FORMULA: Donde: = Número medio de presentaciones por intervalos de tiempo. X= Valor de variable.

FUNCIONES CONTINUAS: La más utilizada es la Normal y es sobre la cual esta soportada muchas aplicaciones. Definimos: Donde: xi= Dato = Media

ANALISIS DE REGRESION Y CORRELACION El término regresión, se uso por primera vez como un concepto estadístico por Sir Francis Galton. Galton hizo un estudio que mostró que, la altura de los niños de los padres altos tiende a bajarse, o "regresar", hacia la altura media de la población. El designó la palabra "regresión" como el nombre del proceso general de predecir una variable (la altura de los niños), a partir de otra (la altura de los padres). Posteriormente, los estadísticos usaron el término regresión múltiple para describir el proceso mediante el cual se usan varias variables para predecir otra. En el análisis de regresión, se desarrollará una ecuación de estimación, es decir, una fórmula matemática que relaciona las variables conocidas con la variable desconocida

TIPOS DE RELACIONES DE CURVAS DE REGRESION Los análisis de regresión y correlación, están basados en la relación o asociación entre dos o más variables. La variable conocida es llamada variable independiente. La variable que se está tratando de predecir es la variable dependiente. REGRESION LINEAL La ecuación de la relación lineal es: Y = ao + a1X Donde ao & a1 son parámetros estadísticos que se deben calcular.

METODO DE MINIMOS CUADRADOS Consideremos los puntos representados por (X1,Y1), (X2,Y2), ..., (Xn,Yn). Para un valor de Xi, existirá una diferencia Di entre Yi y el valor que da la ecuación de ajuste. Cada diferencia Di, se conoce como desviación, error o residuo; la cual, puede ser positiva, negativa o cero. De todas las curvas de aproximación a una serie de datos puntuales, la curva que tiene la propiedad de que: D12 + D22 + ... + DN2 es mínimo se conoce como la mejor curva de ajuste. Así una recta con esta propiedad se llama recta de mínimos cuadrados y tiene la ecuación: Y = ao + a1X donde las constantes ao y a1 se determinan mediante el sistema de ecuaciones simultáneas: S Y = ao (N) + a1 (S X) S XY = ao (S X) + a1 (S X2) que son llamadas ecuaciones normales para la recta de mínimos cuadrados. Si se resuelve el sistema en forma general, entonces se obtienen las siguientes fórmulas:

Formulas para calcular los valores

CORRELACION CORRELACION LINEAL La correlación, es el grado de relación que existe entre las variables, y un análisis de correlación determina en que medida una ecuación lineal o de otro tipo describe o explica de una forma adecuada la relación entre las dos variables. Si todos los valores de las variables satisfacen exactamente una ecuación, se dice que las variables están correlacionadas perfectamente o que hay correlación perfecta entre ellas. Así las áreas "A" y los radios "r" de todos los círculos están correlacionados perfectamente, puesto que A = p * r2. Las variables altura y peso de los individuos muestran cierta correlación. CORRELACION LINEAL Consideremos el diagrama de dispersión de la figura 4.3, si "Y" tiende a incrementarse cuando "X" aumenta, como en (a), la correlación se dice positiva o correlación directa. Si "Y" tiende a disminuir cuando se incrementa "X", como en (b), la correlación se dice negativa o correlación inversa. Si no hay ninguna relación entre las variables, como en (c), se dice que no hay correlación entre ellas, es decir, no están correlacionadas.

COEFICIENTE DE CORRELACION LINEAL Si se supone una relación lineal entre las dos variables, el coeficiente de correlación se calcula como: Donde r esta en el rango entre -1 y 1, si r=1 se dice que es una buena correlación y si r=0, no hay correlación

COEFICIENTE DE DETERMINACION Al cuadrado del coeficiente de correlacion se le denomina “coeficiente de determinacion”. Aunque el mas utilizado es el coeficiente de correlacion, es el coeficiente de determinacion el que tiene un significado mas concreto. El coeficiente de determinacion representa la fraccion (o el porcentaje) de la variacion de “y” que es explicada por la variacion de “x”. Por ejemplo, si obtenemos un coeficiente de correlacion de 0.95 y lo elevamos al cuadrado obtenemos 0.9025, es decir que la variacion de la variable independiente (x) explica el 90.25% de la variacion de la variable dependiente (y). El otro 10% de la variacion de “y” es atribuible a otras causas que pueden incidir en dicha variable.

EJEMPLO Los siguientes datos son las mediciones de velocidad del aire y del coeficiente de evaporación de las gotitas de combustible en una turbina de propulsión. Velocidad del aire Coeficiente de evaporación X (cm/seg) Y (mm2/seg) 20 0.18 60 0.37 100 0.35 140 0.78 180 0.56 220 0.75 260 1.18 300 1.36 340 1.17 380 1.65 Encuentre: a) la ecuación de la recta de mínimos cuadrados, b) utilice la ecuación anterior, para estimar el coeficiente de evaporación de una gotita cuando la velocidad del aire es de 190 cm/seg, c) coeficiente de correlación.

SOLUCION: a) Recta de regresión "Y" sobre "X": X Y X2 Y2 XY 20 0.18 400 0.0324 3.6 60 0.37 3,600 0.1369 22.2 100 0.35 10,000 0.1225 35.0 140 0.78 19,600 0.6084 109.2 180 0.56 32,400 0.3136 100.8 220 0.75 48,400 0.5625 165.0 260 1.18 67,600 1.3924 306.8 300 1.36 90,000 1.8496 408.0 340 1.17 115,600 1.3689 397.8 380 1.65 144,400 2.7225 627.0 2,000 8.35 532,000 9.1097 2,175.4

N = 10 datos S X = 2,000 S X2 = 532,000 S Y = 8.35 S XY = 2,175.40 Sustituyendo en las ecuaciones normales: S Y = ao N + a1 S X S XY = ao S X + a1 S X2 8.35 = ao 10 + a1 2,000 (1) 2,175.40 = ao 2,000 + a1 532,000 (2) Resolviendo las ecuaciones (1) y (2) en forma simultánea tenemos: ao = 0.069 ; a1 = 0.0038, sustituyendo en Y = ao + a1 X, obtenemos la ecuación de la recta de regresión de "Y" sobre "X": Y = 0.069 + 0.0038 X (3) b) para X = 190 el coeficiente de evaporación será: Y = 0.069 + 0.0038(190) = 0.79 Y = 0.79 mm2/seg

c) el coeficiente de correlación es : Ö [10(532,000)-(2,000)2][10(9.1097) - (8.35)2] El valor del coeficiente de correlación nos indica: que la correlación es positiva, debido al signo del coeficiente, que la relación entre X & Y es bastante buena, ya que el coeficiente es bastante cercano a 1, en valor absoluto, cuando el coeficiente es bastante cercano a cero, se dice que no hay correlación entre las variables X & Y.

d) el coeficiente de determinacion es : r^2 = 0.95 ^ 2 = 0.9025 equivalente a 90.25% El valor del coeficiente de determinacion nos indica: Que podemos atribuir en un 90.25% la variacion de Y a la variacion de X y un 9.75% de la variacion es atribuible a otros factores que no fueron considerados en el modelo matematico. Cuando el porcentaje es bajo, digamos abajo del 80%, debemos escoger otra variable independiente o agregar una variable mas al modelo y realizar un analisis de regresion multiple.

CURVE EXPERT Es uno de tantos programas disponibles para realizar analisis de regresion y correlacion. Tiene la ventaja de tener predetermina-dos una gran cantidad de modelos, aparte de los que el usuario quiera definir. Es un Shareware que se encuentra disponible en internet.