UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN ESCUELA DE POSTGRADO

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

UNIVERSIDAD NACIONAL DE EDUCACIÓN Alma Máter del Magisterio Nacional
Intervalos de Confianza para la Media de la Población
MSP César Eduardo Luna Gurrola
ESTIMACION DE PARAMETRO
Tema 13. Inferencia estadística Principales conceptos. Muestreo
Estadística I. Finanzas Y Contabilidad
Demostración de Asociación
Las distribuciones binomial y normal.
MUESTREO (NAGA´s) BOLETÍN 5020
Descripción de los datos: medidas de ubicación
Descripción de los datos: medidas de dispersión
Medidas de Posición Central:
Métodos Cuantitativos Aplicados a Los Negocios.
Ejemplo Grafico.
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
Unidad de competencia II Estadística descriptiva:
Unidad de competencia II Estadística descriptiva:
ESTADISTICA INFERENCIAL
Capítulo 4 Otras medidas descriptivas
Capítulo 3 Descripción de datos, medidas de tendencia central
Pruebas de hipótesis.
Estadística Administrativa I
Contraste de Hipótesis
Bioestadística Distribución Normal
Capítulo 10 Test de Hipótesis.
Inferencia estadística
Curso de actualización en Ingeniería de calidad
Parámetros estadísticos
Binomial Poisson Hipergeométrico Modelos Discretos
FRANCISCO JAVIER RODRÍGUEZ
PRUEBAS DE HIPÓTESIS Mercedes de la Oliva.
La prueba U DE MANN-WHITNEY
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
puede o no ser verdadero, relativo a una o más poblaciones.
PRUEBAS DE HIPOTESIS HIPOTESIS
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Probabilidad. Utilizar información extraída de una muestra para elaborar conclusiones respecto de las características de una población, implica un riesgo.
ESTADÍSTICA INFERENCIAL I
Distribuciones muestrales Procedimientos de muestreo
Estadística Administrativa II Período pasos para probar hipótesis 1.
1 M. en C. Gal Vargas Neri. ESTADISTICA I CSH, Tema III TEMARIO.
Estadística Administrativa II
Control estadístico de Proceso
Clases 4 Pruebas de Hipótesis
Pronósticos, Series de Tiempo y Regresión
Unidad V: Estimación de
Gerenciamiento Técnico de Proyectos
UNIVERSIDAD DE GUAYAQUIL.
Capacidad de Proceso.
Inferencia Estadística
Capítulo 1. Conceptos básicos de la Estadística
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Pruebas de hipótesis.
Análisis de los Datos Cuantitativos
Aplicaciones Estadísticas a las Finanzas Clase 1
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
Alicia De Gyves López Licenciatura Tecnologías de la Información y Comunicación 3º. Cuatrimestre Estadística Descriptiva Distribuciones de Probabilidad.
MEDIDAS DE TENDENCIA CENTRAL
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
INFERENCIA ESTADÍSTICA
Distribuciones de Probabilidad Discretas Las distribuciones discretas que se tratarán son: 1.Binomial 2.Multinomial 3.Hipergeométrica 4.Hipergeométrica.
Aplicaciones Estadísticas a las Finanzas Clase 1
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
CAPACITACIÓN, INVESTIGACIÓN, ESTADÍSTICA Y MERCADEO
Estadística y probabilidad
PRUEBA DE SIGNIFICANCIA
Transcripción de la presentación:

UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN ESCUELA DE POSTGRADO MAESRTIRA EN CONTABILIDAD Y AUDITORIA Estadistica y Probabailidad Dr. Pelayo Delgado Tello Tacna - Perú

Medidas de Tendencia Central Para datos agrupados

FÓRMULAS PARA DATOS AGRUPADOS

FÓRMULA PARA DATOS AGRUPADOS a. MEDIA ARITMÉTICA población muestra

FÓRMULA PARA DATOS AGRUPADOS b. MEDIANA

FÓRMULA PARA DATOS AGRUPADOS c. MODA

EJERCICIO DE APLICACIÓN

Tabla N° 1 Los pesos en libras de una muestra de alumnos EJERCICIO DE APLICACIÓN PARA DATOS AGRUPADOS Los pesos en libras de una muestra de alumnos que ingresaron en el presente año a la Universidad se detalla en la siguiente tabla: Tabla N° 1 1. La Media Aritmética 2. La Mediana 3. La Moda Determinar e interpretar:

* Calculamos la marca de clase (yi) de cada intervalo EJERCICIO DE APLICACIÓN PARA DATOS AGRUPADOS DESARROLLO 1. MEDIA ARITMÉTICA * Calculamos la marca de clase (yi) de cada intervalo sumando el límite inferior con el límite superior de cada intervalo y lo dividimos entre dos. * Multiplicamos la frecuencia (ni) de cada intervalo por su marca de clase. * Efectuamos la suma del producto de la frecuencia de cada intervalo por su marca de clase (yi n i)

1. MEDIA ARITMÉTICA Tabla Nº 2 EJERCICIO DE APLICACIÓN PARA DATOS AGRUPADOS 1. MEDIA ARITMÉTICA A partir de la tabla anterior y los cálculos obtenidos elaboramos la siguiente tabla: Tabla Nº 2

INTERPRETACIÓN: De una muestra de 140 alumnos EJERCICIO DE APLICACIÓN PARA DATOS AGRUPADOS * Aplicamos la fórmula INTERPRETACIÓN: De una muestra de 140 alumnos ingresantes en el presente año a la Universidad y cuyos pesos fluctúan entre 90 y 159 libras, su media aritmética es de 120 libras.

EJERCICIO DE APLICACIÓN PARA DATOS AGRUPADOS 2. MEDIANA * A partir de la tabla Nº 1 elaboramos la columna de frecuencia acumulada para ubicar el intervalo de la mediana. Tabla Nº 3

* Ubicamos el lugar de la mediana EJERCICIO DE APLICACIÓN PARA DATOS AGRUPADOS * Ubicamos el lugar de la mediana * El lugar de la mediana es 70,5 es decir, se encuentra en el tercer intervalo entre 110 y 119 con una frecuencia de 49. * Determinamos el valor de la mediana.

INTERPRETACIÓN: De una muestra de 140 alumnos ingresantes en EJERCICIO DE APLICACIÓN PARA DATOS AGRUPADOS * Aplicamos la fórmula INTERPRETACIÓN: De una muestra de 140 alumnos ingresantes en el presente año a la Universidad y cuyos pesos fluctúan entre 90 y 159 libras su mediana es 118 libras, es decir, tenemos alumnos cuyos pesos están por debajo de la mediana hasta 90 y por encima de la mediana hasta 159.

EJERCICIO DE APLICACIÓN PARA DATOS AGRUPADOS 3. MODA * A partir de la Tabla Nº 1 ubicamos el intervalo que contiene la moda. * En la columna f ubicamos el valor más alto. En este caso se encuentra en el III intervalo de 110-119 con 49 estudiantes.

EJERCICIO DE APLICACIÓN PARA DATOS AGRUPADOS Aplicamos la fórmula: INTERPRETACIÓN: De una muestra de 140 alumnos ingresantes en el presente año a la Universidad y cuyos pesos fluctúan entre 90 y 159 libras su moda es 117 libras.

PRÁCTICA Las notas de estadística de dos muestras de alumnos en el sistema vigesimal son: Muestra A: 19-12-17-06-18-12-05-07 Muestra B: 15-12-10-14-09-12-11-13 Determinar interpretar y comparar: Media Mediana Moda

DESARROLLO 1. 2. 3. Ordenamos los datos: Muestra A: 05-06-07-12-12-17-18-19 Muestra B: 09-10-11-12-12-13-14-15 1. 2. 3.

Medidas de Dispersión

FÓRMULAS PARA DATOS NO AGRUPADOS

1. RANGO Rx = XM – Xm = Xmax – Xmin 2. DESVIACIÓN MEDIA población FÓRMULA PARA DATOS NO AGRUPADOS 1. RANGO Rx = XM – Xm = Xmax – Xmin 2. DESVIACIÓN MEDIA población muestra

FÓRMULA PARA DATOS NO AGRUPADOS 3. VARIANZA población muestra

4. DESVIACIÓN ESTÁNDAR O TÍPICA FÓRMULA PARA DATOS NO AGRUPADOS 4. DESVIACIÓN ESTÁNDAR O TÍPICA población muestra 5. COEFICIENTE DE VARIACIÓN

EJERCICIO DE APLICACIÓN

Durante 12 días de un mes determinado, una persona requirió de 35, 28, 25, 32, 42, 33, 29, 23, 27, 34, 37 y 39 minutos para trasladarse de su casa a la oficina. Determinar e interpretar: Rango Desviación Media Varianza Desviación Estándar Coeficiente de Variación

DESARROLLO a. Ordenamos los datos en forma ascendente xi=23-25-27-28-29-32-33-34-35-37-39-42 b. Calculamos la media:

Tiempo requerido en minutos para trasladarse de su casa a la oficina c. Elaboramos la Tabla Nº 1 Tabla Nº 1 Tiempo requerido en minutos para trasladarse de su casa a la oficina Día xi 1 23 -9 9 81 2 25 -7 7 49 3 27 -5 5 4 28 -4 16 29 -3 6 32 33 8 34 35 10 37 11 39 12 42 100 Total 384 56 368

Rango 4. Desviación Estándar 2. Desviación Media 5. Coeficiente de Variación 3. Varianza

FÓRMULAS PARA DATOS AGRUPADOS

1. RANGO 2. DESVIACIÓN MEDIA población muestra FÓRMULA PARA DATOS AGRUPADOS 1. RANGO 2. DESVIACIÓN MEDIA población muestra

FÓRMULA PARA DATOS AGRUPADOS 3. VARIANZA población muestra

4. DESVIACIÓN ESTÁNDAR O TÍPICA FÓRMULA PARA DATOS AGRUPADOS 4. DESVIACIÓN ESTÁNDAR O TÍPICA población muestra 5. COEFICIENTE DE VARIACIÓN

EJERCICIO DE APLICACIÓN

Puntuaciones de una prueba de coordinación física de un grupo de estudiantes que habían consumido la cantidad de alcohol límite legalmente permitida para conducir Intervalo f 50 - 59 3 60 – 69 8 70 – 79 5 80 – 89 90 - 99 1 Total 20 Determinar e interpretar: Rango por los tres métodos. Desviación Media Varianza Desviación Estándar Coeficiente de Variación

1. Rango por los tres métodos Intervalo f 50 - 59 3 60 – 69 8 70 – 79 5 80 – 89 90 - 99 1 Total 20

Calculo de la Media Aritmética 2. Desviación Media Calculo de la Media Aritmética Intervalo f x fx 50 – 59 3 54,5 163,5 60 – 69 8 64,5 516,0 70 – 79 5 74,5 373,5 80 – 89 84,5 253,5 90 – 99 1 94,5 Total 20 1400,0

Cálculo de la Desviación Media Intervalo f 50 – 59 3 46,5 60 – 69 8 44,0 70 – 79 5 22,5 80 – 89 43,5 90 – 99 1 24,5 Total 20 181,0

3. Varianza Intervalo fi 50 – 59 3 720,75 60 – 69 8 242,00 70 – 79 5 101,25 80 – 89 630,75 90 – 99 1 600,25 Total 20 2295,00

4. Desviación Estándar 5. Coeficiente de Variación

FIN DEL CAPITULO

CAPITULO II Análisis de Correlación Simple

ANÁLISIS DE CORRELACIÓN Es un indicador que mide la intensidad o la fuerza de la relación lineal entre dos variables cuantitativas “x” y “y”, que no depende de sus respectivas Escalas de medición .

COEFICIENTE DE CORRELACIÓN INTENSIDAD Y DIRECCIÓN Correlación Ninguna Correlación Negativa Correlación Positiva Perfecta Perfecta Correlación Correlación Correlación Correlación Correlación Correlación Negativa Negativa Negativa Positiva Positiva Positiva Intensa Moderada Débil Débil Moderada Intensa   -1.00 -0,50 0 0,50 1.00   Correlación negativa Correlación positiva Asociación Inversa Asociación Directa

FÓRMULAS DE CORRELACIÓN LINEAL SIMPLE

COEFICIENTE DE CORRELACIÓN DE PEARSON

COEFICIENTE DE DETERMINACIÓN r 2 =r * r COEFICIENTE DE NO DETERMINACIÓN 1- r 2

CORRELACIÓN DE RANGO DE SPEARMAN

EJERCICIO DE APLICACIÓN

Calificaciones para el ingreso a la Universidad de un grupo TABLA Nº 1 Calificaciones para el ingreso a la Universidad de un grupo de estudiantes en la prueba de razonamiento y de conocimientos. Estudiante X Prueba de razonamiento Y Prueba de conocimientos 1 19 88 2 17 70 3 14 65 4 13 62 5 11 57 6 9 44 7 8 39 28

DIAGRAMA N° 1

Coeficiente de Correlación Coeficiente de Determinación r 2 = 0,96 Coeficiente de No Determinación 1- r 2 = 0,04 Coeficiente de Spearman rs = 1

Prueba de razonamiento Prueba de conocimientos TABLA Nº 2 Calificaciones para el ingreso a la Universidad de un grupo de estudiantes en la prueba de razonamiento y de conocimientos. Estudiante X Prueba de razonamiento Y Prueba de conocimientos 1 19 28 2 17 39 3 14 44 4 13 57 5 11 62 6 9 65 7 8 70 88

DIAGRAMA N°2

Coeficiente de Correlación Coeficiente de Determinación r 2 = 0,96 Coeficiente de No Determinación 1- r 2 = 0,04 Coeficiente de Spearman rs = - 1

Prueba de razonamiento Prueba de conocimientos TABLA Nº 3 Calificaciones para el ingreso a la Universidad de un grupo de estudiantes en la prueba de razonamiento y de conocimientos. Estudiante X Prueba de razonamiento Y Prueba de conocimientos 1 19 28 2 17 39 3 14 88 4 13 70 5 11 65 6 9 62 7 8 57 44

DIAGRAMA N° 3

Coeficiente de Correlación Coeficiente de Determinación r 2 = 0,06 Coeficiente de No Determinación 1- r 2 = 0,94 Coeficiente de Spearman rs = - 0,17

Análisis de Regresión Simple

ANÁLISIS DE REGRESIÓN Es una metodología estadística para la modelización e investigación de la Relación Entre dos o más variables. Permite hacer un resumen de los datos y cuantificar la naturaleza y fuerza de la relación entre una variable dependiente o respuesta (y) y una o más variables Independientes o predictoras (x).

FÓRMULAS DE REGRESIÓN LINEAL SIMPLE

Ó

EJERCICIO DE APLICACIÓN

La SUNAT a través de su Dpto. de Fiscalización, ha diseñado en base a los años de experiencia como predicción de los ingresos mensuales y eligió al azar a cinco médicos considerando los años de experiencia de cada uno de ellos. Los resultados obtenidos se detallan en la Tabla N°4 Determinar e interpretar: Diagrama de Dispersión. La Ecuación de Regresión. Pronosticar el valor de para cada valor de “x”. 4. Trazar la Línea de Regresión.

AÑOS DE EXPERIENCIA E INGRESOS MENSUALES Ingresos Mensuales (S/.) TABLA N°4 AÑOS DE EXPERIENCIA E INGRESOS MENSUALES DE UN GRUPO DE MÉDICOS Médico Años de Experiencia x Ingresos Mensuales (S/.) Y 1 4 5 000 2 7 12 000 3 4 000 6 8 000 5 10 11 000

DIAGRAMA DE DISPERSIÓN

Ecuación de Regresión Médico X y xy x2 y2 1 4 5 20 16 25 2 7 12 84 49 144 3 9 6 8 48 36 64 10 11 110 100 121 Total 30 40 274 210 370

b = 1,133 a= 1,202 Por lo tanto la ecuación de regresión es: = a + bX = 1,202 +1,133(X)  

Pronosticar el valor de para cada valor de x”. 3 4.601 4 5,734 6 8,000 7 9,133 10 12,532

Trazar la Línea de Regresión

Análisis Combinatorio

1.   FACTORIAL DE UN NÚMERO ( n  ). Es el producto de todos los enteros positivos desde 1 hasta n inclusive. Se le representa por n! (se lee “n factorial”) :   n! = n (n -1) ( n- 2).... 3 x 2 x 1 = n ( n- 1)!   Por definición : 0! = 1   Ejemplo: Sean:   1! = 1   3! = 3 x 2 x 1 = 6   6! = 6 x 5 x 4 x 3 x 2 x 1 = 720  

2.   PERMUTACIÓN ( nPr ). Una permutación de n objetos diferentes tomados de r en r es una ordenación de r objetos entre los n dados. Es decir, la cantidad de maneras en que se pueden disponer en términos de orden:   FÓRMULA:

EJERCICIO DE APLICACIÓN: La Inmobiliaria Corredores Asociados acordó elegir dentro de su Directorio conformado por 10 miembros, los cargos de Presidente, Secretario y Tesorero. Determinar el número de diferentes arreglos de los 3 elegidos entre los 10 miembros del Directorio. DESARROLLO:

3. COMBINACIÓN ( nCr ). FÓRMULA: Se llama combinación de n elementos tomados de r en r, a los grupos que se pueden formar con esos elementos, tomados de r en r, tales que, dos grupos se consideran distintos únicamente cuando tienen algún elemento diferente. Por lo tanto, el interés de las combinaciones siempre se relacionan con el número de diferentes subgrupos que pueden formarse con n objetos. FÓRMULA:  

EJERCICIO DE APLICACIÓN: Supongamos que 3 miembros de la Inmobiliaria Corredores Asociados de un total de 10 miembros van a ser escogidos para ocupar los cargos de Presidente, Secretario y Tesorero. Determinar el número de grupos diferentes de 3 personas que pueden ser escogidas sin tener en cuenta los diferentes cargos en la que cada grupo podría ser escogido.  DESARROLLO:

Probabilidades

1. CONCEPTOS BÁSICOS 1.1. EXPERIMENTO 1.2. RESULTADO Acción sobre la cual vamos a realizar una medición u observación. Determinístico. No determinístico. 1.2. RESULTADO Toda posible consecuencia de realizar un experimento. 1.3. ESPACIO MUESTRAL - S Conjunto de todos los resultados posibles de un experimento. 1.4. EVENTO Es un subconjunto del espacio muestral.

2. PROBABILIDADES: DEFINICIÓN 3. ENFOQUES DE PROBABILIDAD Es la probabilidad de que realizado un experimento ocurran determinados resultados 3. ENFOQUES DE PROBABILIDAD 3.1. ENFOQUE CLÁSICO Todos los resultados posibles de realizar un experimento tienen la misma probabilidad de ocurrir.

EJERCICIO DE APLICACIÓN Hallar la probabilidad de obtener el numero 5 al lanzar un dado. Desarrollo

EJERCICIO DE APLICACIÓN 3.2. ENFOQUE DE FRECUENCIA RELATIVA Se basa en datos históricos y la validez depende del número de repeticiones y que se mantengan las mismas condiciones de la experimentación. EJERCICIO DE APLICACIÓN Se lanza 100 veces una moneda y se supone que se encuentra bien balanceada y simétrica. CLASES fi hi f Ideal CARA 52 0,52 0,50 SELLO 48 0,48 TOTAL 100 1,00

EJERCICIO DE APLICACIÓN 3.3. ENFOQUE SUBJETIVO Está basado en la experiencia y conocimiento que asigna el especialista subjetivamente. EJERCICIO DE APLICACIÓN La adquisición de un terreno en una zona residencial. La experiencia ha demostrado que se incrementa su valor en un 200% año a año con respecto a la tasa de interés bancario.

4. PROBABILIDAD DE EVENTOS EJERCICIO DE APLICACIÓN 4.1. PROBABILIDAD DE UN EVENTO AISLADO No tiene vinculación con otro evento. EJERCICIO DE APLICACIÓN Determinar la probabilidad de que de una baraja de naipes bien mezclada se extraiga el as de espadas.

4.2. PROBABILIDAD DE DOS O MÁS EVENTOS. 4.2.1. EVENTOS MUTUAMENTE EXCLUYENTES. Dos o más eventos son mutuamente excluyentes o disjuntos si no pueden ocurrir simultáneamente. La probabilidad del evento A ó B es: ) ( = Ç q P B A P A B ( ) È = +

EJERCICIO DE APLICACIÓN ¿Cuál es la probabilidad de extraer una dama o un rey de una baraja de naipes bien mezclada?.  DESARROLLO

EJERCICIO DE APLICACIÓN 4.2.2. EVENTOS NO EXCLUYENTES. Dos o más eventos no son excluyentes o conjuntos cuando es posible que ocurran ambos. P A B A y B ( ) Ç = + - EJERCICIO DE APLICACIÓN Sea A el evento de obtener un As y B el evento de obtener un corazón en una sola oportunidad de sacar una carta de la baraja. Determinar la probabilidad de sacar un As o un corazón o ambas en una sola oportunidad.

DESARROLLO

EJERCICIO DE APLICACIÓN 4.2.3. EVENTOS INDEPENDIENTES. Dos o más eventos son considerados independientes si los eventos en ningún modo se afectan uno al otro. P A y B A B ( ) = EJERCICIO DE APLICACIÓN Una ánfora contiene 4 bolas rojas y 3 bolas azules. Se extrae una bola de la ánfora y después se la reemplaza. Otra bola es extraída después del reemplazamiento. Determinar la probabilidad de que ambas extracciones sean bolas rojas.

DESARROLLO

4.2.4. EVENTOS DEPENDIENTES ) ( A P B Ç = ÷ ø ö ç è æ Si A y B están relacionados de tal manera que la ocurrencia de B depende de la ocurrencia de A , entonces A y B son denominados eventos dependientes y la probabilidad del evento B es llamado probabilidad condicional. P(B/A) = Probabilidad de ocurrencia del suceso B, dado que ocurre A. ) ( A P B Ç = ÷ ø ö ç è æ

EJERCICIO DE APLICACIÓN Una ánfora contiene 4 bolas rojas y 3 bolas azules. Se extrae una bola de la caja y no es regresada a la caja antes de sacar la segunda bola. Determinar la probabilidad de que ambas bolas sean rojas.  DESARROLLO

5. TABLA DE PROBABILIDAD CONJUNTA En la tabla de probabilidad conjunta considera: Primero: Todos los eventos posibles para una primera variable (observación) como encabezamiento de columnas. Segundo: Todos los eventos posibles para una segunda variable se encuentran como encabezamiento de filas. Tercero: El valor incluido en cada celda resultante es la probabilidad de cada ocurrencia conjunta.

EJERCICIO DE APLICACIÓN La tabla de contingencia siguiente describe a 200 estudiantes que trabajan de acuerdo al sexo y edad. Tabla Nº 1 H M Menos de 20 60 50 110 20 a más 80 10 90 TOTAL 140 200 SEXO EDAD Hallar la probabilidad de que al escoger una persona: 1. Sea un estudiante hombre menor de 20 años. 2. Sea un estudiante hombre de 20 años a más. 3. Sea un estudiante mujer menor de 20 años. 4. Sea un estudiante mujer de 20 años a más. 5. El estudiante escogido sea hombre. 6. El estudiante escogido sea mujer.

DESARROLLO A partir de la tabla Nº1 construimos la tabla Nº2 donde podemos apreciar las probabilidades de escoger un estudiante de acuerdo a sexo y edad. Tabla Nº 2 H M Menos de 20 0,30 0,25 0,55 20 a más 0,40 0,05 0,45 TOTAL 0,70 1,00 SEXO EDAD

EJERCICIO DE APLICACIÓN 6. PROBABILIDAD CONDICIONAL Sean A y B dos eventos tal que P(B)  0, la probabilidad condicional de que ocurra A dado que ha ocurrido B se define como: P A B é ë ê ù û ú = Ç ( ) EJERCICIO DE APLICACIÓN Para ocupar la plaza de Docente de una Universidad se presentan 25 candidatos. La comisión encargada de realizar la selección decide clasificar a los candidatos de acuerdo a la experiencia docente y a los grados académicos, como puede observarse en el siguiente cuadro:

Hallar la probabilidad de que al escoger una persona: Grado Académico Experiencia Con experiencia Docente 7 8 15 Sin experiencia Docente 6 4 10 Total 13 12 25 CON MAESTRÍA SIN MAESTRÍA TOTAL Hallar la probabilidad de que al escoger una persona: 1. Con experiencia docente. 2. Con maestría. 3. Con experiencia docente y como condición tenga grado de magíster. 4. Sin experiencia docente pero como condición tenga grado de 5. Con experiencia docente y como condición que no tenga el grado de magíster.

DESARROLLO

EJERCICIOS DE APLICACIÓN 7. REGLA DE LA MULTIPLICACIÓN. Sea A y B dos eventos cualesquiera; entonces:   Si: P(A  B) = P(B) . P(A/B) = P(A.B); cuando : P(B)  0 Si: P(A  B) = P(A) . P(B/A) = P(A.B) ; cuando: P(A)  0 EJERCICIOS DE APLICACIÓN 1. Una ánfora contiene 4 bolas rojas y 3 bolas azules; se extrae al azar sucesivamente dos bolas. Determinar la probabilidad que las dos resulten rojas. Considerar la extracción. 1.1. Sin reemplazamiento. 1.2. Con reemplazamiento.

DESARROLLO 1.1. Sin reemplazamiento: 1.2. Con reemplazamiento:

2. Una ánfora contiene 5 bolas verdes y 3 bolas amarillas; se extrae al azar sucesivamente dos bolas. Determinar la probabilidad de obtener una bola de cada color: 2.1. Sin reemplazamiento. 2.2. Con reemplazamiento. Sean los eventos A1 = La primer bola resultó verde. A2 = La segunda bola resultó verde. B1 = La primera bola resultó amarilla. B2 = La segunda bola resultó amarilla. E = Obtener una bola de cada color.

DESARROLLO 2.1. Sin reemplazamiento: 2.2. Con reemplazamiento:

8. TEOREMA DE PROBABILIDAD TOTAL Sean B1; B2;...; Bn una partición del espacio universal S, entonces para cualquier evento A en S se cumple que:

EJERCICIO DE APLICACIÓN Para la elección de Decano del Colegio de Ingenieros, se presenta la lista Nº1 con un 60% de adherentes y llevan como candidato a Lucas, la lista Nº2 con un 40% de adherentes llevan como candidato a René. Efectuada la elección, el 80% de adherentes de la lista Nº1 y el 10% de la lista Nº2 votaron por Lucas. El 20% de adherentes de la lista Nº1 y el 90% de la lista Nº2 votaron por René. Si se selecciona un votante al azar ¿Cuál es la probabilidad de que haya votado por René.?

DESARROLLO Sean los eventos: P(A) = El votante sea de la lista Nº1 P(B) = El votante sea de la lista Nº2 P(C) = El votante dio su voto por René.

9. TEOREMA DE BAYES Si A1; A2;...; An son n eventos mutuamente excluyentes, de los cuales al menos uno de los Ai (i = 1,2,... n) debe ocurrir, y sea B un evento cualesquiera del espacio muestral S , la Probabilidad condicional de la ocurrencia de Ai cuando el evento B ha ocurrido es:

EJERCICIOS DE APLICACIÓN 1. En un depósito hay 3000 cajas de plumas de las marcas A,B,C,D,E. De ellas hay 500 cajas de plumas deterioradas. Las cajas se distinguen de la manera siguiente: MARCA TOTAL DE CAJAS DEFECTUOSAS A 200 50 B 300 40 C 1000 D 800 80 E 700 30 Total 3000 500 Se elige en forma aleatoria una caja y se le encuentra defectuosa determinar la probabilidad de que la caja defectuosa sea de la marca A.

DESARROLLO

2. Tres máquinas A, B, y C producen respectivamente 50%, 30% y 20% del número total de artículos de una fábrica. Los porcentajes de los desperfectos de producción de éstas máquinas, son 3%, 4% y 5%. Si se selecciona al azar un artículo y resulta ser defectuoso. Hallar la probabilidad de que el artículo fue producido por la máquina A. DESARROLLO MAQUINA ARTÍCULOS PRODUCIDOS DEFECTUOSOS A 50% 3% B 30% 4% C 20% 5%

Distribución de Probabilidades

Distribución Binomial Es una distribución de probabilidad discreta donde la variable aleatoria considera únicamente dos valores, éxito y fracaso. La distribución binomial debe considerar: El número de ensayos es fijo y no muy grande. En cada ensayo sólo son posibles dos resultados mutuamente excluyentes, a los cuales se les denomina éxito o fracaso. Los resultados de la serie de ensayos constituyen eventos independientes. La probabilidad de éxito de cada ensayo permanece constante

FÓRMULA PROPIEDADES Donde: n número de pruebas o ensayos. x número de éxitos. p probabilidad de éxito. q probabilidad de fracaso. PROPIEDADES

EJERCICIOS DE APLICACIÓN Se lanza un dado 50 veces. Calcular: 1.1. La Media. 1.2. La Varianza. 1.3. La Desviación Estándar. SOLUCIÓN

DESARROLLO DATOS SOLUCIÓN La probabilidad de que un estudiante nuevo se gradúe es 0,4. Determinar la probabilidad de que de 5 estudiantes nuevos: 1. Uno se gradúe. 2. Al menos uno se gradúe. DESARROLLO DATOS n = 5 p = 0,4 q = 0,6 SOLUCIÓN 1. Uno se gradúe.

2. Al menos uno se gradúe.

2. La probabilidad de que los padres con cierto color de ojos azul café tengan un hijo con ojos azules es 0.25. Hallar la probabilidad de que de 6 hijos: 1. La mitad tengan ojos azules 2. Que menos de la mitad tengan ojos azules 3. Ninguno tenga ojos azules 4. Uno tenga ojos azules 5. Dos tengan ojos azules 6. Tres tengan ojos azules 5. Cuatro tengan ojos azules 6. Cinco tengan ojos azules 7. Seis tengan ojos azules

Solución MANUALMENTE CON FACTORIALES 0,13183594 0,131835938 0,131835938 Para x=0 0,17797852 0,96240234 Para x=1 0,35595703 0,17797852 0,177978516 Para x=2 0,29663086 0,35595703 0,355957031 Para x=3 0,13183594 0,29663086 0,296630859 0,96240234 0,13183594 0,131835938 0,03295898 0,032958984 0,00439453 0,004394531 0,00024414 0,000244141 1

2. DISTRIBUCIÓN DE POISSON Es una distribución de probabilidad discreta donde el número de ensayos es muy grande y la probabilidad de éxito es muy pequeña. La distribución de Poisson se acerca a la distribución Binomial y una regla práctica es utilizarla si n  20 y si p  0,05; si n  100, la aproximación es generalmente excelente a condición de que n*p  10.

FÓRMULA: P(x) Probabilidad de exactamente x ocurrencias. x Lambda ( número medio de ocurrencias por intervalo de tiempo) elevada a la potencia x. e-  2,71828 ( base del sistema de logaritmos naturales o neperianos), elevado a la potencia negativa de lambda. x ! x factorial

EJERCICIO DE APLICACIÓN Una empresa de Seguros, asegura 10 000 automóviles contra robos, la probabilidad de que un auto sea robado es de 0,0009. Determinar la probabilidad: 1. Se roben 2 autos. 2. Se roben tres autos. DESARROLLO DATOS n = 10 000 P = 0,0009  =   = n * p  = 10000 * 0,0009  = 9

SOLUCIÓN 1. Se roben dos autos. 2. Se roben tres autos.

3. DISTRIBUCIÓN NORMAL Es una distribución de probabilidad continua. Curva Normal o de Gauss

Podemos observar ciertas características importantes de una distribución normal de probabilidad: Presenta una forma de campana y la curva tiene un solo pico, por tanto, es unimodal. La media de una población distribuida normalmente se encuentra en el centro de su curva normal. La curva es simétrica con respecto a la perpendicular levantada en la media, la mediana y la moda de la distribución también se halla en el centro, por tanto, en una curva normal, la media, la mediana y la moda poseen el mismo valor. Los dos extremos de una distribución normal de probabilidad se extiende de manera indefinida y nunca tocan el eje horizontal.

Curva Normal o de Gauss -3 -2 -1 1 2 3 68,27 95,45 99,73 0,5  

El valor de Z o puntaje estandarizado se determina a partir: FÓRMULA: DONDE Z Número de Desviaciones Estándar de x respecto a la Media. X Valor de la Variable Aleatoria. Media Muestral de la Distribución de la Variable Aleatoria S Desviación Estándar Muestral.

EJERCICIO DE APLICACIÓN Los depósitos en dólares en la Financiera Cono Sur, tienen una media de $ 25 000,00 y una desviación estándar de $ 3 000,00. Suponiendo que los depósitos se distribuyen normalmente, determinar la probabilidad: 1. Sean mayores a $ 28 000,00. 2. Se encuentren entre $ 23 500,00 y $ 28 000,00. DESARROLLO 1. Sean mayores de $ 28 000,00. 1.1. Se gráfica la curva normal estandarizada y se sombrea el área que corresponde a la probabilidad que se desea determinar.

1.2. Se calcula Z a partir de la fórmula:

1.3. En la tabla de Distribución Normal Estándar se ubica el valor de Z = 1,0. Este valor corresponde al área 0,3413. 0,3413 0,1587 P(Z 28 000) = 0,5 – 0,3413 P(Z 28 000) = 0,1587

2. Se encuentra entre $ 23 500,00 y $ 28 000,00 2.1. Se gráfica la curva normal estandarizada y se sombrea el área que corresponde a las probabilidades que se desea determinar.

2.2. Se calcula Z a partir de la fórmula:

2.3. En la Tabla de Distribución Normal Estándar se ubica los valores: Z = 0,5  área = 0,1915 Z = 1,0  área = 0,3413 Por tanto: 0,1915 0,3413 P(23 500  Z  28000) = 0,5328

Métodos de Muestreo

MÉTODOS DE MUESTREO NO PROBABILISTICO PROBABILISTICO CONVENIENCIA SIMPLE JUICIO SISTEMÁTICO CUOTAS ESTRATIFICADO ACCIDENTAL CONGLOMERADO

Pruebas de Hipótesis

Los métodos de Inferencia Estadística se han unificado bajo los conceptos generales de la “Teoría de la Decisión” es decir, bajo los conceptos generales de la manera de tomar decisiones en condiciones de incertidumbre.   En la investigación experimental o en la misma aplicación de la Estadística no nos interesa tanto el verdadero valor del parámetro, en cambio, nos interesa más averiguar si el parámetro excede o es menor a un número dado; o si cae en un intervalo, esto quiere decir que debemos “decidir”: cuando una afirmación (hipótesis) referida a un parámetro es “verdadera” o es “falsa”. Las pruebas de hipótesis comienzan con una suposición que hacemos en torno a un parámetro de la población.

1. CLASES DE HIPÓTESIS. 1.1. HIPÓTESIS ESTADÍSTICA. Son los enunciados provisionales referentes a una o a dos características de una población. Para tomar las decisiones, se contrastan las dos hipótesis: nula y alternativa.  1.2. HIPÓTESIS NULA (H0). Enunciado que indica que las medidas promedios de dos procesos son iguales o que no existe diferencia significativa entre las mismas. Es la que se prueba siempre y se refiere a un valor especifico del parámetro de la población (x,x) no a una muestra estadística . 1.3. HIPÓTESIS ALTERNATIVA (H1). Es todo enunciado opuesto al enunciado de la hipótesis nula. Representa una conclusión para la cual se busca una evidencia. La hipótesis alternativa (H1) por lo general es la negación de la hipótesis nula (H0), representa la conclusión que se obtendría si hubiera evidencia de culpa.

2. ERROR DE TIPO I () Y ERROR DE TIPO II ().   Al utilizar una muestra para obtener conclusiones sobre una población existe el riesgo de llegar a una conclusión incorrecta. Cuando se toma una decisión referente a una hipótesis basada en la teoría de la probabilidad, ésta puede ser: Decisión Correcta: ·    Se acepta una hipótesis cuando es verdadera. ·   Se rechaza una hipótesis cuando no es verdadera. Decisión Incorrecta: ·  Error Tipo I (). Se rechaza un hipótesis que es verdadera, es decir, se rechaza la Hipótesis Nula (H0) cuando en realidad es cierta y por lo tanto deberíamos aceptarla. · Error Tipo II (). Se acepta una hipótesis que no es verdadera, es decir, no se rechaza la Hipótesis Nula (H0) cuando es falsa y por lo tanto se debiera rechazar.

H es (V) es (F) Para mayor claridad observamos el siguiente cuadro: Decisión Condición ACEPTAR RECHAZAR H es (V) es (F) Decisión Correcta 1 -  Error de Tipo I  Error de Tipo II  1 -  De estos dos errores es más frecuente es el , pero el más difícil de controlar; de ahí que el más usado en la práctica es el .

3. REGIÓN CRÍTICA O DE RECHAZO.   Si la medida del resultado del proceso de una muestra es mayor o igual que un valor fijado (Valor Crítico), entonces se rechaza la hipótesis nula (H0); como también se rechaza en el caso que la medida menor que un valor fijado. La zona de rechazo para la hipótesis nula a un nivel  le determina la hipótesis alternativa. REGIÓN DE ACEPTACIÓN RECHAZO

4. NIVEL DE SIGNIFICACIÓN ().   Es la máxima probabilidad de cometer un error de Tipo I especificado en una prueba de hipótesis. El nivel de significación debe ser especificado antes de que una prueba sea hecha, de otra manera, el resultado obtenido en la prueba puede influir en la decisión. Los niveles de significación más utilizados son:  = 0,05 y  = 0,01 Al emplear un nivel de significación del 5% tenemos la confianza del 95% de que hemos tomado una decisión correcta, aunque pudimos estar equivocados en un 5%. El error de Tipo II () se puede determinar solamente respecto a un valor específico incluido en el rango de la Hipótesis Alternativa (H1).

5. ETAPAS BÁSICAS EN LA PRUEBA DE HIPÓTESIS.   Plantear la Hipótesis Nula y la Hipótesis Alternativa. Nivel de Significación. Seleccionar el Estadístico de Prueba. Cálculo del Estadístico de Prueba. Regla de Decisión. Toma de Decisión.

EJERCICIOS DE APLICACIÓN 1. La Gerencia de Finanzas y Marketing de una Compañía de Seguros por informes históricos recibidos, revela que las demandas por accidente tiene un costo promedio de $ 60,00 para los trámites por siniestro. Esta gerencia considera que los gastos son excesivos y se implementa medidas que permitan bajar los costos. Se selecciona aleatoriamente 26 demandas recientes y se realiza el estudio respectivo sobre los costos efectuados. Los resultados obtenidos fue una media muestral de $ 57,00 y una desviación estandar muestral de $ 10,00. Probar la hipótesis planteada por la Gerencia de Finanzas y Marketing: 1.1.  = 0,01 1.2.  = 0,1

DESARROLLO  1.1.  = 0,01 1 Plantear las Hipótesis: H0 :  = $ 60,00 H1 :   $ 60,00 La prueba es de una cola ya que interesa a la Gerencia de Finanzas y Marketing si existe o no una reducción en los costos.   2 Nivel de Significación:  = 0,01 El valor crítico para prueba de una cola con  = 0,01 con n-1 es decir 25 grados de libertad es de –2,485.

3. Seleccionar el Estadístico de Prueba: 4 Cálculo del Estadístico de Prueba:

La H1 indica que se trata de una prueba de una cola. 5 Regla de Decisión: -2,485 - 1,53 Zona de Rechazo Ho Ho:  = $ 60,00 H1:  < $ 60,00 GL = 25 Zona de Aceptación La H1 indica que se trata de una prueba de una cola. = 0,01 ; GL: n-1 ósea 26 –1 = 25  -2,485 La tobs = -1,53 La regla de decisión es aceptar Ho si tobs no se encuentra en –2,485, caso contrario se acepta la H1.

6 Toma de Decisión:   Se acepta la Ho dado que tobs – 1,53 se encuentra en la zona de aceptación. Esto nos muestra que no hay reducción en el costo promedio por demandas de accidentes para = 0,01.

1.2.  = 0,1   1 Plantear las Hipótesis:  H0 :  = $ 60,00 H1 :   $ 60,00 La prueba es de una cola ya que interesa a la Gerencia de Finanzas y Marketing si existe o no una reducción en los costos. 2 Nivel de Significación:   = 0,1 El valor crítico para prueba de una cola con  = 0,1 con n-1 es decir 25 grados de libertad es de –1,316.

3. Seleccionar el Estadístico de Prueba: 4 Cálculo del Estadístico de Prueba:

La H1 indica que se trata de una prueba de una cola. 5 Regla de Decisión: Zona de Rechazo Ho Ho =  = $ 60,00 H1 =   $ 60,00 GL = 25 - 1,53 -1,316 Zona de Aceptación Ho La H1 indica que se trata de una prueba de una cola. = 0,1 ; GL: n-1 ósea 26 –1 = 25  -1,316 La tobs = -1,53 La regla de decisión es aceptar la Ho si tobs no se encuentra en –1,316, caso contrario se acepta la H1

6 Toma de Decisión: Se rechaza la Ho dado que tobs – 1,53 se encuentra en la zona de rechazo. Esto nos muestra que hay una reducción en el costo promedio por demandas de accidentes para = 0,1.

Contrastes Básados en el Estadístico Chi-Cuadrado

PRUEBA DE BONDAD DE AJUSTE EJERCICIO DE APLICACIÓN PRUEBA CHI CUADRADO  PRUEBA DE BONDAD DE AJUSTE EJERCICIO DE APLICACIÓN En cierta máquina Expendedora de Refrescos existen 4 canales que expiden el mismo tipo de bebida. Estamos interesados en averiguar si la elección de cualquiera de estos canales se hace de forma aleatoria o por el contrario existe algún tipo de preferencia en la selección de alguno de ellos por los consumidores. La siguiente tabla muestra el número de bebidas vendidas en cada uno de los 4 canales durante una semana. Contrastar la hipótesis de que los canales son seleccionados al azar a un nivel de significación del 5%. Canal Número de bebidas 1 13 2 22 3 18 4 17

SOLUCIÓN: Para realizar el contraste de Bondad de Ajuste debemos calcular las frecuencias esperadas de cada suceso bajo la hipótesis de uniformidad entre los valores. Si la selección del canal fuera aleatoria, todos los canales tendrían la misma probabilidad de selección y por lo tanto la frecuencia esperada de bebidas vendidas en cada uno de ellos debería ser aproximadamente la misma. Como se han vendido en total 70 refrescos, la frecuencia esperada en cada canal es

El estadístico del contraste sería: Zona de rechazo 2,3428 7,815

En la tabla buscamos para un nivel de significación del 5% para n – 1 grados de libertad, en este caso 4 – 1 = 3 grados de libertad, el valor en tablas es 7,815.   Puesto que el valor del estadístico chi cuadrado 2,3428 es menor que el valor crítico, no podemos rechazar la hipótesis de que los datos se ajustan a una distribución uniforme. Es decir, que los canales son seleccionados aleatoriamente entre los consumidores.

PRUEBA DE HOMOGENEIDAD EJEMPLO DE APLICACIÓN Estamos interesados en estudiar la fiabilidad de cierto componente informático con relación al distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes de cada uno de los 3 distribuidores que nos sirven el producto comprobando el número de defectuosos en cada lote. La siguiente tabla muestra el número de defectuosos en para cada uno de los distribuidores. Componentes Distribuidos 1 16 94 100 2 24 76 3 9 81 Total 49 251 300 Defectuosos Correctos

Componentes defectuosos Componentes correctos SOLUCIÓN: Debemos realizar un contraste de homogeneidad para concluir si entre los distribuidores existen diferencias de fiabilidad referente al mismo componente. Componentes defectuosos Componentes correctos

Componentes Distribuidos 1 16 (16,33) 94 (83,67) 100 2 24 (16,33) 76 (83,67) 3 9 (16,33) 81 (83,67) Total 49 251 300 Defectuosos Correctos Las frecuencias esperadas bajo homogeneidad son las representadas entre paréntesis. El estadístico del contraste será:

Zona de rechazo 5,991 8,9631 El valor del estadístico chi-cuadrado 8,9631 es mayor que el valor para el nivel de significación del 5%, por lo tanto debemos concluir que no existe homogeneidad y por lo tanto que hay diferencias entre los tres distribuidores. 2 0,05 (2) = 5,991

PRUEBA DE INDEPENDENCIA EJERCICIO DE APLICACIÓN Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes resultados: Depresión Deportista Si 38 9 47 No 31 22 53 Total 69 100 Sin Con Determinar si existe independencia entre la actividad del joven y su estado de ánimo a un nivel de significación del 5%.

Frecuencias esperadas sin depresión SOLUCIÓN:  Debemos primero calcular las frecuencias esperadas bajo el supuesto de independencia. Frecuencias esperadas sin depresión Frecuencias esperadas con depresión

La tabla de frecuencias esperadas sería: Depresión Deportista Si 32,43 14,57 47 No 36,57 16,43 53 Total 69 31 100 Sin Con Calculamos ahora el estadístico del contraste:

3,841 5,8228 Zona de rechazo Este valor debemos compararlo con el percentil de la distribución 2 con (2-1)(2-1)=1 grado de libertad. 2 0,95(1) = 3,841   Por lo tanto como el valor del estadístico es superior al valor crítico, concluimos que debemos rechazar la hipótesis de independencia y por lo tanto asumir que existe relación entre la depresión y los hábitos deportistas del individuo.

F I N