La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

UNIDAD 1.

Presentaciones similares


Presentación del tema: "UNIDAD 1."— Transcripción de la presentación:

1 UNIDAD 1

2 LA ESTADISTICA DESCRIPTIVA

3 MAPA CONCEPTUAL DE LA UNIDAD

4 INFORMACION PARA TOMAR DECISIONES
POBLACION MUESTRA DATOS MEDIDA DESCRIPTIVAS TABLAS GRAFICOS INFORMACION PARA TOMAR DECISIONES

5 AL CONCLUIR ESTA UNIDAD, EL ALUMNO
OBJETIVOS AL CONCLUIR ESTA UNIDAD, EL ALUMNO SERA CAPAZ DE:

6 COMPRENDER LA RAZON POR LA QUE ESTUDIA ESTADISTICA.-
EXPLICAR LOS CONCEPTOS DE ESTADISTICA DESCRIPTIVA Y ESTADISTICA INFERENCIAL.- DINTINGUIR ENTRE UNA VARIABLE CUALITATIVA Y UNA VARIABLE CUANTITATIVA.- DESCRIBIR LA DIFERENCIA ENTRE VARIABLE DISCRETA Y VARIABLE CONTINUA.- DISTINGUIR ENTRE LOS NIVELES DE MEDICION , NOMINAL, ORDINAL, INTERVALAR Y DE RAZON.- ORGANIZAR LOS DATOS CUALITATIVOS EN UNA TABLA DE FRECUENCIAS.- REPRESENTAR UNA TABLA DE FRECUENCIA COMO UNA GRAFICA DE BARRAS Y GRAFICA DE PASTEL.-

7 ORGANIZAR DATOS CUANTITATIVOS EN UNA DISTRIBUCION DE FRECUENCIA.-
REPRESENTAR UNA DISTRIBUCION DE FRECUENCIAS DE DATOS CUANTITATIVOS POR MEDIO DE HISTOGRAMAS, POLIGONOS DE FRECUENCIA Y POLIGONOS DE FRECUENCIAS ACUMULADAS.- CALCULAR LA MEDIA ARITMETICA, LA MEDIA PONDERADA Y LA MEDIA GEOMETRICA.- EXPLICAR LAS CARACTERISTICAS, USOS, VENTAJAS Y DESVENTAJAS DE CADA MEDIDA DE UBICACIÓN.- IDENTIFICAR LA POSICION DE LA MEDIA, LA MEDIANA Y EL MODO PARA LAS DISTRIBUCIONES SIMETRICAS Y SESGADAS.- CALCULAR E INTERPRETAR EL RANGO, LA VARIANCIA Y EL DESVIO ESTANDAR.-

8 COMPRENDER LAS CARACTERISTICAS, USOS, VENTAJAS Y DESVENTAJAS DE CADA MEDIDA DE DISPERSION.-
COMPRENDER SOBRE EL TEOREMA DE CHEBYSHEV Y LA REGLA EMPIRICA EN RELACION CON UN CONJUNTO DE OBSERVACIONES.- ELABORAR E INTERPRETAR UN DIAGRAMA DE PUNTOS.- CREAR E INTERPRETAR UN GRAFICO DE TALLO Y HOJAS.- CALCULAR Y COMPRENDER LOS CUARTLES, DECILES Y PERCENTILES.- CONSTRUIR E INTERPRETAR DIAGRAMAS DE CAJA.- CALCULAR Y ENTENDER EL COEFICIENTE DE SESGO.-

9 TRAZAR E INTERPRETAR UN DIAGRAMA DE DISPERSION.-
CONSTRUIR, ANALIZAR E INTERPRETAR UNA TABLA DE CONTINGENCIA.-

10 ECONOMÍA, ADMINISTRACIÓN
APLICACIONES DE LA ESTADISTICA EN EL ÁREA DE LA ECONOMÍA, ADMINISTRACIÓN Y LA EMPRESA EN GENERAL

11 Con lo que vamos a ver en esta cátedra, observaremos como las técnicas estadísticas pueden servir al administrador, economista y empresario para obtener un conocimiento amplio sobre su realidad económica y social.- Es obvio que toda persona que se dedique al mundo de los negocios (industria, empresa, comercio, etc) necesita información sobre las características del ambiente y medio en que realiza su actividad.- Cualquier información, ya sea de tipo cualitativo o cuantitativo, debidamente tratada, puede servir para el estudio de la economía en general y para el conocimiento, desarrollo y control de los principales subsistemas funcionales de la empresa, entre los que podemos mencionar, recursos humanos, marketing, producción, finanzas, etc.- Si analizamos algunos de estos subsistemas es posible encontrar ejemplos en los que la Estadística puede constituir un auténtico elemento de ayuda.-

12 RECURSOS HUMANOS Para la selección del personal los administradores, empresarios etc, suelen usar cada vez con más frecuencia, además de los juicios subjetivos obtenido en las entrevistas a los candidatos, los resultados obtenidos en tests de aptitudes y conocimientos deseables en la persona a contratar.- Las técnicas descriptivas son instrumentos adecuados para el tratamiento de las puntuaciones numéricas alcanzadas en dichos tests.-

13 MARQUETING Los estudios de mercado
dirigidos al conocimiento de la demanda de productos, productos competidores, efectos de campañas publicitarias, etc, se llevan a cabo con regularidad en la empresa y el comercio.- Antes de sacar un producto al mercado se suele realizar una investigación al respecto mediante muestreo con objeto de obtener alguna información.-Las técnicas estadísticas permiten en estas situaciones inferir valores de parámetros poblacionales a partir de información muestral.- Por supuesto, a partir de una muestra no se puede conocer con exactitud y precisión las características de toda la población; siempre habrá un grado de incertidumbre sobre el verdadero valor poblacional; la cual puede ser cuantificada en cierta medida en términos de probabilidad.-

14 FINANZAS El conocimiento de las fuentes de financiación y los movimientos de los tipos de interés son esenciales para que un comercio, empresa decida si se somete a algún tipo de endeudamiento en un momento dado.- Así, las decisiones de inversión en nuevos productos, locales, maquinarias, etc, vendrán condicionadas por los precios esperados del dinero.- Para ello son de gran utilidad las técnicas de predicción, que constituyen una auténtica necesidad en el mundo de los negocios. En toda empresa suele ser necesario el conocimiento del volumen y precios de acciones, obligaciones, futuros y productos derivados de los mercados de valores, tanto si la empresa cotiza en Bolsa como si se posee una Cartera de Valores.-

15 Cualquier inversor que haya de decidir como equilibrar su Cartera de Valores debe hacer un análisis de inversiones para seleccionar entre los distintos productos financieros ofertados por el mercado de valores, y ha de tomar sus decisiones cuando aún desconoce los movimientos futuros del mercado, aunque pueda tener alguna información al respecto.- Las técnicas estadística pueden ayudar en dicha tarea e incluso cuantificar el grado de incertidumbre de sus operaciones.-

16 CONTABILIDAD.- Las empresas de contaduría pública emplean procedimientos estadístico de muestreo para llevar a cabo auditorias a sus clientes.- Por ejemplo, suponga que una empresa de Contadores desea determinar la cantidad que aparece en las cuentas por cobrar en el balance de un cliente, representa fielmente la cantidad real de ese rubro.- Usualmente, la cantidad de cuentas individuales por cobrar es tan grande que sería demasiado lento y costoso revisar y validar cada cuenta.- En casos como éste, regularmente se acostumbra que el personal del auditor seleccione un subconjunto de las cuentas llamado muestra.- Después de revisar la exactitud de las cuentas muestreadas, los auditores llegan a una conclusión acerca de si la cantidad que aparece en cuentas por cobrar, en los estados financieros de su cliente, es aceptable.-

17 PRODUCCION En el proceso de fabricación de
un producto Intervienen innumerables factores ( materias primas, maquinarias, obreros, etc) que afectan a las características de calidad de ese producto.- En muchas fábricas es corriente ver como los productos llegan a una cinta transportadora en cuyo final hay una máquina de empaquetar que los envía al almacén .- Entre la cinta transportadora y la máquina de empaquetar hay un obrero que observa atentamente los productos que llegan y ocasionalmente arroja algunos a un cesto cercano.- Está eliminando productos defectuosos.- Hoy en día el control de calidad de la producción es básico para que los artículos producidos cumplan los requisitos de calidad establecidos por las normas tantos nacionales como las internacionales.- los métodos estadísticos son una herramienta eficaz en esta área para mejorar los procesos de producción reducir sus defectos.-

18 Resulta evidente que cualquier profesional de la empresa, comercios, administración o los negocios debe adquirir una formación básica en estadística en su proceso de aprendizaje, que le permita moverse con soltura en el mundo que le rodea.- Si su objetivo va más allá del entendimiento y ha de tomar decisiones en un entorno de fluctuaciones y riesgo, no bastará con entender la terminología estadística.- Necesitará conocerla lo suficiente como para aplicarla y hacer de ella una herramienta realmente eficaz en el ejercicio de su actividad.- Considerando además, el desarrollo y uso generalizado que la informática ha tenido en los último años- Lo que facilita actualmente una gran disponibilidad tanto en lo que respecta a la capacidad de almacenamiento como en la rapidez en el cálculo y procesamiento de datos-, Podemos asegurar que con el empleo de las técnicas estadísticas, las posibilidades de utilizar la información de una manera adecuada y eficiente son casi infinita.-

19 ECONOMIA Con frecuencia se pide a los Economistas su
pronósticos acerca del futuro de la economía o de algunos de sus aspectos, por lo que recurren a información estadística diversa para elaborarlo.- Así, para pronosticar las tasas de inflación usan indicadores como índices de precios del productor, la tasa de desempleo y la ocupación de la capacidad de producción.- Muchas veces, esos indicadores estadísticos se introducen en modelos computarizados de pronósticos, cuyo resultado son predicciones sobre las tasas de inflación.-

20 LAS APLICACIONES DE LA ESTADISTICA EN SITUACIONES
COMO LAS MOSTRADAS Y OTRAS, SON PARTE DE LO QUE VEREMOS EN ESTA CATEDRA

21 TRATEMOS DE DAR UNA DEFINICIÓN DE ESTADISTICA

22 SEGÚN EL AUTOR QUE TOMEMOS COMO BIBLIOGRAFIA, NOS ENCONTRAREMOS CON MUCHAS DEFINICIONES DE ESTADISTICA.-

23 Moore D. S., dice: La estadística es la ciencia que trata sobre la obtención de información a partir de datos numéricos …… Para la mayoría de las personas que utilizan la estadística e incluso para muchos estadísticos profesionales, la estadística es la disciplina que proporciona instrumentos e ideas que permite utilizar datos numéricos para profundizar en la comprensión de distintos temas.- A pesar de que la estadística se fundamenta en una sólida base matemática, nuestro interés se centra en la estadística aplicada, que se puede dividir en tres campos de estudio: la obtención de datos, el análisis de datos, y la inferencia estadística.-

24 Anderson, Sweeney y Williams, dice:
En un sentido amplio, la estadística es el arte y la ciencia de reunir, analizar, presentar e interpretar datos.- Especialmente en los negocios y la economía, una razón básica para esa recopilación e interpretación de datos, es proporcionar a los administradores y a quienes toman decisiones, una mejor comprensión del entorno para permitirles tomar las mejores decisiones.-

25 Según Jack Levin y William C. Levin, definen a la ESTADISTICA como
“ Un conjunto de técnicas para tomar decisiones que ayuden a los investigadores a hacer inferencias de la muestra a la población y, en consecuencia a comprobar hipótesis relativas a la naturaleza de la realidad social”.-

26 En realidad, es una palabra que tiene tres acepciones diferentes:
Es una palabra que encontramos y usamos frecuentemente en nuestro lenguaje cotidiano.- En realidad, es una palabra que tiene tres acepciones diferentes:

27 Primera Acepción Segunda Acepción
No es más que una colección de datos ordenados y clasificados según un criterio (*) Segunda Acepción Es la ciencia, que con ayuda del calculo de probabilidades estudia las leyes del comportamiento de aquellos fenómenos que dependen del azar.- (**)

28 (*) En este sentido se la tomo en la antigüedad.- Cuando las sociedades primitivas se organizaron y superaron su ámbito local, se vieron en la necesidad de tener que tomar decisiones que exigían un conocimiento numérico de los recursos disponibles.- Esta necesidad dio lugar a la utilización y desarrollo de las primeras técnicas estadísticas basadas en un principio, exclusivamente, en el recuento y presentación de datos.- La Historia nos muestra que las primeras estadísticas fueron realizadas con efectos recaudatorios en la mayoría de los casos, por los gobernantes de las grandes civilizaciones antiguas, para conseguir conocer el número de bienes que poseía el Estado y como estaban repartidos entre la población.-

29 La utilización de estas técnicas, en su comienzos, exclusivamente por el Estado hace que esta propia palabra sea la raíz del término Estadística.- El primer dato que se dispone de la elaboración de una estadística nos la proporciona Heródoto que señala como en el año 3050 a de C, se efectuó un recuento de las riquezas y de la población de Egipto, cuya finalidad era conocer los recursos humanos y económicos disponibles para construir las pirámides.- En el año 2238 a de C, se realiza una estadística industrial y comercial por el emperador Yao de China, según cita de Chu King en el libro de Confucio.- En el año 1400 a de C, Ramses II realizó un censo de las tierras de Egipto a fin de efectuar un nuevo reparto.-

30 Moisés en el año 1400 a de C, según aparece en el Pentateuco, y David en el 1018 a de C. según aparece en el Libro de Los Reyes, realizaron sendos censos para conocer que número de guerreros disponían las tribus de Israel.- Los griegos realizaron diversos censos con fines tributarios, reparto de tierras, así como disponibilidad de recursos y guerreros para sus campañas.- En época romana de contabilizaban, al menos, la realización de 69 censos con diversos fines; tributarios, número de hombres con derecho al voto, y posibilidades para la realización de sus campañas militares.- Desde la caída del imperio romano pasa prácticamente un milenio sin que se conozca ninguna estadística importante, salvo las recopilaciones realizadas por Pepino el Breve en el año758 y por Carlomagno en el 762 sobre las tierras propiedad de la Iglesia.-

31 Durante el siglo IX se realizaron en Francia recuentos parciales de siervos.- Recuentos similares se realizaron en Inglaterra que fueron recopilados por Guillermo el Conquistador en 1086 y muy posteriormente en el siglo XIV, por Eduardo II.- Es con el nacimiento de las Naciones cuando la Estadística va adquiriendo un rigor científico en las técnicas de recogida y presentación de datos que van a facilitar el análisis de las conclusiones y por tanto, la toma de decisiones.- En 1540, Sebastián Munter, realizó una recopilación estadística de los recursos nacionales alemanes, en la que se incluía la organización política de la nación alemana, así como sus instituciones sociales, su comercio y su potencia militar.-

32 Estudios parecidos fueron realizados durante el siglo XVI en Italia y Francia.-
La estadística demográfica tiene un gran auge durante el siglo XVII.- La gran pregunta era saber si la población se modificaba, aumentando o disminuyendo o si éste era un parámetro estático.- Estos estudios dieron lugar a la creación de los índices de natalidad y mortalidad.-

33 (**) Durante el siglo XVII y principios del XVIII, se desarrolla la Teoría de las Probabilidades, teoría que proporciona a la Estadística métodos de investigación que la permiten alcanzar la categoría de ciencia.- El primer tratado sobre esta teoría fue escrita por Bernoulli en el que se dice que la regularidad que aparece en el orden social se debe a la probabilidad más que al designo sobrenatural.- Durante el siglo XVII son conocidos los trabajos realizados por Pascal y Farmat, sobre problemas de juegos de azar, que tuvieron sus antecedentes en algunos matemáticos del siglo XV como, Paccioli, Cardano, Tartaglia, Kepler y Galileo.- En este período también aparecen los grandes matemáticos con diversos métodos estadísticos.- Quetelet (1796 – 1874) aplicó la teoría de las probabilidades a las ciencias sociales, elaborando una

34 teoría determinista en las que las características de un hombre quedaría determinadas por su entorno social, con lo que se podría aplicar el principio de los promedios, pudiéndose hablar de un hombre medio.- A principio del siglo XIX, se desarrolla dos nuevas teorías matemáticas de gran influencia en la teoría estadística que son; la teoría de los errores de observación de laplace y Gauss y la teoría de los mínimos cuadrados desarrollada por los dos anteriores y Legendre.- Es a finales del siglo XIX cuando Sir Francis Galton desarrolla el método de la correlación, que tiene por objeto medir la influencia relativa de los factores sobre las variables.- De este modo partió el método de correlación creado por Klar Pearson.-

35 Los progresos más recientes en el campo de la estadística se refieren al cálculo de las probabilidades basado en el principio de indeterminismo, que supone que la uniformidad de la naturaleza debe considerase como una serie de posibles resultados procedentes de cualquier causa o causas dadas, más que de un único resultados exacto y preciso en cada caso.-

36 Tercera Acepción Es la ciencia que aporta las técnicas o métodos que se sigue para recoger, organizar, resumir, presentar, analizar, interpretar, generalizar y contrastar resultados de las observaciones de los fenómenos reales para ayudar a tomar decisiones más efectivas.-

37 Para pensar en términos estadísticos hay que seguir una serie de pasos que van desde la definición del problema hasta la toma de decisiones.- Una vez identificado y definido el problema, se recogen datos producidos mediante diversos procesos de acuerdo con un diseño y se analizan utilizando uno o mas métodos estadísticos.- De este análisis se obtiene información.- La información se convierte a su vez, en conocimiento, utilizando los resultados de las experiencias especificas, la teoría y la literatura y aplicando métodos estadísticos adicionales.- Para convertir los datos en un conocimiento que lleva a tomar mejores decisiones se utiliza tanto la estadística descriptiva como la inferencial.-

38 TIPOS DE ESTADISTICAS.-
Dependiente del propósito del estudio, la estadística puede ser Descriptiva o Deductiva e Inferencial o Inductiva.-

39 La Estadística Descriptiva comprende aquellos métodos gráficos y numéricos usados para recopilar, organizar y describir la información que se ha recogido con el fin de describir sus características.- La Estadística Inferencial comprende aquellos métodos y técnicas usadas para hacer generalizaciones, predicciones y estimaciones que se utilizan para transformar la información en conocimiento.-

40 Veamos un ejemplo de como actúa en parte la estadística descriptiva:
Producción diaria de una fabrica de cereales.- Un jefe de producción de cereales de Trigo formo un equipo de empleados para estudiar el proceso de producción de cereales.- Durante la primera fase del estudio se peso una selección aleatoria de cajas y se midió la densidad del producto.- A continuación, el jefe quería estudiar datos relacionados con las pautas de producción diaria.- Se hallaron los niveles de producción (en miles) de un periodo de 10 días.- Represente estos resultados gráficamente y comente sus observaciones: Día 1 2 3 4 5 6 7 8 9 10 Cajas (miles) 84 81 85 82 109 110 60 63

41 Solución En la figura, el jefe de producción puede identificar los días de baja producción, así como los días de mayor producción.- No parecería que hubiera mucha diferencia en el numero de cajas producidas en los seis primeros días.-

42 Sin embargo, en los días 7 y 8 el nivel de producción parecería que era mas alto.- En cambio, en los días 9 y 10 parecería que era mas bajo.- Basándose en estas observaciones, el equipo intento identificar las causas por las que la productividad era mas alta y mas baja.- Por ejemplo, tal vez en los días 9 y 10 estuvieron ausentes trabajadores clave o hubieran cambiado las materias primas.- También se podrían identificar las causas por las que aumento la productividad en los días 7 y 8.-

43 Respecto a la Estadística Inferencial, diremos:
La estadística inferencial es un proceso, no un mero resultado numérico.- Este proceso puede consistir en una estimación, una prueba de hipótesis, un análisis de relaciones o una predicción.- En primer lugar, podemos querer estimar un parámetro.- Supongamos que Florería Sicar SRL, quiere desarrollar una nueva estrategia de comercialización.- Podría ser útil la información sobre los hábitos de gasto de los clientes de la florería.- Puede querer: Estimar la edad media de los clientes de la florería.- Estimar la diferencia entre la cantidad media que los clientes pagan con Tarjeta American Express y la cantidad media que pagan con Visa.-

44 Estimar la proporción de clientes que están insatisfecho con el sistema de reparto de la florería.- Etc……. En segundo lugar, podemos querer probar una hipótesis sobre un parámetro.- Por ejemplo, la Florería Sicar puede querer: Probar la hipótesis si los clientes tienen este año una preferencia por el color de las rosas distintas a la del año pasado.- Probar la hipótesis si menos del 25 por ciento de los clientes de la florería son turistas.- Probar la hipótesis si las ventas son mayores los fines de semana que el resto de los días de la semana.- Probar la hipótesis si la cantidad media que gastaron los clientes es su ultima compra supero los 50$.-

45 Las respuestas a estas preguntas pueden ayudar a la Florería Sicar SRL a lanzar una campaña publicitaria que le permita reducir costos, incrementar beneficios y aumentar la satisfacción de los clientes.- En tercer lugar, podemos querer analizar las relaciones entre dos o mas variables.- El director financiero de la General Motors, quiere tomar decisiones estratégicas que afectan a toda la compañía.- En esos casos, puede utilizar series de datos macroeconómicos de los que puede disponerse en diversas publicaciones, para analizar las relaciones entre variables como el producto bruto interno, tipo de interés, la renta per capita, la inversión total y oferta monetaria, etc., que indican la situación general de la economía nacional.- El director financiero puede hacerse las siguientes preguntas:

46 ¿Influye la tasa de crecimiento de la oferta monetaria en la tasa de inflación?.-
Si General Motors sube un 5 por ciento el precio de los automóviles de tamaño intermedio, ¿Cómo afectara la subida a las ventas de estos automóviles?.- Afecta la legislación sobre el salario mínimo de desempleo?.- Etc.. ¿Cómo se comienza a responder a la pregunta sobre el efecto que puede producir una subida de los precios en la demanda de automóviles?.- La teoría económica básica nos dice que manteniéndose todo lo demás constante, una subida del precio va acompañada de una reducción de la cantidad demandada.- Sin embargo, esta teoría es puramente cualitativa.-

47 No nos dice cuanto disminuye la cantidad demandada
No nos dice cuanto disminuye la cantidad demandada.- Para avanzar mas, hay que recoger información sobre como ha respondido la demanda a las variaciones del precio en el pasado y evaluarla.- Estudiando estadística inferencial aprenderemos a recoger información y a analizar relaciones.- En cuarto lugar, podemos necesitar predecir, es decir, hacer predicciones confiables.- Las decisiones de inversión deben hacerse mucho antes de que pueda llevarse un nuevo producto al mercado y evidentemente, es deseable tener predicciones de la situación en la que se encontrara probablemente el mercado dentro de unos años.- Cuando los productos están consolidados, las predicciones sobre las ventas a corto plazo son importantes para decidir los niveles de existencias y los programas de producción.-

48 Las predicciones de los futuros tipos de interés son importantes para una empresa que tiene que decidir si emite o no nueva deuda.- Para formular una política económica coherente, el gobierno necesita predicciones de los resultados probables de variables como el producto bruto interno.- Las predicciones de los futuros valores dependen de las regularidades descubiertas en la conducta anterior de estas variables.- por lo tanto, se recogen datos sobre la conducta anterior de la variable que va a predecir y sobre la conducta de otra variable relacionadas con ella.- Utilizaremos la estadística inferencial para analizar esta información y sugerir entonces las tendencias futuras probables.-

49 EJERCICIOS PARA HACER EN CLASE
1.- Suponga que usted asesora al dueño de un Supermercado, Ponga un ejemplo de una pregunta que podría responderse utilizando la estadística descriptiva.- Ponga un ejemplo de una pregunta en la que seria útil estimar un parámetro.- Ponga un ejemplo de una pregunta sobre una posible relación entre dos variables que tienen interés para su Supermercado.- Ponga un ejemplo de una cuestión en la que hay que hacer una predicción.-

50 2.- Averigüe si debe utilizarse la estadística descriptiva o la inferencial para obtener la siguiente información: a) Un grafico que muestra el numero de botellas defectuosas producidas durante el turno de día a lo largo de una semana.- b) Un estimación del porcentaje de empleados que llegan tarde a trabajar.- c) Una indicación de la relación entre los años de experiencia de los empleados y la escala salarial..-

51 POBLACION Definición 1: El conjunto de personas, animales o cosas que son objeto de nuestro estudio.- Definición 2: es la que esta formada por la totalidad de las observaciones en las cuales se tiene cierto interés.- Elemento o Unidad Estadística: Son las personas, animales o cosas que forman la población.- Se simboliza con N

52 Tamaño Población finita: cuando el número de elementos que la forman es numerable, se puede contar, por ejemplo el número de alumnos de la universidad, cantidad de empleados de una fábrica, etc.- Población infinita: cuando el número de elementos que la forman es incontable o tan grande que puede considerarse infinito. Como por ejemplo, si se realizara un estudio estadístico sobre los productos que hay en el mercado, producción de un torno, etc.-

53 Ejemplos de poblaciones son:
Todos los estudiantes de una universidad.- Todos los votantes inscriptos en un paìs.- Todas las familias que viven en una ciudad.- Todas las acciones que se cotizan en una bolsa de valores.- Todas las reclamaciones que recibe en un año una compañía de seguros.- Todas las cuentas pendientes de cobro de un comercio.- Todas las boletas de ventas correspondientes a un año de un comercio que hay que auditar.- Etc……

54 ELEMENTOS O UNIDAD ESTADISTICA
Los elementos de una población poseen una serie de cualidades, propiedades o rasgos comunes que se denominan en estadística CARACTERES. ELEMENTOS O UNIDAD ESTADISTICA Por ejemplo: si tenemos un estudio sobre personal de la administración pública provincial, todos los empleados poseen una serie de características: Edad. Estado civil. Número de hijos. Nivel de instrucción alcanzado.- Antigüedad en el trabajo. Tarea que realiza.- Remuneración que recibe.- Etc

55 Los caracteres de los elemento de la población pueden ser:
CARACTERES CUALITATIVOS, ATRIBUTOS O VARIABLES CATEGÓRICAS, son aquellas que por su propia naturaleza no se pueden medir y se describen mediante palabras. Son producto de conteo.- Por ejemplo: el sexo, nacionalidad, raza, color de pelo, estado de ánimo, tipo de trabajo, ………….. etc.- Las variables categóricas tiene modalidades.- CARACTERES CUANTITATIVOS O VARIABLES NUMÉRICAS son aquellos que se pueden describir mediante número, es decir, que son susceptibles de cuantificación o de medición. Por ejemplo: puntajes de un test, edad, el peso, la altura, ingreso de una empresa, salario de una persona, minutos de demora en recorrer una distancia, tiempo en elaborar una determinada pieza de producción, etc.-

56 Dentro de los caracteres cuantitativos o variables numéricas pueden encontrarse dos clases de variables; variables discretas y variables continuas. Una variable estadística es DISCRETA si toma un número finito o infinito numerable de valores, o dicho de otra forma, si entre dos valores consecutivos puede tomar a lo sumo un número finito de valores. Por ejemplo: cantidad de hijos, cantidad de alumnos por grado, cantidad de obreros de una fábrica, cantidad de errores de ortografía en un dictado, cantidad de niños en edad escolar por hogares, cantidad de pacientes de un hospital, cantidad de productos producidos por una máquina, etc...-

57 Una variable estadística es CONTINUA si toma un número infinito de valores en un intervalo, o dicho de otra manera si entre dos valores consecutivos puede tomar cualquier otro. Por ejemplo: peso de alumnos, altura, producción de fábrica, salarios de médicos de un hospital, montos de ventas de un comercio, tiempo de armado de una determinada pieza para autos, metros de tela producidos por un telar, etc.-

58 DEFINICION OPERACIONAL Todas las variables deben tener una definición operacional, es decir, un significado universal aceptado que sea claro para todos aquellos que estén relacionados con el análisis.- La falta de las definiciones operacionales genera confusión.-

59 DE LA VARIABLE EN ESTUDIO
ESCALAS DE MEDICION DE LA VARIABLE EN ESTUDIO

60 Para el análisis de datos se debe estar familiarizado con que existen cuatro escalas numéricas de medida de las variables que estamos estudiando.- Cuanto más alta sea la jerarquía o posición que ocupe el tipo de datos en estas medidas más información contendrán.- NOMINAL DE INTERVALOS ORDINAL DE RAZON, COCIENTE O PROPORCION

61 Estas escalas tienen ciertas propiedades básicas:
Nominal o de clasificación Estas escalas tienen ciertas propiedades básicas: Entre los objetos clasificados existe una relación de equivalencia o no equivalencia.- Si se utilizan números, estos solo distinguen orden de posiciones de determinada categoría o clase, pero de ningún modo establecen relación numérica entre los objetos numerados.- Los objetos están clasificados u ordenados en relación a una igualdad o equivalencia de un aspecto o característica.- La escalas nominales o de clasificación consisten en clasificar objetos reales según cierta características, tipologías o nombres, dándoles una denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre esos objetos.-

62 Escala ordinal o de orden jerárquico
Las propiedades básicas de esta escala son: Entre los objetos ordenados existe la relación mayor, menor o igual y las relaciones lógicas de transitividad y asimetría.- La ordenación implica diferentes niveles de posición de un atributo: la utilización de números establece relaciones entre los objetos, pero no distancia entre los intervalos.- Con esta escala se establecen posiciones relativas de objetos o individuos en relación a una característica, sin que se reflejen distancias entre ellos.- Hay un sentido de mayor(>) menor (<).-

63 Escala de intervalos o de distancias iguales
Podemos señalar las siguientes características esenciales de este tipo de escala: Entre los objetos y ordenados existe una relación de mayor, igual o menor.- La escala se presenta bajo una forma cuantitativa.- La utilización de números indica relaciones entre los objetos y distancia entre los intervalos, que cuando son numéricamente iguales representan distancias también iguales en el atributo medido: así por ejemplo la distancia entre 10 y 20 es la misma que entre 82 y 92.- El punto cero de la escala es arbitrario y convencional, por ello no indica ausencia de lo que estamos midiendo.- Representan un nivel de medición más preciso que las anteriores; no solo se establece un orden en las posiciones relativas de los objetos o individuos sino que se mide también la distancia entre los intervalos o las diferentes categorías.-

64 Escala de razones o de cocientes
La caracterizaremos del siguiente modo: Entre los objetos ordenados existe un orden jerárquico, igualdad de intervalos y por último igualdad de razón, proporción.- Los número utilizados son números reales.- La serie de números reales tienen un origen llamado cero que por ser natural es inalterable.- Si una persona gana 200$ y otra gana 400$, decimos que la segunda gana el doble que la primera.- Esta es una escala que además de distinción, orden y distancia, permite establecer en que proporción es mayor una categoría de la escala que otra.- Tiene un cero absoluto o natural que representa la nulidad de lo que se estudia.-

65 EJERCICIOS PARA HACER EN CLASE
1.- Indique si cada una de las siguientes variables es categórica o numérica.- Si es categórica, indique el nivel de medición.- Si es numérica si es discreta o continua.- Numero de mensajes de correo electrónico enviados diariamente por un planificador financiero.- Costo efectivo de los libros de texto de un estudiante para un cuatrimestre.- Su factura mensual de electricidad.- Las clasificación de profesores universitarios según cargos.- Tiempo en minutos que demora usted en llegar a la universidad.- Ventas diarias del comercio donde trabaja.-

66 2.- En una facultad universitaria se ha repartido un cuestionario entre los estudiantes para averiguar su grado de satisfacción con diversas actividades y servicios.- Por ejemplo, por lo que se refiere al “método de matriculación para las clases del próximo cuatrimestre”, se pide a los estudiantes que pongan una cruz en una de las siguientes casillas: muy satisfecho moderadamente satisfecho neutral moderadamente insatisfecho muy insatisfecho ¿Es la respuesta de un estudiante a esta pregunta, numérica o categórica?.- Especifique.-

67 3.- En una encuesta reciente se pidió al profesorado de una universidad que respondiera a una serie de preguntas.- Indique el tipo de datos de cada pregunta.- a) Indique su nivel de satisfacción con la carga docente (muy satisfecho, moderadamente satisfecho; neutral; moderadamente insatisfecho; muy insatisfecho).- b) ¿Cuántos artículos ha publicado en revistas con evaluación anónima durante el último año?.- c) ¿Ha asistido a la última reunión del consejo de departamento?.- d) ¿Cree usted que el proceso de evaluación de la docencia debe revisarse?.-

68 4.- Se ha formulado una serie de preguntas a una muestra de clientes de un negocio de ventas de helado.- identifique el tipo de datos que se pide en cada pregunta: ¿Cuál es su sabor favorito?.- ¿Cuántas veces al mes toma helado?.- ¿Tiene hijos de menos de 10 años que vivan en casa?.- ¿Ha probado el último sabor de helado?.- 5.- La comunidad de propietarios de viviendas ha formulado una serie de preguntas a los residentes de un country grande muy importante:

69 ¿Jugó al golf el mes pasado en el nuevo campo de golf del country?.-
¿Cuántas veces ha comido en el restaurante del country en los últimos tres meses?.- ¿Tiene usted una cuatro por cuatro?.- Valore al nuevo sistema de seguridad de la urbanización (muy buena, buena, mala y muy mala).-

70 LA ESTADISTICA EN LAS DECISIONES EN EL MUNDO DE LOS NEGOCIOS

71 Un aspecto de los negocios en donde la estadística cumple una función muy especial es en la toma de decisiones.- Cada año, las empresas del mundo arriesgan miles de millones de dólares en decisiones importantes relacionadas con la expansión de la planta productiva, el desarrollo de productos nuevos, la captación de personal, el control de la calidad, las técnicas de producción, la selección de proveedores y muchas más.- Estas decisiones, casi siempre contiene un elemento de incertidumbre.- Los competidores, el gobierno, la tecnología y el ambiente social y económico, junto con clientes y electores a veces caprichosos, constituyen factores incontrolables que, en ocasiones, pueden frustrar los planes mejor trazados.- Antes de tomar decisiones, a menudo las empresas recolectan información a través de una serie de pasos,

72 lo que se denomina, “proceso de investigación”
lo que se denomina, “proceso de investigación”.- Entre estos pasos están: Definir el problema en términos específicos de forma que la investigación pueda dar resultados.- Definir tipo de datos requeridos.- Determinar de que forma se obtendrán los datos.- Planificar la recolección de los datos y si es necesario, la selección de una muestra.- Recolectar y analizar los datos.- Sacar conclusiones y elaborar un informe con los resultados.- Culminar con la toma de decisiones con base a los resultados.-

73 Las investigaciones en los negocios y las encuestas, sirven tanto a la estadística descriptiva como a la inferencia estadística para mejorar las decisiones en los negocios en diversas situaciones, incluyendo las siguientes: Un fabricante de automóviles examina datos relativos a los vehículos de los fabricantes locales y encuentra que sus vehículos reciben una evaluación superior a la de los productos de los competidores.- Esta información puede ser útil en la toma de decisiones relacionadas con técnicas de producción y proveedores de componentes.-

74 Un fabricante de un colonia para hombres piensa contratar a un atleta profesional para anunciar su producto en la televisión nacional.- Antes de decidir el pago de los cuantiosos honorarios del atleta, la compañía realiza un estudio para determinar el grado en que el público objetivo reconoce al deportista y cree en él.- Antes de comenzar a negociar un nuevo contrato de trabajo, los funcionarios de una empresa determinan que los sueldos y las prestaciones de los empleados ya son un 10% más altos que los que reciben los empleados que realizan funciones similares con un importante competidor.- Tales datos pueden ser útiles para el resultado final cuando los representantes de la compañía elijan el “punto de discusión” en su posición negociadora.-

75 NECESIDAD DE DATOS Los datos pueden concebirse como información numérica o no necesaria para ayudarnos a tomar decisiones con fundamentos, en una situación particular.- Un DATO, es el registro (numérico o no) que se obtiene como resultado de observar cierta característica de interés en un individuo (persona, animal, cosa o entidad de naturaleza abstracta) que constituye el objeto de estudio.-

76 Es en extremo importante empezar el análisis estadístico con la identificación de las fuentes de datos más adecuadas.- Si los datos presentan sesgos, ambigüedades u otro tipo de errores por más que apliquemos las más sofisticadas metodologías del análisis estadístico, las conclusiones a que lleguemos estarán mal o serán muy deficientes.-

77 Se reúnen al mismo tiempo y bajo las mismas condiciones.-
Para el análisis estadístico, es importante distinguir entre datos transversales y datos longitudinales.- Datos longitudinales. Son los datos de series de tiempo, se coleccionan a lo largo de varios períodos de tiempo.- Datos transversales. Se reúnen al mismo tiempo y bajo las mismas condiciones.-

78 LOS DATOS SE PUEDEN OBTENER POR DOS TIPOS DE FUENTES
SECUNDARIAS PRIMARIAS

79 DATOS PRIMARIOS.- Son aquellos que se encuentran en la forma original en que fueron registrados (datos brutos), sin haber sufrido ningún tipo de tratamiento o elaboración posterior. Ejemplos: una encuesta, un censo.- DATOS SECUNDARIOS.- Son aquellos que fueron producidos (diseñados y recopilados) por terceros con un fin ajeno al de la investigación y que ya han sido sometidos a alguna forma de elaboración posterior.- En consecuencia, estos datos siempre se originan en terceras fuentes.- Ejemplo; los datos que publican las oficinas de estadísticas de organismos oficiales, de empresas, etc.-

80 FUENTES PRIMARIAS.- Los datos los podemos obtener mediante dos tipos de estudios estadísticos: 1.-Experimentales 2.- Observacionales

81 ESTUDIO EXPERIMENTALES.-
En un estudio experimental, primero se identifican las variables de interés.- Luego se identifican o controlan una o más variables, de modo que se pueda obtener datos de cómo influyen en la variable de interés.- Por ejemplo, una empresa farmacéutica.- ESTUDIO OBSERVACIONALES O NO EXPERIMENTAL.- En este tipo de estudios no se trata de controlarlas variables de interés, ni de influir sobre ellas.- Quizá los tipo más común de estudios observacionales sean:

82 a) Realización de un CENSO.
b) Conducción de una encuesta.- Los estudios observacionales hoy se presentan en formas muy variadas en las empresas, principalmente en todo lo referente a estudios grupales o la importancia de los trabajos en equipo.- Se hace hincapié en la Administración de la Calidad Total.-

83 Los administradores, economistas, etc, que deseen emplear datos y análisis estadístico como un apoyo para la toma de decisiones deben considerar el tiempo y el costo necesario para obtenerlos.- Es preferible usar fuentes existentes cuando los datos se deben recabar en un período relativamente corto.- Si no se dispone de ellos fácilmente, es necesario tener en cuenta el tiempo y el costo adicional para conseguirlos.- En todo caso, quien toma la decisión debe pensar en la contribución del análisis estadístico al proceso de toma de decisiones.- El costo de recopilar datos y su análisis estadístico posterior no debe ser mayor que los ahorros generados al usar la información para determinar la mejor opción.-

84 LA TOMA DE DECISIONES EN UN ENTORNO INCIERTO
Las decisiones a menudo se basan en información incompleta.- Por ejemplo, se supone que los estudiantes universitarios de primer año, cuando son admitidos en la universidad, seleccionan una carrera.- Asimismo, las decisiones empresariales normalmente se toman en un entorno en el que los responsables de tomarlas no pueden estar seguros de la futura conducta de los factores que acabaran afectando al resultado de las distintas opciones consideradas.- Cuando un fabricante presenta una oferta para hacerse con un contrato, no esta totalmente seguro de cuales serán los costos totales ni de que ofertas presentaran los competidores.-

85 A pesar de esta incertidumbre, debe hacer una oferta
A pesar de esta incertidumbre, debe hacer una oferta.- Un inversor no sabe con seguridad si los mercados financieros estarán en alzas, estables o deprimidos.- No obstante, debe elegir las acciones, los bonos y los instrumentos del mercado de dinero de manera que su cartera este equilibrada sin saber como evolucionara el mercado en el futuro.- Consideremos las siguientes afirmaciones: El precio de las acciones de IBM será mas alto dentro de seis meses que ahora.- Si el déficit presupuestario publico es tan elevado como se prevé, los tipos de interés se mantendrán altos el resto del año,. La renta anual de un titulado universitario serà mayor que la renta de una persona que no tenga titulo universitario.-

86 Cada una de estas afirmaciones contiene un lenguaje que sugiere la existencia de una cantidad espuria de certeza.- En el momento en que se hicieron las afirmaciones, era importante estar seguro de que eran ciertas.- Aunque un analista crea que lo que ocurrirá en los próximos meses será tal que se prevé que el precio de las acciones de IBM subirá durante ese periodo, no estará seguro de eso.- Por lo tanto, las afirmaciones deben modificarse como indican los siguientes ejemplos: El precio de las acciones de IBM probablemente será mas alto dentro de seis meses que ahora.- Si el déficit presupuestario publico es tan elevado como se prevé, es probable que los tipos de interés se mantengan altos durante el resto del año.-

87 La renta anual de un titulado universitario probablemente será mayor que la renta anual de una persona sin estudios universitarios.- Es muy importante pensar bien como se dicen las cosas.- No es correcto sustituir las afirmaciones injustificadamente precisas por afirmaciones innecesariamente vagas.- Al fin y al cabo ¿Qué significa probablemente ? o ¿es probable que?.- Debe ponerse especial cuidado en expresar las ideas que se pretende expresar, sobre todo cuando se trata de probabilidades o cuando hay incertidumbre.-

88 PARA HACER EN CLASE 1.- Modificar las afirmaciones siguientes para que reflejen una posible incertidumbre: El mejor instrumento para mejorar la cuota de mercado de este producto es una campaña publicitaria destinada al grupo de edad 18 a 24 años.- Si se presenta una oferta de esta cuantía, será mas baja que las del competidor y el contrato estará asegurado.- El costo de la nafta Súper será mas alto en Argentina dentro de dos meses.- 2.- Ponga un ejemplo de una decisión de comercialización que debe tomarse en condiciones de incertidumbre.- 3.- Ponga un ejemplo de una decisión financiera que debe tomarse en condiciones de incertidumbre.-

89 EL MUESTREO.- Antes de introducir un nuevo producto en el mercado, su fabricante quiere saber cual será el nivel probable de demanda y es posible que realice una encuesta de mercado.- Lo que le interesa, en realidad son todos los compradores potenciales (la población).- Sin embargo, las poblaciones a menudo son tan grandes que es difícil analizarlas; seria imposible o prohibitivo recoger toda la información de una población.- Incluso en las circunstancias en las que parece que se dispone de suficientes recursos, las limitaciones de tiempo obligan a examinar un subconjunto de ella (muestra).- Nuestro objetivo final es hacer afirmaciones basadas en datos muestrales que tengan alguna validez sobre la población en general.- Necesitamos, pues, una muestra que sea representativa de la población.-

90 ¿Como podemos lograrlo
¿Como podemos lograrlo?.- Uno de los principios importantes que debemos seguir en el proceso de la muestra es la aleatoriedad.- El muestreo aleatorio simple es un método que se emplea para seleccionar una muestra de n objetos de una población en el que cada miembro de la población se elige estrictamente al azar, cada miembro de la población se elige con la misma probabilidad y todas las muestras posibles de un tamaño dado n, tienen la misma probabilidad de ser seleccionadas.- Este método es tan frecuente que generalmente se denomina muestra aleatoria.- El muestreo se utiliza mucho en todas las áreas de los negocios, así como en otras disciplinas.- Para averiguar si un proceso de producción esta funcionando correctamente, se selecciona una muestra de bienes producidos.-

91 Las auditorias de las cuentas pendientes de cobro generalmente se basan en una muestra.- Durante los años de elecciones presidenciales se hacen estimaciones de las preferencias de los votantes a partir de muestras de votantes, también puede hacerse una encuesta a la salida de los colegios electorales para predecir que candidato obtendrá mas votos.- Sin embargo, tomar una muestra es meramente un medio para llegar a un fin.- Necesitamos estudiar estadística, no para hacer afirmaciones sobre la muestra sino, mas bien, para extraer conclusiones sobre la población en general.- La estadística es el estudio de cómo se toman decisiones sobre una población cuando la información procede de una muestra.- Siempre quedara alguna incertidumbre.-

92 DESPUES DE LO EXPRESADO PODEMOS RESUMIR DICIENDO:
Supongamos que queremos saber cual es la edad media de los votantes de un país.- Es evidente que la población es tan grande que solo podríamos tomar una muestra aleatoria, por ejemplo, 500 votantes y calcular su edad media.- Como esta media se basa en datos muestrales se llama “estadístico” .- Si pudiéramos calcular la media de toda la población, la media resultante se llamaría “parámetro”.- Mas adelante veremos como se toman decisiones sobre un parámetro, basándose en un estadístico.- Debemos darnos cuenta de que siempre habrá una cierta incertidumbre, ya que no se conoce el valor exacto del parámetro.- DESPUES DE LO EXPRESADO PODEMOS RESUMIR DICIENDO:

93 Muy frecuentemente es necesario seleccionar una muestra y en base a ésta, extraer conclusiones respecto de la población.- Una muestra estadística es un subconjunto de la población.- Se la simboliza con n.- N x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x n x x x x x x x x x x

94 La selección de una muestra representativa es un problema importante en la investigación estadística ya que ésta puede proporcionar una visión útil de la naturaleza de la población que se estudia, mientras que una muestra no representativa puede sugerir conclusiones totalmente erróneas sobre la población.- El punto esencial en el muestreo es estar seguro de que los elementos de la muestra representan a la población tan fielmente como sea posible.- Por lo general, esta tarea es más difícil de lo que parece.- Con frecuencia debe dedicarse mucho tiempo y atención al proceso de selección, ya que una vez medidos los elementos se supondrá que la muestra es representativa de la población.-

95 METODOS DE SELECCIÓN DE LA MUESTRA
Existen dos métodos básicos para seleccionar los elementos de una población: Si cada elemento de la población tiene la misma posibilidad de ser elegido, esto constituye una muestra aleatoria.- Si algunos elementos de la población tienen mayores posibilidades de selección que otros, esto constituye una muestra no aleatoria.- Estos dos métodos también se conocen con el nombre de muestras probabilísticas y muestras no probabilísticas.-

96 Una muestra aleatoria simple, es aquella en la cual cada individuo o elemento de una población tiene la misma oportunidad de ser elegido.- Además, cada muestra de un tamaño fijo tiene la misma probabilidad de ser elegida, que cualquier otra muestra del mismo tamaño.- El muestreo aleatorio simple, es la técnica de muestreo aleatorio más elemental y constituye la base para otras técnicas.- En el muestreo aleatorio simple, se usa n para representar el tamaño de la muestra y N para representar el tamaño de la población.- Cada persona o elemento en el marco se enumera de 1 a N.- La probabilidad de seleccionar a cualquier miembro en particular de la población la primera vez es igual a 1/N.- MUESTRA ALEATORIA SIMPLE.-

97 Con reemplazo Sin reemplazo
Existen dos métodos básicos para seleccionar muestras: Con reemplazo Sin reemplazo

98 El muestreo con reemplazo, implica que una vez seleccionada una persona o elemento, se regresa al marco donde tiene la misma probabilidad de ser elegida de nuevo.- Imagine que tiene una urna con 500 tarjetas de presentación.- Suponga que en el primer sorteo sale la ficha de Juan Llanos.- La información pertinente se registra y se regresa la tarjeta a la urna.- Después se mezclan bien las tarjetas y se saca una segunda tarjeta,. En esta segunda extracción Juan Llanos, tiene la misma probabilidad de salir 1/N, de ser elegida de nuevo.- Se repite el procedimiento hasta alcanzar el tamaño muestra n deseado.- Sin embargo, suele considerarse más adecuado tener una muestra de personas o elementos diferentes en lugar de permitir la repetición de mediciones de la misma persona o elemento.-

99 En el muestreo sin reemplazo, no se regresa la persona o elemento al marco una vez seleccionado y por lo tanto, no puede elegirse otra vez.- Como antes, en el muestreo sin reemplazo la probabilidad de que algún miembro específico de la población, por ejemplo Juan Llanos, sea elegido en el primer intento es 1/N.- La probabilidad de que, cualquier individuo no seleccionado, salga elegido en el segundo intento será 1 / N-1.- Este proceso continua hasta alcanzar el tamaño de muestra n deseado.- Sin importar si el muestreo es con o sin reemplazo, los métodos de urna para elegir una muestra tienen un gran inconveniente: la habilidad para revolver perfectamente las tarjetas y elegir la muestra en forma aleatoria.- Como resultado, los métodos de urna no son muy útiles.- Son preferibles otros métodos de selección con menos problemas y mejor base científica.-

100 Uno de estos métodos utiliza una TABLA DE NUMEROS ALEATORIOS, para obtener la muestra.- Una tabla de números aleatorios esta formada por una serie de dígitos que se generan en forma aleatoria y se colocan en la secuencia en que se generaron.- Hay muchas tablas de números aleatorios, como la que veremos en práctica.- De hecho, lo normal es que los investigadores antes de usar una tabla de números aleatorio verifiquen la aleatoriedad de los dígitos generados antes de emplearlos.- Debido a que cada dígito o secuencia de dígitos de la tabla es aleatorio, se puede leer en sentido horizontal o vertical.-

101 Para usar una tabla como la que vemos en práctica en lugar de una urna para seleccionar una muestra, primero debemos asignar números de códigos a los miembros individuales de la población.- Entonces se obtiene la muestra aleatoria leyendo la tabla y seleccionando los elementos del marco de población cuyos números de código coinciden con los dígitos encontrados en la tabla.- Para entender mejor, hagamos un ejemplo con el curso.- Hoy gracias a los avances de los paquetes estadísticos de PC, las tablas se usan menos.- Los programas tienen una secuencia para generar los números aleatorios que se necesita.-

102

103 ESTADISTICO Y PARAMETRO.-
Un estadístico es cualquier característica numérica de una muestra.- Un parámetro es cualquier característica numérica de una población.- Por ejemplo, en un estudio realizado en 2007 por cierta Consultora sobre la moda de compras en supermercados, una muestra de respuestas dadas por los compradores reveló que el promedio de consumo familiar de alimentos por semanas era de 280 pesos.- Ese promedio es un ejemplo de estadístico.- Si por ejemplo del mismo estudio se revelo que la permanencia de las personas en el recorrido para sus compras tiene un promedio de 80 minutos, este también es un ejemplo de estadístico.- Si en cambio les preguntamos a todos los clientes del supermercado la cantidad de viajes al supermercado por mes que realiza y este nos da un promedio de 3 viajes, este valor es un ejemplo de parámetro, ya que la consulta se hizo a toda la población.-

104 EJERCICIOS PARA HACER EN CLASE
1.- Ponga un ejemplo de un parámetro en cada una de las siguientes poblaciones: La rentas de todas las familias que viven en una ciudad.- Los rendimientos anuales de todas las acciones que cotizan en una bolsa de valores.- Los costos de todas las reclamaciones que recibe en un año dado una compañía de seguros médicos.- Los valores de todas las cuentas pendientes de cobro de una empresa.-

105 2.- Su universidad ha encuestado a sus estudiantes para averiguar el tiempo semanal medio que dedican a navegar por Internet.- ¿Cuál es la población?.- ¿Cuál es la muestra?.- ¿Cual es el estadístico?.- ¿Es el valor de 6,1 horas un parámetro o un estadístico?.- 3.- Una compañía aérea sostiene que menos de un 1 % de los vuelos programados que despegan del aeropuerto de Ezeiza sale tarde.- Se ha observado que el 1,5 por ciento de una muestra aleatoria de 200 vuelos salio mas tarde de la hora prevista.- ¿Cuál es la población?.- ¿Cuál es la muestra?.- ¿Cual es el estadístico?.- ¿Es el valor 1,5 por ciento un parámetro o un estadístico?.-

106 PRESENTACION DE DATOS ESTADISTICOS
COMO HEMOS DICHO, AL PLANTEARNOS UN ESTUDIO ESTADISTICO Y OBTENER LOS DATOS NECESARIOS, NOS ENCONTRAMOS QUE PODEMOS ESTUDIAR VARIABLES CATEGÓRICAS Y/O NUMÉRICAS

107 PRESENTACION DE VARIABLE CATEGORICA EN TABLAS Y GRAFICOS.-

108 NOS PREGUNTAMOS CUANTAS
VARIABLES MOSTRAMOS 1 var + 2 var 2 var TABLA RESUMEN SUPERTABLA TABLA DE CONTINGENCIA CUADRO ESTADISTICO PORCENTAJES DEL TOTAL, DE FILAS Y DE COLUMNAS GRAFICOS

109 PARTES DE UN CUADRO ESTADISTICO
TITULO NOTA DE CALCE Encabezado y sub.-encabezado CUERPO Columna Matriz o concepto FUENTE Nota al pie

110 1.-TITULO.- Se coloca siempre sobre el cuadro, ya que leemos de arriba hacia abajo.- Si el titulo es muy largo, se coloca en forma de pirámide truncada.- Un titulo debe responder a cuatro preguntas básicas: QUE?, que es lo que queremos mostrar.- DONDE?, se refiere al lugar donde fueron obtenidos.- COMO?, se refiere a como queremos mostrar los datos.- CUANDO?, hace referencia cuando fueron obtenidos los datos.- 2.-ENCABEZADO Y SUBENCABEZADOS.- Son las denominaciones de las columnas y responde al Como del titulo.- Una columna puede tener subencabezados.-

111 3. -COLUMNA MATRIZ O CONCEPTO. - Son las denominaciones de la filas
3.-COLUMNA MATRIZ O CONCEPTO.- Son las denominaciones de la filas.- Responde también al Como del titulo.- 4.-CUERPO.- Son las diversas casillas donde se colocan los datos.- 5.-FUENTE.- Nos indica la institución, investigación o el texto de donde provienen los datos.- Nos sirve para saber donde consultar, si queremos más información o si deseamos presentar alguna disconformidad o aclaración.-

112 Las cinco partes mencionadas nunca deben faltar al elaborarse un cuadro estadístico.- Hay dos partes restantes que pueden ir o no según el cuadro estadístico que elaboremos.- NOTA DE CALCE.- Se coloca entre el titulo y el cuadro estadístico, hace referencia a como debemos leer los datos del cuerpo del cuadro.- Por ejemplo, (en %), (en miles), etc.- NOTA AL PIE.- Hace referencia a como leer algunos símbolos que pueden aparecer en el cuerpo del cuadro, por ejemplo, (-) dato no relevado, (*) dato estimado, etc.-

113 CUADRO RESUMEN. Ejemplo
Supongamos que se selecciono en la Universidad una muestra al azar de 120 alumnos en Marzo 2008 y se les pregunto en que carrera estaban inscriptos.- Resulto la siguiente tabla: Matricula de la UNLAR según carreras. Marzo 2008 Frecuencia absoluta CARRERA TOTAL Contador 28 Psicopedagogía 11 Sistema 23 Medicina 19 Arquitectura 15 Abogacía 24 120 Fuente: Elaboración propia

114 Matricula de la UNLAR según carreras.
Marzo 2008 CARRERA TOTAL % del total Contador 28 23,3 Psicopedagogía 11 9,2 Sistema 23 19,2 Medicina 19 15,8 Arquitectura 15 12,5 Abogacía 24 20,0 120 100,0 Frecuencia Relativa % Fuente: Elaboración propia

115 Matricula de la UNLAR según carreras.
5 10 15 20 25 30 Contador Psicopedagogía Sistema Medicina Arquitectura Abogacía Matricula de la UNLAR según carreras. Marzo 2008

116 Matricula de la UNLAR según carreras.
Marzo 2008 23% 9% 19% 16% 13% 20% Contador Psicopedagogía Sistema Medicina Arquitectura Abogacía

117 Supongamos que tenemos un cuadro resumen donde mostramos datos para tres tiempos diferentes, por ejemplo: Total de alumnos matriculados en la UNC, en tres especialidades de Administración de Empresa.- Años 2006, 2007 y 2008 Especialidad 2006 2007 2008 Finanzas 82 120 100 Marketing 114 135 156 Contabilidad 56 85 TOTAL 252 355 341 Fuente: UNC

118 Si queremos explicar el cuadro, podremos mostrar lo siguiente:
Total de alumnos matriculados en la UNC, en tres especialidades de Administración de Empresa.- Años 2006, 2007 y 2008 En % Especialidad 2006 2007 2008 Finanzas 32,5 33,8 29,3 Marketing 45,2 38,1 45,7 Contabilidad 22,2 28,1 25,0 TOTAL 100,0 Fuente: UNC

119 Total de alumnos matriculados en la UNC, en tres especialidades de Administración de Empresa.- Años 2006, 2007 y 2008 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 2006 2007 2008 Contabilidad Marketing Finanzas Fuente: UNC

120 Total de alumnos matriculados en la UNC, en tres especialidades de Administración de Empresa.- Años 2006, 2007 y 2008

121 Total de alumnos matriculados en la UNC, en tres especialidades de Administración de Empresa.- Años 2006, 2007 y 2008

122 TABLA DE CONTINGENCIA.-
Supongamos que ahora a la muestra de estudiantes se observo el sexo y se registro la información: Carrera Sexo TOTAL Varón Mujer Contador 16 12 28 Psicopedagogía 3 8 11 Sistemas 13 10 23 Medicina 15 4 19 Arquitectura 5 Abogacía 17 7 24 69 51 120 Frecuencias absolutas conjuntas Frecuencias absolutas marginales

123 Matricula de la UNLAR por carreras y sexo. Marzo 2008.-
Abogacía Arquitectura Medicina Mujeres Varones Sistemas Psicopedagogía Contador 5 10 15 20

124 Porcentajes según las carreras que cursan.-
Analizamos una tabla de contingencia, según lo que queramos explicar.- Porcentajes según las carreras que cursan.- CARRERAS SEXO TOTAL Varón Mujer Contador 57,0 43,0 100,0 Psicopedagogía 27,3 72,7 Sistemas 56,5 43,5 Medicina 78,9 21,1 Arquitectura 33,3 66,7 Abogacía 70,8 29,2 57,5 42,5

125 MATRICULA DE LA UNLAR SEGÚN CARRERA YSEXO
AÑO 2008 (EN %)

126 MATRICULA DE LA UNLAR SEGÚN CARRERA YSEXO
AÑO 2008 (EN %)

127 Porcentajes según el sexo del alumnado
CARRERAS SEXO TOTAL Varón Mujer Contador 23,4 23,5 23,3 Psicopedagogía 4,3 15,7 9,2 Sistemas 18,8 19,6 19,2 Medicina 21,7 7,8 15,8 Arquitectura 7,2 12,5 Abogacía 24,6 13,7 20,0 100,0

128 MATRICULA DE LA UNLAR SEGÚN SEXO Y CARRERA
AÑO 2008 (EN %)

129 Porcentajes según el total general
CARRERAS SEXO Varón Mujer Contador 13,3 10,0 Psicopedagogía 2,5 6,7 Sistemas 10,8 8,3 Medicina 12,5 3,3 Arquitectura 4,2 Abogacía 14,2 5,8

130 MATRICULA DE LA UNLAR SEGÚN TOTAL GENERAL POR CARRERA Y SEXO
AÑO 2008 (EN %)

131 EJERCICIO PARA DISCUTIR EN CLASE Demanda de un producto por zonas
Un minorista de materiales de construcción ha estado estudiando un plan para abrir sucursales en nuevos lugares dentro de su programa de expansión regional.-En una ciudad propuesta para la expansión hay tres lugares posibles; norte, este y oeste.- El minorista sabe por experiencia que los tres mayores centros de beneficios de sus negocios son los de herramientas, madera y pintura.- Para seleccionar un lugar, son importantes las pautas de demanda de las diferentes partes de la ciudad.- Ha pedido, pues, ayuda al departamento de estudios de mercado para obtener y analizar los datos relevantes.- Este minorista cree que tiene una ventaja comparativa en la venta de herramientas.-

132 Este Norte Oeste TOTAL Herramienta 100 50 65 215 Madera 95 70 Pintura
Comente como haría el relevamiento de la información.- De sugerencias.- El Departamento de estudios de mercado selecciono una muestra aleatoria de 750 hogares, con 250 en cada una de las zonas.- Surge la siguiente tabla de contingencia (3 x 4) de las variables “lugar residencial” y “producto comprado”.- Analice toda esta información y comente como lo mostraría gráficamente.- Este Norte Oeste TOTAL Herramienta 100 50 65 215 Madera 95 70 Pintura 45 75 170 Ninguno 60 40 150 250 750

133 Este Norte Oeste TOTAL Herramienta 13,33% 6,67% 8,67% 29% Madera 12,67% 9,33% Pintura 6,00% 10,00% 23% Ninguno 8,00% 5,33% 20% 33% 100%

134 ALGUNOS TIPOS DE GRÁFICOS ESTADISTICOS
DE BARRAS DE SECTOR LINEALES PICTOGRAMAS VERTICALES SIMPLES HORIZONTALES DOBLES COMPUESTAS SUBDIVIDIDAS

135 Veamos algunos gráficos para interpretar en clase.-
Porcentaje Primer Año 3,2% Segundo Año 14,6% Tercer Año 18,5% Cuarto Año 12,7% Quinto Año 22,9% Recibidos 28% TOTAL 99,9%

136 NO USAR este tipo de Grafico

137 “SI USAR” este tipo de Grafico

138 MONTO VENTAS Enero 10500 Febrero 8300 Marzo 17500 Abril 15200 Mayo 13000 Junio 8000 Julio 10300 Agosto 12000 Septiembre 11000 Octubre 16000 Noviembre 15000 Diciembre 19000

139

140

141 PRINCIPIOS DE EXCELENCIA GRAFICA

142 Hasta ahora hemos analizado como presentar un conjunto de datos en forma de tablas y gráficos cuando las variables que se observan son variables categóricas.- Entre los métodos para describir y comunicar información estadística, las presentaciones gráficas bien diseñadas por lo general son más sencillas y poderosas.- Las buenas exposiciones gráficas revelan lo que transmiten los datos.- Para que el análisis mejore con la presentación visual de los datos, es esencial que las tablas y los gráficos tengan una presentación cuidadosa y clara.- Todo lo innecesario debe eliminarse para no ocultar el mensaje que contienen los datos.- El amplio uso de las hojas de cálculo y de software gráfico ha llevado a una proliferación de gráficas en los últimos años.- Aunque muchas de las gráficas presentadas sirven como representaciones útiles de los datos, por desgracia la naturaleza impropia e inadecuada de muchas presentaciones ha perjudicado la comprensión y el análisis de las mismas.-

143 3.- Evitar distorsiones.- 4.- Facilitar la comparación de los datos.-
El profesor Edward R. Tufte, es quien escribió una serie de libros que describen los métodos adecuados de diseños de gráficos estadísticos.- El considera que las características básicas esenciales de una representación gráfica adecuada incluyen: 1.- Mostrar los datos.- 2.- Hacer que el observador se concentre en lo sustancial de la gráfica y no en como se desarrollo.- 3.- Evitar distorsiones.- 4.- Facilitar la comparación de los datos.- 5.- Cumplir con un objetivo claro.- 6.- Que esté integrada con las descripciones estadísticas y verbales de la gráfica.-

144 Tufte establece cinco principios de excelencia gráfica que son:
1.- La excelencia gráfica es una presentación bien diseñada de los datos que proporciona sustancia, estadística y diseño.- 2.- La excelencia gráfica comunica ideas complejas con claridad, precisión y eficiencia.- 3.- La excelencia gráfica proporciona al observador el mayor número de ideas en el menor tiempo y con el mínimo de tinta.- 4.- La excelencia gráfica casi siempre involucra varias dimensiones.- 5.- La excelencia gráfica requiere decir la verdad acerca de los datos.-

145 Una característica principal de la excelencia gráfica es la importancia que tiene el evitar usar una gráfica para distorsionar los datos que representa.- Una gráfica no distorsiona si su presentación visual es consistente con su representación numérica.- La cantidad de distorsión puede medirse con el factor mentira.- El factor mentira, es la razón del tamaño del efecto que muestra la gráfica con respecto al tamaño de los efectos que muestran los datos.- Un principio incluido aquí es que cualquier variación en el diseño de una gráfica debe ser consistente con las variaciones que presentan los datos.- Con frecuencia, los cambios en la gráfica no son consistentes con las variaciones en los datos y se produce una distorsión entre lo que representan los datos y lo que muestra la gráfica.- Esto se da en general cuando usamos gráficas de pictogramas.-

146 En resumen: Somos consumidores activos de la información que escuchamos o vemos cada día en los distintos medios de comunicación.- Debido a que mucho de lo que se escucha o se lee es basura, necesitamos aprender a evaluar en forma crítica y desechar lo que no tiene un valor real.- También es imperativo tener en cuenta que a veces la basura que se presenta está fundamentada en la ignorancia; otra veces; es planteada y maliciosa.- Lo importante es analizar y dudar de la información proporcionada.-

147 EJERICICIOS PARA HACER EN CLASE
1.- Los gastos de viaje de una empresa son: Concepto Porcentajes Compañías aéreas 41.0 Alojamiento 25.0 Comidas 12.0 Alquileres de automóviles 18.0 Otros 4.0 a) Construya un gráfico de sectores.- Explique b) Construya un gráfico de barras.- Explique

148 Trace un gráfico de barras.- Explique
2.- Se le ha pedido a los empleados que indiquen su grado de satisfacción con el seguro médico actual.- Estas son las respuestas de una muestra aleatoria de empleados: Concepto frecuencia Muy satisfechos 29 Moderadamente satisfecho 55 Ninguna opinión 5 Moderadamente insatisfecho 20 Muy insatisfecho Trace un gráfico de barras.- Explique Trace un gráfico de sectores y explique.-

149 Entre 40 y menos de 60 segundos
3.- El supervisor de una planta ha obtenido una muestra aleatoria de las edades de los empleados y del tiempo que tardan en realizar una tarea (en segundos).- a) Elabore un cuadro completo en valores relativos en función de las edades.- b) Represente los datos originales con un gráfico de barras compuestas.- Explique.- Edades Tiempo Menos de 40 segundos Entre 40 y menos de 60 segundos Un minuto como mínimo Menos de 21 10 13 25 21 a menos de 35 16 20 12 35 a menos de 50 18 22 8 50 Años o más 27 19

150 4.- Suponga usted que según una estimación del gasto público, el 46 por ciento se destina a pensiones, el 18 por ciento a defensa, el 15 por ciento a regiones y municipios, el 14 por ciento a intereses de la deuda, el 6 por ciento a otros gastos de la administración central y el 1 por ciento al seguro de depósito.- Represente gráficamente esta información mediante un gráfico de sectores.- 5.- Tres subcontratistas A, B y C suministraron 58, 70 y 72 piezas respectivamente a una planta la semana pasada.- De las piezas suministradas por el subcontratista A, solo cuatro estaban defectuosas.- De las suministradas por el B, 60 estaban bien, de las suministradas por el C solo seis estaban defectuosas.- Presente estos datos en una tabla (con todas sus partes).- Elabore un cuadro completo en valores relativos teniendo en cuenta los Subcontratistas.- Muestre esta información en un grafico (según corresponda).-

151 6.- Retomando el ejercicio de demanda de un producto, suponga que los datos de la encuesta de mercado no fueron los de la tabla que vimos sino los de la tabla siguiente.- Explique las conclusiones de esta encuesta desde el punto de vista de la estrategia de producción.- Zona Herramientas Madera Pintura Ninguno Total Este 100 40 60 50 250 Norte 70 45 95 Oeste 75 65 245 155 220 130 750

152 DIAGRAMA DE PARETO

153 Los directivos que necesitan identificar las principales causas de los problemas e intentar corregirlas rápidamente con un costo mínimo a menudo utilizan un grafico de barras especial llamado “diagrama de Pareto El economista italiano Vilfredo Pareto ( ) señalo que en la mayoría de los casos un pequeño numero de factores es responsable de la mayoría de los problemas.- Ordenamos las barras de un diagrama de Pareto de izquierda a derecha para poner énfasis en las causas mas frecuentes de los defectos.- Un diagrama de Pareto es un grafico de barras de las causas de los defectos.- La barra de la izquierda indica la causa mas frecuente y las de la derecha indican las causas con frecuencias decreciente.- Los diagramas de Pareto se utilizan para separar lo “poco vital” de lo “mucho trivial”.-

154 El resultado de Pareto se aplica a una amplia variedad de conductas en muchos sistemas.- A veces se denomina regla de 80-20, por ejemplo un fabricante de cereales puede observar que la mayoría de los errores de empaquetado se deben únicamente a unas cuantas causas.- Un estudiante podría pensar que el 80 por ciento del trabajo de un proyecto de grupo ha sido realizado únicamente por el 20 por ciento de los miembros del equipo.- La utilización de Pareto también puede mejorar la comunicación con los empleados o con la dirección y dentro de los equipos de producción.- Veamos el uso de Pareto aplicado a un problema de una compañía de seguros médicos.-

155 Errores de tramitación de las reclamaciones a un seguro.-
El análisis y pago de las reclamaciones a un seguro es un complejo proceso que puede llevar a tramitar incorrectamente algunas reclamaciones.- Estos errores provocan un aumento del tiempo que dedica el personal a obtener información correcta y posiblemente a pagar indemnizaciones indebidas.- El beneficiario normalmente detecta los errores cuando cobra una indemnización menor a la debida y a menudo puede pasar por alto indemnizaciones superiores a las debidas.- Estos errores pueden incrementar considerablemente los costos, además de afectar negativamente a las relaciones con los clientes.- Se realizan considerables esfuerzos para analizar la actividad de presentación y de tramitación de las reclamaciones con el fin de poder desarrollar métodos para reducir lo mas posibles los errores.-

156 Una importante compañía de seguros médicos se fijo el objetivo de reducir un 50 por ciento los errores.- Muestre como utilizaría el análisis de Pareto para ayudar a averiguar los factores importantes que contribuyen a eliminar los errores.- Solución La compañía de seguros médicos realizo una intensa investigación de todo el proceso de presentación de reclamaciones y pago de indemnizaciones.- Se selecciono un equipo de personas clave de los departamentos encargados de tramitar reclamaciones, de relaciones con los proveedores y de marketing, de auditoria interna, de procesamiento de datos y de revisiones medicas.-

157 Basándose en su experiencia y en una revisión del proceso, los miembros del equipo llegaron finalmente a un acuerdo sobre una lista de posibles errores.- tres de ellos (códigos de procesamiento y diagnostico, información de los proveedores e información de los pacientes) están relacionados con el proceso de presentación de reclamaciones y deben comprobarse revisando los historiales médicos de los pacientes en las clínicas y los hospitales.- Tres posibles errores (tablas de precios, solicitudes de contratos y ajuste de los proveedores) están relacionados con la tramitación de las reclamaciones de indemnización dentro de la oficina en la compañía de seguros.- Los errores de los programas y de los sistemas están incluidos en la categoría “Otros”.-

158 Se puso en marcha una auditoria completa de una muestra aleatoria de 120 reclamaciones contrastando cada reclamación con los historiales médicos de las clínicas y los hospitales hasta llegar a la fase final del pago de la indemnización.- Se separaron las reclamaciones que contenían errores y se anoto el numero de errores de cada tipo.- Si una reclamación tenia múltiples errores, se anotaron todas.- En este proceso se tomaron muchas decisiones sobre la definición de error.- Si se había dado a un niño un tratamiento que se daba normalmente a los adultos y el sistema informático de procesamiento no lo detecto, este error debía registrase como un error 7 (errores de los programas y de los sistemas) y también como un error 3 (información de los pacientes).-

159 Si el tratamiento de un esguince estaba codificado como una fractura, debía registrarse un error 1 (código de procedimiento y diagnostico).- A continuación se elaboro una tabla de distribución de frecuencia de las categorías y el numero de errores cometidos en cada categoría: Categorías Tipos de errores Frecuencia 1 Código de procedimiento y diagnostico 40 2 Información del proveedor 9 3 Información del paciente 6 4 Tabla de precios 17 5 Solicitudes de contratos 37 Ajuste de los proveedores 7 Otros

160

161 Vemos en la figura anterior, que cuando se van sumando los porcentajes de defectos correspondientes a los tipos de error (de izquierda a derecha), el ascenso de la línea de frecuencias acumuladas indica la mejora relativa que se obtendría corrigiendo cada uno de los problemas mas frecuentes.- En el diagrama de Pareto, los analistas vieron que el error 1 (código de procedimiento y diagnostico) y el error 5 (solicitudes de contratos) eran las principales causas de errores.- La combinación de los errores 1, 5 y 4 (tablas de precios) provocaba casi un 80 por ciento de los errores.- Examinando el diagrama de Pareto de la figura anterior, los analistas pueden averiguar rápidamente a que causas debe dedicarse la mayor parte de los esfuerzos para corregir los problemas.- El análisis de Pareto separo las “pocas causas vitales” de las “muchas triviales”.-

162 Con esta información, el equipo hizo una serie de recomendaciones para reducir los errores y controlar el proceso.- Se harían sesiones especiales de formación para los encargados de tramitar las reclamaciones de los hospitales y clínicas.- Se harían auditorias aleatorias por sorpresa para verificar los errores de codificación.- Se evaluaría la posibilidad de imponer sanciones monetarias a las organizaciones que cometieran excesivos errores.-

163 4) Dos personas prepararían cada una por separado el conjunto completo de tablas de solicitud de contrato.- A continuación, se compararían todas las entradas de las tablas utilizando un programa informático y se resolverían las diferencias que hubiera.- 5) Se prepararía unos modelos tipo de reclamación que se utilizarían para verificar las solicitudes correctas de contrato.- El diagrama de Pareto, y las recomendaciones ayudaron a reducir los errores.- Se redujeron los casos en los que se pagaban indemnizaciones de mas, así como la burocracia necesaria para corregir los errores.-

164 VEAMOS OTRO EJEMPLO DE USO DEL DIAGRAMA DE PARETO

165 Usted es el Analista de Sistemas encargado de mantener la Base de Datos de una empresa que fabrica heladeras, ante la gran cantidad de quejas, le comenta al Gerente que le pida a los Ingenieros que deben analizar cuales son los defectos más frecuentes que aparecen en las unidades al salir de la línea de producción.- Para esto, empezaron por clasificar todos los defectos posibles en sus diversos tipos: TIPOS DE DEFECTOS DETALLE DEL PROBLEMA Motor no detiene No para el motor cuando alcanza temperatura No enfría El motor arranca pero la heladera no enfria Burlete defectuoso Burlete roto o deforme que no ajusta Pintura defectuosa Defectos de pintura en superficie externa Rayas Rayas en las superficies externas No funciona Al enchufar no arranca el motor Puerta no cierra La puerta no cierra correctamente Gavetas defectuosa Gavetas interiores con rajaduras Motor no arranca El motor no arranca después de ciclo de parada Mala nivelación La heladera se balancea y no se puede nivelar Puerta defectuosa Puerta del refrigerador no cierra herméticamente Otros Otros defectos no incluidos en los anteriores

166 Posteriormente un inspector revisa cada heladera que sale de producción registrando sus defectos de acuerdo con dichos tipos, .- Después de inspeccionar 88 heladeras se obtuvo una tabla como esta: TIPO DE DEFECTO DETALLE DEL PROBLEMA Frec. Burlete defectuoso Burlete roto o deforme que no ajusta 9 Pintura defectuosa Defectos de pintura en superficie exterior 5 Gavetas defectuosas Gavetas interiores con rajaduras 1 Mal Nivelación La heladera se balancea y no se puede cerrar Motor no arranca El motor no arranca después de ciclos de paradas Motor no se detiene No para el motor cuando alcanza temperatura 36 No enfría El motor arranca pero la heladera no enfría 27 No funciona Al enchufar no arranca el motor 2 Otros Otros defectos no incluidos en los anteriores Puerta defectuosa Puerta del refrigerador no cierra herméticamente Puerta no cierra La puerta no cierra correctamente Rayas Rayas en la superficie externas 4 TOTAL 88

167 La última columna muestra el número de heladeras que presentaban cada tipo de defectos, es decir, la frecuencia con que se presenta cada defectos.- En lugar de la frecuencia numérica utilizar la frecuencia porcentual, es decir, el % de heladeras en cada tipo de defectos: TIPO DE DEFECTO DETALLE DEL PROBLEMA Frec. Frec.% Burlete defectuoso Burlete roto o deforme que no ajusta 9 10,2 Pintura defectuosa Defectos de pintura en superficie exterior 5 5,7 Gavetas defectuosas Gavetas interiores con rajaduras 1 1,1 Mal Nivelación La heladera se balancea y no se puede cerrar Motor no arranca El motor no arranca después de ciclos de paradas Motor no se detiene No para el motor cuando alcanza temperatura 36 40,9 No enfría El motor arranca pero la heladera no enfría 27 30,7 No funciona Al enchufar no arranca el motor 2 2,3 Otros Otros defectos no incluidos en los anteriores 0,0 Puerta defectuosa Puerta del refrigerador no cierra herméticamente Puerta no cierra La puerta no cierra correctamente Rayas Rayas en la superficie externas 4 4,5 TOTAL 88 100,0

168 Pero, ¿Cuáles son los defectos que aparecen con mayor frecuencia
Pero, ¿Cuáles son los defectos que aparecen con mayor frecuencia?.- Para hacerlo más evidente, antes de graficar podemos ordenar los datos de la tabla en orden decreciente de frecuencia: TIPO DE DEFECTO DETALLE DEL PROBLEMA Frec. Frec.% Motor no se detiene No para el motor cuando alcanza temperatura 36 40,9 No enfría El motor arranca pero la heladera no enfría 27 30,7 Burlete defectuoso Burlete roto o deforme que no ajusta 9 10,2 Pintura defectuosa Defectos de pintura en superficie exterior 5 5,7 Rayas Rayas en la superficie externas 4 4,5 No funciona Al enchufar no arranca el motor 2 2,3 Puerta no cierra La puerta no cierra correctamente Gavetas defectuosas Gavetas interiores con rajaduras 1 1,1 Mal Nivelación La heladera se balancea y no se puede cerrar Motor no arranca El motor no arranca después de ciclos de paradas Otros Otros defectos no incluidos en los anteriores 0,0 Puerta defectuosa Puerta del refrigerador no cierra herméticamente TOTAL 88 100,0

169

170 Vemos que la categoría “otros” siempre debe ir al final, sin importar su valor.- De esta manera, si hubiese tenido un valor más alto, igual debería haberse ubicado en la última fila.- Ahora resulta evidente cuales son los tipos de defectos más frecuentes.- Podemos observar que los tres primeros tipos de defectos se presentan en el 82% de las heladeras, aproximadamente.- Por el principio de Pareto, concluimos que: La mayor parte de los defectos encontrados en el lote pertenece a solo tres tipos de defectos, de manera que si se eliminan las causas que los provocan desaparecería la mayor parte de los defectos.-

171 EJERCICIOS PARA HACER EN CLASE
1.- Una empresa ha llegado a la conclusión de que hay siete defectos posibles en una de sus líneas de producción.- Construya un diagrama de Pareto de las siguientes frecuencias de defectos: CODIGO DE LOS DEFECTOS FRECUENCIA A 10 B 70 C 15 D 90 E 8 F 4 G 1

172 GRAFICOS PARA DESCRIBIR
DATOS DE SERIES TEMPORALES

173 Supongamos que tomamos una muestra aleatoria de 100 cajas de una nueva variedad de galletitas.- Si recogemos nuestra muestra en un momento del tiempo y ponderamos cada caja, las mediciones obtenidas se conocen como vimos, con el nombre de datos transversales.- Sin embargo, podríamos recoger y medir una muestra aleatoria de 5 cajas cada 15 minutos o de 10 cajas cada 20 minutos.- Los datos medidos en sucesivos momentos de tiempo se denominan con sabemos, datos de series temporales.- El estudio de Series de Tiempos, esta fuera del alcance de esta cátedra, por lo tanto solo veremos los gráficos de las series temporales.-

174 Un grafico de series temporales representa una serie de datos en varios intervalos de tiempo.- Midiendo el tiempo en el eje de abscisa y la cantidad numérica que interesa en el eje de la ordenada, se obtiene un punto en el grafico por cada observación.- Uniendo los puntos contiguos en el tiempo por medio de líneas rectas se obtiene un grafico de series temporales.- La tecnología del siglo XXI permite acceder rápidamente a datos que pueden ayudar a tomar decisiones y muchos de estos datos son de series temporales.- El comercio electrónico es importante para todos nosotros.- Se puede comprar casi todo; boletos de avión, automóviles, electrónica. libros, flores, acciones, comestibles, etc.-

175 Los minoristas del país notifican a las autoridades cuanto negocio hacen en línea y esta información se utiliza en los informes oficiales mensuales sobre la situación de la economía.- Estos datos se recogen a intervalos sucesivos de tiempo.- Numerosas empresas analizan y venden encuestas y datos estadísticos por Internet.- Para desarrollar planes de marketing, muchas empresas necesitan las características demográficas de los compradores por Internet, así como del resto de los compradores.- Muchas veces las observaciones se miden a sucesivos intervalos de tiempo (anual, mensual, semanal, por día, por horas, etc).- Las universidades estudian la evolución de las cifras de matriculados para comprender mejor sus tendencias.- Un Contador estudia la evolución de las ventas diarias de un comercio que asesora, etc.-

176 Veamos dos ejemplos de gráficos de series temporales.-
Un medico controla semanalmente o mensualmente los análisis de sangre de pacientes con cierta patología.- Para describir gráficamente todos estos ejemplos, se utiliza un grafico de series temporales.- Veamos dos ejemplos de gráficos de series temporales.- El rector de una pequeña universidad privada solicito datos sobre el numero de estudiantes de primer año y sobre el numero de estudiantes procedentes de otras universidades que entraron en la universidad entre 1995 y Los datos fueron:

177 AÑO 1º Año Otras Univ. 1995 460 145 1996 475 165 1997 485 150 1998 1999 486 162 2000 478 147 2001 557 190 2002 545 160 2003 560 140 2004 588 185 2005 575 200

178 Solución En la figura de arriba, podemos ver que el numero de matriculados de primer año ha aumentado desde 2000 y que el máximo que alcanzo el numero de estudiantes procedentes de otras universidades en 2001 fue seguido de un continuo descenso.- El personal de administración debe averiguar cuales son los factores que explican ambas tendencias.-

179 La tabla siguiente muestra las ventas trimestrales realizadas por una empresa durante un periodo de 6 años, desde el 2001 al Describa gráficamente los datos: AÑOS TRIMESTRE 1 2 3 4 2001 271 199 240 255 2002 341 246 245 275 2003 351 283 353 292 2004 401 282 306 291 2005 370 242 281 274 2006 356 304 279

180

181

182 La figura anterior es un grafico de serie temporales de los 24 intervalos de tiempo.- Observamos que las ventas del primer trimestre van seguidas sistemáticamente de una disminución de las ventas en el segundo.- Tal vez la estación del año sea una explicación.- En el estudio de Series de Tiempo se ven modelos para ajustar los datos de las series temporales con el fin de tener en cuenta la estacionalidad, las tendencias, la conducta cíclica o algún otro componente irregular.-

183 Si solo nos interesa comparar las ventas del primer trimestre con las del segundo, puede hacerse un grafico de series temporales como el de la figura siguiente:

184 EJERCICIOS PARA HACER EN CLASE
1.- Construya un gráfico de serie temporales de los siguientes datos sobre uso del teléfono móvil durante el fin de semana o por la noche, en minutos.- Mes Fin de semana o noche Enero 575 Febrero 603 Marzo 469 Abril 500 Mayo 586 Junio 540

185 2.- ¿Qué porcentaje de antiguos alumnos hizo donaciones a su universidad?.- La tabla adjunta muestra los porcentajes que obtuvo una universidad en el período Trace un gráfico de serie temporales de los datos.- ¿Qué medida podría tomar la universidad?.- Año Porcentaje 2001 26.72 2002 27.48 2003 24.89 2004 25.83 2005 30.22 2006 31.14

186 GRAFICOS PARA DESCRIBIR DOS VARIABLES NUMERICAS
RELACIONES ENTRE DOS VARIABLES NUMERICAS

187 En todos los temas anteriores nos hemos ocupado de mostrar gráficamente una única variable.- Estas imágenes nos han ayudado a entender y analizar mejor la información que contenía un gran volumen de datos.- En este apartado ampliamos las medidas graficas para describir las relaciones entre dos variables numéricas.- Aquí elaboramos lo que llamamos los “diagramas de dispersión”, algunos autores los llaman “diagrama de puntos dispersos” o “nube de puntos”.- Los analistas empresariales y economistas a menudo se refieren a relaciones entre variables numéricas.-

188 Por ejemplo, ¿Cuánto varia la cantidad vendida cuando varia el precio
Por ejemplo, ¿Cuánto varia la cantidad vendida cuando varia el precio?, ¿obtienen mejores clasificaciones medias en la universidad los alumnos que tienen mejores notas en los exámenes de ingreso?, ¿aumenta la publicidad las ventas?, ¿Cómo influye en las ventas los ingresos total de las familias de la región?.....etc.- En estos ejemplos, observamos que una variable puede depender de alguna medida de la otra variable, es decir que tenemos pares de valores que llamamos X e Y.- Por ejemplo, los montos de ventas puede depender de cuanto se haya gastado en publicidad.- En este caso llamamos a la variable Y dependiente y a la X independiente.-

189 El diagrama de dispersión, es una imagen que muestra a menudo la relación entre las dos variables.-
Podemos trazar un diagrama de dispersión, localizando un punto por cada par de dos variables que representan una observación del conjunto de datos.- Nos muestra: El rango de cada variable.- La pauta de valores existentes dentro del rango.- Una sugerencia sobre la posible relación entre las dos variables.- Una indicación de los casos atípicos (puntos muy extremos).- Veamos un ejemplo:

190 Notas de los exámenes de admisión en las universidades en los EEUU y las calificaciones media de los estudios universitarios.- ¿Son las notas obtenidas en la prueba de matemáticas del SAT para acceder a la universidad un buen indicador de éxito en la universidad?.- En los EEUU, todos los estudiantes realizan uno o mas test de aptitud para ingresar en una universidad.- El personal de admisiones de las universidades utilizan los resultados para admitir o no a los estudiantes.- En la tabla siguiente se muestra las notas obtenidas en la prueba de admisión por una muestra aleatoria de 11 estudiantes de una

191 pequeña universidad del oeste, y la calificación media obtenida al terminar los estudios universitarios.- Trace un diagrama de dispersión y comente que información le suministra.- Los datos fueron: Nota de matemáticas en el SAT.- 450 480 500 520 560 580 590 600 620 650 700 3,25 2,60 2,88 2,85 3,30 3,10 3,35 3,20 3,50 3,59 3,95 Calificación media en los estudios universitarios.-

192

193 Hemos utilizado un programa Minitab, para hacer el diagrama, hoy todos los paquetes tienen este grafico, incluso Excel.- Observamos que las calificaciones medias van desde alrededor de 2,5 hasta 4 y las notas de matemáticas van desde 450 hasta Una interesante pauta es la tendencia ascendente positiva; las calificaciones medias tienden a aumentar directamente con los aumentos de las notas obtenida en la prueba de matemáticas.- Observe también que la relación no suministra una predicción exacta.- Algunos estudiantes que obtienen una baja nota en la prueba de matemáticas tiene una calificación media mas alta que los estudiantes que obtienen una nota mejor en la prueba de matemáticas.- Vemos que la pauta básica indica que las notas mas altas obtenidas en los exámenes de admisión predicen mayores calificaciones medias pero los resultados no son perfectos.-

194 EJERCICIO PARA HACER EN CLASE.-
Una empresa de bienes de consumo ha estado estudiando la influencia de la publicidad en los beneficios totales.- Se han recogido como parte del estudio datos sobre los gastos publicitarios (en miles) y las ventas totales (en miles) de un periodo de 10 meses y son los siguientes: Gastos 10 15 7 12 14 18 9 13 16 17 Ventas 100 200 80 120 150 270 160 220 170 240 Muestre esta información en un diagrama de dispersión y comente.-

195 PRESENTACION DE VARIABLE NUMERICA EN TABLAS Y GRAFICOS

196 Hemos dicho que cuando la variable en estudio es numérica debemos distinguir entre variable discreta y continua.- Además debemos tener en cuenta que en este caso vamos a estudiar una sola variable numérica por vez, es decir distribuciones unidimensionales.- Otra cosa que debemos tener en claro es que según la cantidad de datos que forman nuestra población o muestra según con lo que hayamos decidido trabajar, a estos los podemos tratar como: Datos sin agrupar (pocos) b1) Sin intervalos (discreta) Datos agrupados (muchos) b2) Con intervalos (continua)

197 a) DATOS SIN AGRUPAR.- Vamos a verlo mediante un ejemplo.- Supongamos que el Gerente de un Supermercado esta interesado en saber que cantidad de gente entra a el durante la siesta (13 a 16 horas).- Tomamos una muestra de 80 días y contamos la gente que entró en ese horario al Supermercado.- Resultaron los siguientes valores: 4 5 2 6 7 3 8

198 ¿Qué comentario puede hacer el alumnos?
Podemos ordenarlos en forma creciente y algo podemos decir: 2 3 4 5 6 7 8 ¿Qué comentario puede hacer el alumnos?

199 Un gráfico que se suele hacer cuando los datos no son muchos es el “gráfico de puntos” o Dotplot.-

200 b1) Datos agrupados sin intervalos.- Variable discreta.-

201 Vamos a verlo mediante un ejemplo
Vamos a verlo mediante un ejemplo.- Supongamos que el Gerente de un Supermercado esta interesado en saber que cantidad de gente entra a el durante la siesta (13 a 16 horas).- Tomamos una muestra de 80 días y contamos la gente que entró en ese horario al Supermercado.- Resultaron los siguientes valores: 4 5 2 6 7 3 8

202 En el analizamos toda la cuarta fila.-
Xi = cantidad de personas que entraron en ese horario.- Xi variable discreta.- Agrupamos en una tabla que llamamos DISTRIBUCIÓN DE FRECUENCIA.- Xi Conteo fi hi Fi Hi Fi% 2 III 3 0,0375 0.0375 3,75 IIIIIIII 8 0,1000 11 0.1375 13.75 4 IIIIIIIIIIIIIII 15 0,1875 26 0.3250 32,50 5 IIIIIIIIIIIIIIIIII 18 0,2250 44 0.5500 55,00 6 IIIIIIIIIIIIIIIIIIIIII 22 0,2750 66 0.8250 82,50 7 IIIIIIIII 9 0,1125 75 0.9375 93,75 IIIII 0,0625 80 1.0000 100,0 TOTAL 1,0000 ------ En el analizamos toda la cuarta fila.-

203 Xi = es la variable en estudio, me indica cantidad de personas, 5.-
fi = hay 18 días que entraron 5 personas.- hi = el 22,5 % de los días entraron 5 personas.- Fi = hay 44 días que entraron entre 2 y 5 personas.- Fi = el 55,0% de los días entraron entre 2 y 5 personas.- Si decidimos mostrar gráficamente esta distribución será por medio de un GRAFICO DE BASTONES.- 25 20 15 10 5 Cantidad personas Días

204 b2) Datos agrupados con intervalos.- Variable continua.-

205 a) Sacamos la cantidad de Intervalos ( I ) haciendo:
Para agrupar los datos en una distribución de frecuencia con intervalos, debemos pensar varias cosas, como cuantos intervalos vamos a hacer, que amplitud usamos, etc.- Se recomienda no usar menos de 5 ni más de 15 intervalos.- Cuando agrupamos los datos en intervalos, perdemos la individualidad del dato.- a) Sacamos la cantidad de Intervalos ( I ) haciendo: ≥ n Donde k nos indica la cantidad de intervalos a realizar.- k

206 b) Amplitud a utilizar:
Rx = rango o recorrido de la variable. Rx =Xi máximo Xi mínimo Ci = amplitud Ci = Rx / I Debemos ahora determinar con que valor de variable empezamos los intervalos, para ello definimos el siguiente criterio: Li ≤ Xi < Ls Tomamos el dato donde es límite inferior.-

207 Veamos esto con un ejemplo
Veamos esto con un ejemplo.- Supongamos tener las ventas (en $ por 100) de cierto comercio.- Se observo una muestra de 30 días.- Estas fueron: 61 88 70 76 66 79 64 75 78 80 60 74 68 65 52 72 58 86 94 I = 5 Rx = = 42 Ci = 42 / 5 = 8,4 ≈ 9

208 La distribución de frecuencia será:
Li - Ls Conteo fi hi Fi Hi Fi % III 3 0,100 0.1000 10,0 IIIIII 6 0,200 9 0.3000 30,0 IIIIIIIIIIIIIII 15 0,500 24 0.8000 80,0 88 IIII 4 0,133 28 0.9300 93,0 97 II 2 0,067 30 1.0000 100,0 TOTAL 1,000 ----

209 fi = 15 Significa que durante 15 días vendió entre 70 y 79 pesos.-
hi = 0, El 50% de los días vendió entre 70 y 79 pesos.- Fi = 24 días vendió entre 52 y 79 pesos.- Fi % = 80.0 %.- El 80% de los días vendió entre 52 y 79 pesos.-

210 Representación gráfica de una distribución de frecuencia con intervalos
HISTOGRAMA POLIGONO DE FRECUENCIA OJIVA O GRAFICO DE Fi %

211 Comentarios sobre los gráficos de una distribución de frecuencia con intervalos.-

212 HISTOGRAMA Es un gráfico de barras verticales adyacentes y me muestra la forma en que se distribuyen los datos que estamos estudiando.- Todas las barras tienen el mismo ancho y se diferencia en la altura que corresponde a cada frecuencia absoluta o frecuencia relativa del intervalo.- El histograma nos muestra como están repartidos los datos.- Por ejemplo si estamos analizando ventas de un comercio y nos encontramos con Histogramas de las siguientes formas:

213

214

215

216 POLIGONO DE FRECUENCIA
Es un gráfico lineal.- Los puntos medios de los intervalos representa los datos de ese intervalo.- Me cuenta lo mismo que el histograma, como se distribuyen mis datos.- Es apropiado cuando se quieren comparar distribuciones, ya que pueden encimarse dos polígonos con distintas tramas.-

217 OJIVA O GRAFICO DE FRECUENCIA ACUMULADA Con este gráfico podemos calcular alguna medidas descriptivas, además, podemos decir que porcentaje de observaciones son menores a cierto valor de variable.-

218 Veamos estos tres gráficos en el ejemplo que venimos viendo sobre las ventas de un comercio.

219 HISTOGRAMA

220 POLIGONO DE FRECUENCIA CON EL HISTOGRAMA

221 POLIGONO DE FRECUENCIA SIN EL HISTOGRAMA

222 OJIVA O GRÁFICO DE FRECUENCIA ACUMULADA

223 VEAMOS UN EJEMPLO DE DOS DISTRIBUCIONES:

224 Suponga que decide llevar a cabo un estudio comparativo del costo de una comida en un restaurante de una gran ciudad con el de una comida similar en un restaurante fuera de la ciudad.- CIUDAD 50 38 43 56 51 36 25 33 41 44 34 39 49 37 40 35 22 45 14 27 31 48 30 42 26 32 63 52 23 53 FUERA DE LA CIUDAD 37 29 38 39 36 44 27 24 34 23 30 32 25 43 31 26 41 28 33 51 48 55

225 C:\Archivos de programa\InfoStat\datos\Mauri. Precio comida 2007
C:\Archivos de programa\InfoStat\datos\Mauri. Precio comida 2007.IDB2: 16/06/07 - 6:42:25 Tablas de frecuencias Variable Clase LI LS MC FA FR FAA FRA Ciudad ,00 20,00 15, , ,02 Ciudad ,00 29,00 24, , ,12 Ciudad ,00 38,00 33, , ,46 Ciudad ,00 47,00 42, , ,74 Ciudad ,00 56,00 51, , ,98 Ciudad ,00 65,00 60, , ,00

226

227

228

229 C:\Archivos de programa\InfoStat\datos\Mauri. Precio comida 2007
C:\Archivos de programa\InfoStat\datos\Mauri. Precio comida 2007.IDB2: 16/06/07 - 6:42:25 Tablas de frecuencias Variable Clase LI LS MC FA FR FAA FRA Fuera ,00 26,00 23, , ,20 Fuera ,00 32,00 29, , ,52 Fuera ,00 38,00 35, , ,80 Fuera ,00 44,00 41, , ,92 Fuera ,00 50,00 47, , ,94 Fuera ,00 56,00 53, , ,00

230

231 frecuencia absoluta fuera de la ciudad 16,80 12,60 8,40 4,20 0,00 14
26 32 38 44 50 56 62 fuera de la ciudad

232

233 OTRA FORMA DE TRABAJAR ESTAS DOS DISTRIBUCIONES
TRABAJAREMOS LAS DOS DISTRIBUCIONES SOBRE LOS MISMOS INTERVALOS DE CLASE

234 Exploramos un poco los datos, porque tratamos de elaborar una sola distribución de frecuencia para las dos distribuciones.- Observamos que una de las distribuciones el recorrido de la variable va desde 14 $ a 63$ y en la otra desde 23$ a 55$.- Podemos modificar el menor valor y llevarlo a 10$ y usar una amplitud de intervalo igual a 5$.- Elaboramos tantos intervalos como para cubrir nuestro valor máximo de variable.- La distribución de frecuencia quedara de la siguiente manera, realizamos el conteo y obtenemos las frecuencias absoluta.-

235 Frecuencia Fuera de la ciudad
Costo por comida en $ Frecuencia Ciudad Frecuencia Fuera de la ciudad 15 1 20 25 2 4 30 3 13 35 7 40 14 12 45 8 50 5 55 60 65 TOTAL

236 La distribución de frecuencia permite obtener conclusiones acerca de las características principales de los datos.- Por ejemplo, la tabla anterior muestra que el costo de las comidas en los restaurantes de la ciudad está concentrado entre los 30 y 55$, en comparación con las comidas en los restaurante fuera de la ciudad, los cuales están concentrado entre 25 y 40$.- Si el conjunto de datos no contiene muchos valores, un conjunto de límites de clase refleja una imagen diferente de la que da otro conjunto de límites.- Siempre es conveniente no tener demasiados datos en cada intervalo.- Por fortuna, conforme aumenta el tamaño de la muestra, las alteraciones en la selección de los límites de clase afectan cada vez menos la concentración de los datos.-

237

238 DISTRIBUCION DE FRECUENCIAS RELATIVAS Y DISTRIBUCIÓN DE PORCENTAJES.-

239 Costo por comida en $ Ciudad Fuera de la ciudad Frecuencia Relativa Porcentaje Frecuencia Relativa 15 0,02 2,00 0,00 20 25 0,04 4,00 0,08 8,00 30 0,06 6,00 0,26 26,00 35 0,14 14,00 40 0,28 28,00 0,24 24,00 45 0,16 16,00 50 0,10 10,00 55 60 65 TOTAL 1,00 100,0

240 A partir de la tabla anterior, se concluye que las comidas cuestan más en los restaurantes de la ciudad que en los de fuera de ella; el 16 % de las comidas en los restaurantes de la ciudad cuestan entre 50 y 55$, en comparación con el 4 % de los restaurantes de las afuera de la ciudad; mientras que solo el 6 % de las comidas en los restaurantes de la ciudad cuestan entre 25 y 30$ en comparación con el 26 % de los restaurantes fuera de la ciudad.-

241

242 DISTRIBUCION DE FRECUENCIA ABSOLUTAS ACUMULADAS Y
DE FRECUENCIAS ABSOLUTAS ACUMULADAS PORCENTUALES

243 Costo por comida en $ Ciudad Fuera de la ciudad Frecuencia Abs. Acum. Porcentaje 15 1 2,0 0,0 20 25 3 6,0 4 8,0 30 6 12,0 17 34,0 35 13 26,0 60,0 40 27 54,0 42 84,0 45 70,0 46 92,0 50 80,0 47 94,0 55 48 96,0 49 98,0 60 100,0 65 TOTAL ············· ·················· ················

244 La distribución de porcentaje acumulado constituye una manera de presentar la información del porcentaje de los valores que están por debajo de cierto valor.- Por ejemplo, tal vez se desea conocer que porcentaje de las comidas de los restaurantes de la ciudad cuestan menos de 20$, menos que 30$ , y así sucesivamente, etc.- La distribución acumulativa muestra claramente que los costos de la comida son inferiores en los restaurantes de afuera de la ciudad que los de la ciudad propiamente dicha; en el 34% de los restaurantes de afuera cuesta menos de 30$, en comparación con solo el 12% de los restaurantes de la ciudad; en el 60% de los restaurantes de las afuera cuesta menos de 35$ en comparación solo el 26% de los restaurantes de la ciudad, etc, etc.-

245

246 ANALISIS EXPLORATORIO DE DATOS.-

247 Las técnicas del análisis exploratorio de datos consisten en operaciones aritméticas sencillas y gráficas fáciles de trazar, que pueden emplearse para resumir con rapidez los datos.- Una técnica de explorar los datos que son objeto de nuestro estudio y que hoy trae casi todos los paquetes estadísticos de computación es el llamado DIAGRAMA DE TALLO Y HOJA.- La importancia de este diagrama es que no perdemos el dato original, cosa que nos sucede con las distribución de frecuencia con intervalos.- El diagrama es una herramienta valiosa y versátil para organizar un conjunto de datos y entender la distribución y agrupación de los valores dentro del intervalo de observaciones en el conjunto.- Generalmente el primer dígito forma el tallo y el resto las hojas.- Veamos un ejemplo sencillo.-

248 Suponga que las calificaciones en un parcial de ESTADÍSTICA de 40 alumnos fueron las siguientes:
42 46 87 34 81 64 69 75 73 91 70 86 67 49 55 74 37 21 29 59 60 77 47 68 65 97 57 66 90 82 94

249 MEDIDAS DESCRIPTIVAS QUE RESUMEN A LOS DATOS

250 Hasta este punto, hemos analizado la presentación de datos categóricos y numéricos en forma tabular y gráfica.- Aunque la presentación de datos es una componente esencial de la estadística descriptiva, la tarea no termina ahí.- Dentro del manejo de la información numérica, un buen análisis de los datos no se limita a la presentación de datos y la observación de lo que estos tratan de transmitir, también abarca los cálculos y el resumen de las características importante y el análisis de lo que contienen.-

251 MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE DISPERSION O DE VARIABILIDAD
LAS MEDIDAS DESCRIPTIVAS ESTADISTICAS QUE CARACTERIZAN A UNA MUESTRA O A UNA POBLACION SON: MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE ORDEN MEDIDAS DE FORMA MEDIDAS DE DISPERSION O DE VARIABILIDAD

252 MEDIDAS DE TENDENCIA CENTRAL.-
MEDIA ARITMETICA X MEDIANA Me MEDIA PONDERADA XP MODO MO MEDIA GEOMETRICA XG MEDIA ARMONICA XA

253 MEDIDAS DE ORDEN CUARTILES QR PERCENTILES PR % RANGO DEL PERCENTIL RP (xi)

254 MEDIDAS DE DISPERSION O DE VARIABILIDAD
RANGO O RECORRIDO RX VARIANCIA S²X RANGO INTERCUARTILICO COEFICIENTE DE VARIACION CVX DESVIO ESTANDAR SX

255 MEDIDAS DE FORMA ASIMETRIA AS CURTOSIS CR

256 MEDIDAS DE TENDENCIA CENTRAL

257 MEDIA ARITMETICA , también llamada Media:
Es el promedio y es la medida de tendencia central que se utiliza con mayor frecuencia.- Se calcula con la suma de todas las observaciones en un conjunto de datos, dividida entre el número de elementos involucrados.- Si estamos trabajando con una muestra aleatoria de la población en estudio estamos calculando un ESTADISTICO, que será: ∑ xi x = n Si estamos trabajando con la población y nos piden la media, calculamos un PARAMETRO, por ejemplo:

258 a) Media aritmética para datos sin agrupar.
Si tenemos un Comercio con seis empleados, cuyos sueldos mensuales son 1800, 1760, 1780, 2100, 1980, 2350 y queremos observar el sueldo promedio será: ∑ xi = 1961,7 $ μ = = N 6 El sueldo mensual promedio de los empleados es de 1962 $.- a) Media aritmética para datos sin agrupar. Cuando es muy pequeño el número de elementos de la serie u observaciones recogidas, puede hacerse innecesario la agrupación de los datos por frecuencia e intervalos. Por ejemplo: Se tienen los montos de ventas de un comercio durante 14 meses seleccionados al azar- Los datos resultantes fueron: (por 100 $)

259 b) Media aritmética para datos agrupados sin y con intervalos.-
Observamos que, la media aritmética será: ∑ xi x = = = 134,71  135 $.- n Significa que el promedio de ventas en los 14 meses fue de 135 pesos.- b) Media aritmética para datos agrupados sin y con intervalos.- La fórmula es la misma.- La diferencia va estar dada en el valor de la variable xi.- En la distribución sin intervalos esta será los valores originales de la variable, en cambio en datos agrupados con intervalos, los valores de la variable serán los puntos medios de los intervalos.- ∑ xi * fi x = n

260 Veamos un ejemplo.- Supongamos que tenemos los tiempos en minutos que demora un Contador Bancario en auditar una muestra de 50 créditos solicitados- Presentamos los datos ordenados en una distribución de frecuencia, Li Ls fi xi xi * fi TOTAL El promedio que demora el Contador en auditar un Crédito es de 26 minutos.- ∑ XI * fi X = = n 1324 = = 26,48 50  26 minutos

261 MEDIANA.- Se la simboliza con Me .- La mediana me divide mis observaciones en dos partes iguales.- La mediana es aquel valor de la variable que un 50% de los datos es igual a ella o menor.- Nº IMPAR DE DATOS a) PARA DATOS SIN AGRUPAR Nº PAR DE DATOS Lo primero que debemos hacer es ordenar los datos en forma crecientes.-

262 Mº = (n + 1) / 2 = 16 / 2 = 8ª posición
a1) Nº IMPAR DE DATOS.- Supongamos tener los tiempos que un empleado durante 15 días tiene que esperar el ómnibus para llegar al trabajo.- Estos son: Mº = (n + 1) / 2 = 16 / 2 = 8ª posición Me = 10 minutos a2) Nº PAR DE DATOS.- En el ejemplo anterior supongamos tener datos durante 14 días.- Mº = (n + 1) / 2 = 15 / 2 = 7,5 ª posición Me = = 12,5 minutos 2

263 b1) MEDIANA PARA DATOS AGRUPADOS SIN INTERVALOS.-
Supongamos tener la cantidad de accidentes automovilísticos por mes en cierta localidad.- Se registraron datos correspondientes a 60 meses.- xi fi F i F i % ,7 ,7 ,3 ,7 ,3 ,7 ,0 Total Buscamos la menor Fi % que me contiene al 50 %.- Observamos ahora que valor de variable le corresponde: Me = 2 accidentes

264 b2) MEDIANA PARA DATOS AGRUPADOS EN INTERVALOS.-
Supongamos tener las notas de un parcial del Estadística de una muestra de 50 alumnos.- Los datos agrupados en una tabla de frecuencia con intervalo fueron: Li Ls fi Fi Fi % 44 2 4,0 12 14 28,0 60 15 29 58,0 68 18 47 94,0 76 3 50 100,0 Total ----- ------ Me = * 8 = 15 Me = 57,87 ≈ 58 puntos.-

265 MODO Se lo simboliza con Mo.- Es el valor de la variable que más veces se repite.- Es la única medida descriptiva que podemos calcular en una variable cuya medición esta en escala nominal.- MODO PARA DATOS SIN AGRUPAR Por ejemplo si tenemos los montos de ingresos quincenales de un grupo de empleados de una empresa, 850 – 875 – 856 – 882 – 875 – 880 – 896 – 810 – 875 – Observamos el valor de variable que más veces se da: M o = 875 $

266 MODO PARA DATOS AGRUPADOS SIN INTERVALOS.-
Supongamos que en el relevamiento de 50 empleados de una empresa, se les pregunto la cantidad de niños en edad escolar que tienen.- Resulto la siguiente tabla: xi fi 2 5 3 12 4 18 9 6 TOTAL 50 Observamos la mayor frecuencia absoluta.- El valor de variable que le corresponde es el modo.- Mo = 4 niños en edad escolar

267 MODO PARA DATOS AGRUPADOS CON INTERVALOS.-
Supongamos que tenemos una muestra de 72 notas de un parcial de Estadística que se les tomo a un curso integrado por 200 alumnos.- Estas fueron las siguientes: Li Ls fi 46 4 56 9 66 18 76 23 86 11 96 7 TOTAL 72 d1 = fi - fi-1 = = 5 d2 = fi - fi+1 = = 12 5 Mo = * 10 = = 68,94 ≈ 69 puntos.-

268 USO DE LAS DISTINTAS MEDIDAS DE TENDENCIA CENTRAL

269 Cuando se tiene datos de escalas intervalares o proporcionales, en general se utiliza la media porque, es una medida que atiende en forma exhaustiva toda la información disponible: los valores, las distancias y proporcionalidad entre ellos y la frecuencia de cada uno. Hemos visto que el modo solo atiende a las frecuencias y la mediana solo utiliza el orden expresado por los valores numéricos y no atiende el valor de las observaciones extremas. La media tiene importantes propiedades matemáticas, lo que no la mediana y el modo, y esto se irá observando a medida que avancemos en el estudio de la estadística. El modo en escala intervalar, se utiliza para una primera estimación rápida de la tendencia central, puesto que se determina fácilmente, sin necesidad de cálculo alguno, con solo observar la tabla de distribución de frecuencia.

270 Cuando se tiene datos de escalas intervalares o proporcionales, en general se utiliza la media porque, es una medida que atiende en forma exhaustiva toda la información disponible: los valores, las distancias y proporcionalidad entre ellos y la frecuencia de cada uno. Hemos visto que el modo solo atiende a las frecuencias y la mediana solo utiliza el orden expresado por los valores numéricos y no atiende el valor de las observaciones extremas. La media tiene importantes propiedades matemáticas, lo que no la mediana y el modo, y esto se irá observando a medida que avancemos en el estudio de la estadística. El modo en escala intervalar, se utiliza para una primera estimación rápida de la tendencia central, puesto que se determina fácilmente, sin necesidad de cálculo alguno, con solo observar la tabla de distribución de frecuencia.

271 El modo interviene en él cálculo de algunas medidas de asimetría.-
La mediana en escalas intervalares es recomendada cuando en un conjunto de dato, existen uno o unos pocos datos extremos que son incomparables con el resto de los datos. La mediana en escalas intervalares es recomendada cuando en un conjunto de dato, existen uno o unos pocos datos extremos que son incomparables con el resto de los datos. La mediana no se ve afectada por los valores extremos, mientras que la media es muy sensible a estos valores y por lo tanto en estos casos la mediana es el valor que mejor me representa los datos.- La mediana no se ve afectada por los valores extremos, mientras que la media es muy sensible a estos valores y por lo tanto en estos casos la mediana es el valor que mejor me representa los datos.- Las medidas de tendencia central como ya hemos dicho, son índices que permiten resumir un conjunto de datos en una sola expresión, de modo que se pueda apreciar mejor el significado de los datos. Las medidas de tendencia central como ya hemos dicho, son índices que permiten resumir un conjunto de datos en una sola expresión, de modo que se pueda apreciar mejor el significado de los datos. Las medidas de tendencia central como cualquier estadística, cobran sentido cuando las empleamos para hacer comparaciones u otras operaciones. Las medidas de tendencia central como cualquier estadística, cobran sentido cuando las empleamos para hacer comparaciones u otras operaciones.

272 Cuando se tiene una distribución de frecuencias con intervalos abiertos, no puede calcularse la media y en estos casos se elige como mejor medida la mediana ya que en su cálculo solo participa el intervalo mediano. Cuando la forma de la distribución de frecuencia es asimétrica ya sea a izquierda o derecha, la mejor medida de tendencia central es la mediana ya que se encuentra entre las otras dos, media y modo.- Si es simétrica, como las tres medidas son iguales, se puede elegir cualquiera y en esos casos se prefiere la media, dependiendo esto del tipo de investigación que se haya planificado.- Mucho se podría seguir profundizando sobre estas medidas y los procedimientos para su cálculo, pero se considera que hoy en día no tiene mucho sentido. Hoy hay sistemas de computación estándar preparados para el análisis estadístico de datos y es muy importante que el alumno vaya tratando de conocerlas y usarlas.-

273 EJERCICIOS PARA HACER EN CLASE
1.- Diez economistas recibieron el encargo de predecir el crecimiento porcentual que experimentará el índice de precio al consumidor el próximo año.- Sus predicciones fueron: 3, , , , , , ,4 3,0 3, ,4 Calcule y explique la media, mediana y modo.- 2.- Una consultora, elige al azar 10 grandes negocios de ventas minoristas de una zona de cierta ciudad, para analizar las ventas alcanzadas este año en las navidades.- Observo respecto al año anterior los siguientes incrementos porcentuales: 10, , , , , , , , , ,3 Calcule media, mediana, modo y comente sobre la forma de la distribución.-

274 3.- Un estudio de investigación sobre las ventas diarias de una muestra aleatorias de días del 2008 (en miles) de un comercio fueron las siguientes: 7.1 7.2 7.6 7.9 8.1 8.3 8.4 8.9 9.0 9.1 9.4 9.6 9.9 10.1 10.2 10.3 10.5 10.7 11.0 11.1 11.2 12.0 13.6 14.7 14.9 15.5 Diga cual es la variable en estudio, tipo y nivel de medición.- Agrupe los datos en una distribución de frecuencia.- Calcule la media, mediana y modo.- Comente sobre la forma de la distribución comparando medidas.-

275 4.- Un estudio de investigación sobre los sueldos anuales de empleados de una empresa papelera, fueron los que mostramos en Minitab, y del calculo surge: Descriptive Statistics: Sueldos anuales Variable Media Mínimo Mediana Máximo Sueldos anuales Comente que le dicen las medidas que calculo.- Comparando medidas que le dicen sobre la forma de la distribución, y que le dice respecto a los sueldos.-

276 Calcule y explique la media muestral.- Calcule y explique la mediana.-
5.- Los porcentajes de la remuneración total correspondientes al pago de planes de una muestra de 12 ejecutivos son los siguientes; Calcule y explique la media muestral.- Calcule y explique la mediana.- Comente sobre estos datos.- 15,8 17,3 28,4 18,2 15,0 24,7 13,1 10,2 29,3 34,7 16,9 25,3

277 6.- En una muestra aleatoria de 8 semanas se observo que una agencia de cruceros recibía el siguiente número de programas semanales especiales de cruceros al caribe: Calcule la media, mediana y modo.- ¿Qué medida de tendencia central describe mejor a loa datos?.- 7.- Las edades de una muestra de 12 estudiantes matriculados en un curso de Macroeconomía fueron las siguientes: Calcular la media, mediana y modo.- Que forma tiene la distribución?.- Comente.-

278 Halle las medidas de tendencia central.- Comente.-
8.- Un fabricante de radios portátiles obtiene una muestra de 55 radios de la producción de una semana.- Las radios se examinaron minuciosamente y el número de defectos encontrados fue el siguiente: Nº defectos: Nº de radios: Halle las medidas de tendencia central.- Comente.- Cual sería la forma de la distribución.- Explique.- 9.- En el análisis del número de reclamaciones mensuales en una casa de ventas de artefactos eléctricos arrojo los siguientes resultados para 13 semanas; Calcules las medidas de tendencia central.- Comente sobre la distribución.-

279 Que le están diciendo cada medida en el ejercicio.-
10.- Se tiene información de las tasaciones (en porcentaje) que se hicieron en el 2005 de una muestra aleatoria de 40 solares de una zona comercial.- Los valores arrojaron los siguientes resultados: Media = 28, Min = Max = 36 Mediana = 28, Modo = 28 Que le están diciendo cada medida en el ejercicio.- Describa la asimetría o no de los datos.- 11.- Una muestra de 33 alumnos de contabilidad anotó el número de horas dedicadas a estudiar la materia de la asignatura durante la semana anterior al examen final.- Los datos arrojaron las siguientes medidas: Media = 8, Mín = Máx = Me = 9,0 Modo = 9,0 Asimetrí = 1, a) Describa los datos.- b) Comente el sesgo

280 MEDIA ARITMETICA PONDERADA
Cuando calculamos la Media, se asume que cada observación era de igual importancia.- Sin embargo, en ciertos casos, puede querer darse mayor peso a algunas observaciones.- Se la calcula haciendo: ∑ xi Wi Xp = ∑ Wi Donde Xp es la media ponderada.- xi es la observación individual Wi es el peso o ponderación asignada a cada observación

281 Utilidad por pote (X) en Volumen de ventas en potes (W)
Ejemplo de media ponderada.- Supongamos que el Supermercado Alfa vende cinco tipos de detergentes.- En la tabla siguiente se muestra cada tipo junto con la utilidad por pote y el número de potes vendidos.- Detergente Utilidad por pote (X) en $ Volumen de ventas en potes (W) Xi * Wi A 2,00 3 6,00 B 3,50 7 24,50 C 5,00 15 75,00 D 7,50 12 90,00 E TOTAL 24,00 52 285,50

282 Se puede calcular la media simple de la utilidad del Supermercado como 24,00/ 5 = 4,80 $ por pote.-
Sin embargo, probablemente este no sea un buen estimado de la utilidad promedio del Supermercado respecto a detergentes, debido a que vende más de algunos tipos de detergentes que de otros.- Para obtener un estado financiero más representativo del desempeño real de su negocio, el Gerente del Supermercado debe dar más peso a los tipos más populares de detergentes.- Por lo tanto el calculo más apropiado sea el de la media ponderada: ∑ xi Wi ,50 Xp = = = $ 5,49 ∑ Wi La media ponderada es mayor que la media simple porque el Supermercado vende más detergentes de los tipos que tienen un margen de utilidad mayor.-

283 EJERCICIO PARA HACER EN CLASE
1.- La tabla siguiente, contiene el tamaño de la población y la renta personal per capita de una muestra aleatoria de cinco ciudades importantes de una provincia de cierto país.- Calcule la renta personal per capita media del Ciudad Población Renta personal per capita A 125867 32989 B 122674 29758 C 120745 33322 D 127342 26852 E 128456 29764 TOTAL 625084 152685

284 2.- Un empresario Luís Varesi SA es dueño de tres fabricas que están localizadas en La Rioja, Córdoba y San Juan.- En La Rioja tiene 270 empleados cuya edad promedio es 42 años, 320 empleados con edad promedio 47 años y 200 empleados con edad promedio 38 años, respectivamente.- Se pregunta cual es la edad promedio de los empleados que ocupa el empresario Varesi.- Empresa Edad promedio Cantidad de empleados A.- La Rioja 42 270 B.- Córdoba 47 320 C.- San Juan 38 200 TOTAL 127 790

285 MEDIA GEOMETRICA Xg = x1 . x2 ……..xn = (x1 .x2…..xn)
Otra medida de la tendencia central que es importante en las empresas y en economía, pero que a menudo se pasa por alto es la media geométrica.- Los analistas de empresas y los economistas que tienen interés en saber cual es el crecimiento en una serie de periodos de tiempo utilizan la media geométrica.- Entre las aplicaciones de la media geométrica en las finanzas, se encuentran el interés compuesto a lo largo de varios años, el crecimiento de las ventas totales y el crecimiento de la población.- Una importante cuestión es el crecimiento anual medio que provoca un cierto crecimiento total en varios años.- La media geométrica, Xg , es la n- raiz del producto de n elementos: Xg = x1 . x2 ……..xn = (x1 .x2…..xn) n 1/n

286 La media geométrica se utiliza para hallar el crecimiento medio de varios productos, dado el crecimiento compuesto de cada producto.- Por ejemplo, la media geométrica de: 1, , , , es Xg = ( 1, , , ,06) = 1,0571 1/4 Veamos un ejercicio: Hallar la tasa de crecimiento suponiendo que las ventas han crecido un 25 por ciento en 5 años.-

287 Solución La tentación intuitiva, pero ingenua, es dividir simplemente el crecimiento total, 25 por ciento, por el numero de periodos, 5 y concluir que la tasa media de crecimiento es del 5 %.- Este resultado es incorrecto porque no tiene en cuenta el efecto compuesto del crecimiento.- Suponiendo que la tasa anual de crecimiento es realmente del 5 por ciento, en ese caso, el crecimiento total de 5 años será: (1, , , , ,05 ) = 1,2763 o sea un 27,63 %.- Sin embargo, la tasa anual de crecimiento r, que daría un 25 % en cinco año, debe satisfacer esta ecuación: ( r) = 1,25 Primero hallamos la media geométrica: Xg = 1 + r = (1,25) = 1,046 La tasa de crecimiento es r = 1,046, o sea 4,6 por ciento.- 5 1/5

288 Veamos otro ejemplo: Suponga que recibe un aumento de sueldo de 5% este año y recibirá uno de 15% el año próximo.- El aumento porcentual promedio es de 9,886 % y no 10,0.- ¿Por qué?.- Comience calculando la media geométrica.- Recuerde por ejemplo, que un aumento de 5% en el sueldo es 105 o bien 1,05.- Usaremos 1,05.- Xg = 1, ,15 = 1,09886 Lo anterior se puede verificar suponiendo que su ingreso mensual inicial era de 3000$ y que recibió dos aumentos de 5 % y 15 %.- Aumento 1 = 3000,0 (0,05) = 150,0$ Aumento 2 = 3150,0 ( 0,15) = 472,50 $

289 Donde , ,50 = 622,50 $ El aumento total en el sueldo es de 662,50 $.- Esto equivales a: 3000, (0,09886) = 296,58 $ 3296, (0,09886) = 325,90 $ Donde 296, ,90 = 622,48 $ Veamos otro ejemplo: Las ganancias obtenidas por la constructora Alfa SRL en cuatro proyectos recientes fueron de 3%, 2%, 4% y 6%.- ¿Cuál es la media geométrica de la ganancia?.- Solución

290 La media geométrica es de 3,46%, que se obtiene de hacer:
Xg = = La media aritmética de las utilidades es de 3,75% que se obtiene de sumar los cuatro valores y dividir por 4.- Aunque la ganancia del 6% no es extremadamente grande hace que la media aritmética se eleve.- La media geométrica de 3,46, da una cifra mas conservadora, ya que no esta siendo afectada por el valor grande.- De hecho, siempre será menor que o igual a la media aritmética.- 4 4

291 Un segundo uso de la media geométrica es encontrar aumentos porcentuales promedios en un intervalo de tiempo.- Por ejemplo, si se ganaron dólares al año, en 1990, y dólares en el año 2000, ¿Cuál es la tasa de aumento en el periodo?.- La tasa de aumento se determina mediante la siguiente formula: n Valor al final del periodo - 1 Xg = Valor al inicio del periodo En la formula el n es el numero de periodos.-

292 Un ejemplo ficticio, mostrara los detalles para encontrar el aumento porcentual promedio anual.-
Supóngase que la población de un puesto es de 2 habitante en 1991 y en 2001 era de 22 habitantes.- ¿Cuál fue la tasa de crecimiento anual promedio para ese periodo?.- Xg = = 1, = 0,2710 El valor final es 0, De modo que la tasa de aumento anual es de 27,1 %.- Es decir que el puesto tuvo una tasa de crecimiento de la población de 27,1% al año.- 10 22 - 1 2

293 MEDIDAS DE ORDEN

294 Cuartiles Se lo simboliza con Qr., donde con “r” indicamos el orden del cuartil que queremos calcular. Los cuartiles dividen mi distribución de datos u observaciones en cuatro partes iguales o sea que tenemos tres cuartiles el cuartil de orden 1, de orden 2 y el de orden 3, y en cada uno se encuentra el 25 % del total de casos observados. El cuartil de orden 1 es aquel que me deja un 25 % de datos a izquierda y un 75 % a derecha, de su valor. El cuartil de orden 2 es aquel que me deja un 50 % de datos a izquierda y un 50 % a la derecha, de su valor. Coincide con la mediana. El cuartil de orden 3 es aquel que me deja un 75 % de datos a izquierda y un 25 % a derecha, de su valor.

295 CUARTILES PARA DATOS SIN AGRUPAR.-
Lo primero que debemos hacer es agrupar los datos en forma creciente.- Realizado esto, calculamos el orden del valor de variable que será el Cuartil buscado.- Puede darse: (n + 1) r Qºr = = 4 Si me da un valor entero, el cuartil buscado será el valor de variable que ocupe ese lugar.- Si me da un valor decimal en 5, el cuartil buscado será el promedio entre el dato posición del entero y el siguiente.- Si me da un valor ni entero, ni decimal en 5, el cuartil buscado será el dato que ocupe la posición siguiente al valor entero.-

296 Qº3 = 15,75 posición Q3 = 49 años Veamos un ejemplo.-
Supongamos tener las edades de una muestra de empleados de cierta empresa textil.- Estos resultaron ser: Ordenamos en forma creciente los datos: Qº1 = 5,25 posición Q1 = 30 años El 25 % de los empleados tienen 30 años o menos.- Qº3 = 15,75 posición Q3 = 49 años El 75 % de los empleados tienen 49 años o menos.-

297 CUARTILES PARA DATOS AGRUPADOS SIN INTERVALOS.-
Supongamos que a una muestra de empleados de cierta empresa se les pregunto la cantidad de hijos que tienen.- Resulto la siguiente distribución: xi fi Fi Fi% 4 6,7 I 9 13 21,7 2 12 25 41,7 3 18 43 71,7 10 53 88,3 5 7 60 100,0 Total ------ El cuartil 3 nos implica el 75%, por lo tanto buscamos el menor porcentaje que lo cubre, y observamos el valor de variable que le corresponde, entonces: Q3 = 4 hijos.- El 75% de los empleados tienen 4 hijos o menos.-

298 CUARTILES PARA DATOS AGRUPADOS EN INTERVALOS.-
Supongamos tener los tiempos en minutos que demoran los empleados de una empresa en realizar una tarea.- Los valores fueron: Li Ls fi Fi Fi% 16 3 5,8 20 7 10 19,2 24 12 22 42,3 28 15 37 71,2 32 47 90,4 36 5 52 100,0 TOTAL ------ ----- Q1 = = 12 = 21 minutos El 25% de los empleados demoran 21 o menos minutos en realizar la tarea.-

299 PERCENTILES.- Se simbolizan P r
Los percentiles me dividen las observaciones en cien partes iguales.- Para los tres casos que vimos cuartiles, los percentiles se aplica el mismo criterio solo que recordemos que dividen las observaciones en 100 partes iguales.- Es decir que en todos los casos que usamos 4 debemos usar Vamos a ver esto mediante ejemplos.- PERCENTILES PARA DATOS SIN AGRUPAR.- Supongamos tener una muestra de 15 alumnos a los cuales se les pregunto la cantidad de materias aprobadas.- Los datos fueron ya ordenados: Pº62% = 9, P62% = 8 materias El 62% de los alumnos tienen 8 materias aprobadas o menos.-

300 PERCENTILES PARA DATOS AGRUPADOS SIN INTERVALOS.-
Supongamos que a una muestra de empleados de cierta empresa se les pregunto la cantidad de hijos que tienen.- Resulto la siguiente distribución: xi fi Fi Fi% 4 6,7 I 9 13 21,7 2 12 25 41,7 3 18 43 71,7 10 53 88,3 5 7 60 100,0 Total ------ El PERCENTIL 82%, nos implica el 82%, por lo tanto buscamos el menor porcentaje que lo cubre, y observamos el valor de variable que le corresponde, entonces: P82% = 4 hijos.- El 82% de los empleados tienen 4 hijos o menos.-

301 P70% = 24 + ----------------- 4 =
PERCENTILES PARA DATOS AGRUPADOS CON INTERVALOS Supongamos tener los tiempos en minutos que demoran los empleados de una empresa en realizar una tarea.- Los valores fueron: Li Ls fi Fi Fi% 16 3 5,8 20 7 10 19,2 24 12 22 42,3 28 15 37 71,2 32 47 90,4 36 5 52 100,0 TOTAL ------ ----- 36, P70% = = 15 = 27,84 ≈ 28 minutos El 70% de los empleados demoran 28 minutos o menos en realizar la tarea.-

302 Rp(xi) = -------------------------------------- x 100
RANGO DEL PERCENTIL.- Nos encontramos con muchas situaciones en las que tenemos una serie de datos ordenados en un tabla de frecuencia y nos preguntan que porcentaje de datos están por debajo de un determinado valor de variable, y esto es lo que nos dice el Rango del Percentil.- Veamos esto en el ejemplo anterior.- Calculamos el Rango mediante la siguiente formula: Fi ( xi - Li) fi/ci Rp(xi) = x 100 n

303 Rp(22) = ------------------------------ 100
Supongamos tener los tiempos en minutos que demoran los empleados de una empresa en realizar una tarea.- Los valores fueron: Calculamos el Rango mediante la siguiente formula: Fi ( xi - Li) fi /ci Rp(22) = n Li Ls fi Fi Fi% 16 3 5,8 20 7 10 19,2 24 12 22 42,3 28 15 37 71,2 32 47 90,4 36 5 52 100,0 TOTAL ------ ----- = = 30,77 52 ≈ 31 % El 31% de los empleados demoran en realizar la tarea 22 minutos o menos.-

304 MEDIDAS DE DISPERSION

305 Podemos preguntarnos ¿Por qué estudiar la dispersión
Podemos preguntarnos ¿Por qué estudiar la dispersión?.- Un promedio como la media o la mediana solamente localiza el centro de los datos y esto es importante desde ese punto de vista, pero un promedio no dice nada acerca de la diseminación de los datos.- Por ejemplo, usted es el Administrador o Contador de un gran comercio y una sucursal.- Le solicitan analizar las ventas del ultimo año.- Saca una muestra de datos en ambos, la describe y determina que el monto de venta promedio en ambos comercio es el mismo.- ¿usted se conformaría solo con ese dato? y le diría al Gerente que ambos comercio andan bien.- Seguramente no, trataría además de buscar alguna medida que le pueda indicar que paso con todas las ventas respecto a su promedio.- Las medidas que le indicarían esto, son las llamadas Medidas de Variabilidad o de Dispersión.-

306 Un valor pequeño para una medida de dispersión indica que los datos se encuentran acumulados cercanamente, por ejemplo alrededor de la media.- Por lo tanto la media se considera bastante representativa de los datos.- Por lo contrario, , una medida de dispersión grande indica que la media no es confiable, es decir, que no es representativa de los datos.- Una segunda razón para estudiar la dispersión en un conjunto de datos es poder comparar cuán dispersa están dos o más distribuciones.- Dos distribuciones pueden tener iguales medidas de tendencia central y sin embargo mostrar grados de dispersión diferentes.

307 Media

308 RANGO O RECORRIDO DE LA VARIABLE.-
Se simboliza Rx .- Se la calcula haciendo la diferencia entre el máximo valor de la variable y el mínimo que toma.- Como medida de dispersión se la toma poco en cuenta ya que nada me dice de los valores intermedio de la variable.- Un uso importante del Rango lo encontramos cuando vemos la Estadística Descriptiva en el Control de Calidad de Procesos.- RANGO INTERCUARTÍLICO.- Se simboliza con Rint.- RIC = Q Q1 Esta medida considera la dispersión de la mitad (parte central) de los datos; por lo tanto, los valores extremos no influyen en ella.- Es una buena medida de dispersión cuando los datos están mejor representados por la mediana.-

309 S²x si trabajamos con la muestra
VARIANCIA O VARIANZA.- Aunque el rango es una medida de la dispersión total y el rango intercuartílico es una medida de la dispersión media, ninguna de estas medidas de variación toman en cuenta como se distribuyen o agrupan las observaciones.- Por lo tanto se pensó en una medida estadística que me tuviera en cuenta todos los datos y esa medida es la VARIANCIA.- Simbolizamos a la variancia: S²x si trabajamos con la muestra σ² si trabajamos con la población Como no conocemos la población vamos a calcular la variancia de la muestra.- A igual que las otras medidas descriptivas las podemos calcular para datos sin agrupar, par datos agrupados sin y con intervalos.-

310 VARIANCIA DE LA MUESTRA.-
La variancia de la muestra es la suma de los cuadrados de las diferencias con relación a la media aritmética dividida entre el tamaño de la muestra menos uno.- ∑ ( xi - x)² S²x = n Si el denominador fuera n en lugar de (n – 1), se obtendría el promedio de los cuadrados de las diferencias con respecto a la media.- Si embargo, se utiliza (n – 1) debido a ciertas propiedades matemáticas deseadas que tiene el estadístico S², lo cual lo hacen muy apropiadas para hacer inferencias estadísticas.- A medida que se aumenta el tamaño de la muestra, la diferencia entre n y (n – 1) disminuye cada vez más.-

311 La variancia como esta definida como un valor cuadrado nunca puede ser negativa.-
No tiene explicación por estar definida como un valor cuadrado y nos da un resultado con unidad de medida al cuadrado.- Por ejemplo, si estamos trabajando datos en $, la variancia nos va dar un resultado en $², si trabajamos empleados nos dará empleados al cuadrado, etc.- Será igual a cero cuando no exista diferencia entre los datos, es decir, todas las observaciones en la muestra deberían ser exactamente iguales.- En este improbable caso, el rango y rango intercuartílico también sería igual a cero.- Los datos numéricos por naturaleza, son variables no constantes.- Cualquier fenómeno aleatorio de interés puede adquirir una amplia variedad de valores.- Entonces, la importancia de estudiar, no solo las medidas de tendencia central que resumen nuestros datos, sino también las medidas de variación que reflejan la dispersión de los datos numéricos, se debe a esa variación intrínseca de los datos.-

312 Como su calculo es bastante complicado, surge la llamada Formula de Calculo de la Variancia, que abrevia mucho el calculo de la misma.- ∑ x² - n x² S²x = para datos sin agrupar n

313 S²x = para datos agrupados n - 1
∑ x² fi - n x² S²x = para datos agrupados n Esta fórmula será para datos agrupados sin y con intervalos.- La diferencia se da en el valor de las observaciones xi, ya que en datos agrupados sin intervalo serán los datos originales, y en datos agrupados con intervalos serán los puntos medios de los intervalos.- Como dijimos, la variancia me da un resultado en unidades de medida de la variable al cuadrado, entonces aparece otra medida que llamamos Desvío Estándar.-

314 DESVIACION ESTANDAR La simbolizamos con sx en la muestra y con σx en la población.- La desviación estándar mide la dispersión promedio alrededor de la media: como fluctúan las observaciones mayores arriba de ella y las observaciones menores debajo de ella.- El desvío estándar es la verdadera medida de dispersión ya que se expresa en las mismas unidades de medida que los datos originales.- Calculamos la desviación estándar como: sx = variancia Observamos que la media y el desvío estándar ayudan a definir en donde se agrupan la mayor parte de los datos.-

315 Veamos un ejemplo de calculo del Desvío Estándar.-
Supongamos que se ha tomado un Parcial de la cátedra de Estadística y se calificó al mismo de 0 a 10.- Las notas de una muestra aleatoria de alumnos fueron resumidas en una tabla de frecuencia y son: Notas fi xi Xi * fi x²i X²i * fi 5 1 4 9 3 27 81 6 14 70 25 350 20 7 140 49 980 10 2 18 162 TOTAL 50 260 ----- 1578

316 ∑ XI * fi X = = n 260 = = 5,2 50  5 puntos ∑ x² fi - n x² S²x = = n = = 49 226 = = 4,61 ptos² sx = variancia = 4,61 ptos.² = 2,15 puntos En promedio cada nota se diferencia de la media en 2 puntos.-

317 VARIANCIA DE LA POBLACION
La variancia de la POBLACION es la suma de los cuadrados de las diferencias con relación a la media aritmética poblacional dividida entre el tamaño de la población.- ∑ ( xi - μ)² σ²x = N Esta variancia poblacional, nunca la calculamos porque sostenemos que las poblaciones son muy grandes, es un parámetro, y a estos aprenderemos a estimarlos en la Unidad de Estimaciones.-

318 EJERCICIOS PARA HACER EN CLASE
1.- Diez economistas recibieron el encargo de predecir el crecimiento porcentual que experimentará el índice de precio al consumidor el próximo año.- Sus predicciones fueron: 3, , , , , , ,4 3,0 3, ,4 Calcule y explique la dispersión de los datos.- 2.- Una consultora, analiza las ventas alcanzadas en la navidad de los 10 grandes negocios que posee una ciudad chica.- Observó respecto al año anterior, los siguientes incrementos porcentuales: 10, , , , , , , , , ,3 Calcule la dispersión de los datos.-

319 USOS DEL DESVIO ESTANDAR.-

320 Un Desvío Estándar pequeño nos indica que los datos están o se encuentran localizados muy cerca de la media, caso inverso significa que los datos están muy lejos de su media.- Por supuesto más chico sea el Desvió Estándar mejor serán nuestros datos.- El matemático ruso Chebycheff (1821 – 1894) desarrollo un teorema que permite determinar la proporción mínima de valores que se encuentran dentro de un número específico de desviaciones estándar con respecto a su media.- Para este matemático no importa la forma de la distribución es decir puede ser simétrica o asimétrica y dice:

321 Para un conjunto cualquiera de observaciones (muestra o población) la proporción mínima de valores que se encuentran dentro de k observaciones estándares desde la media es al menos (1 - 1/ k²) %, donde k es una constante mayor que uno.-

322 Por ejemplo si suponemos K = 3, será:
/ 3² = / 9 = 8 /9 = 88,89 % Esto me está diciendo que entre la media ± 3 desvío estándar se encuentra el 89 % de los datos.- Si estoy estudiando sueldos, y se que su X = 580$ y el s = 24,10$, será: 507,70$ X ± 3 * s = ± 3 * 24,10 = 580 ± 72,3 652,30$ Podemos decir, que del total de empleados a los cuales estudiamos el sueldo, el 89 % de ellos cobran entre 508$ y 652$.- Ahora puedo tomar alguna decisión.-

323 REGLA EMPIRICA.- Esta regla se aplica solo a distribuciones que son simétricas, es decir aquellas que las medidas de tendencia central son iguales, o sea, la media, la mediana y el modo.- Esta regla sostiene: Que el 68,0% de los datos se encuentran entre la media más menos un desvío estándar.- Que el 95,0% de los datos se encuentran entre la media más menos dos desvío estándar.- Que el 99,0% de los datos se encuentran entre la media más menos 3 desvío estándar.- En una clase práctica veremos aplicación del uso del Desvío Estándar.-

324 EJERCICIO PARA HACER EN CLASE
1.- Un grupo de 13 estudiantes de Administración se van de viaje de estudio a Turquía durante cinco semanas.- Como parte de su estudio de la economía local, cada uno compra una alfombra oriental y han hecho las gestiones oportunas para que se la enviara a la Argentina.- El tiempo que tardaba en llegar cada alfombra era, en días: Estime el porcentaje de días que se encuentra dentro de dos desviaciones estándar de la media.- ¿es probable que se tarde 2 meses en enviar la alfombra?.- Vea si aplica el Teorema o la Regla empírica o ambas.- Explique.-

325 COEFICIENTE DE VARIACIÓN.-
A diferencia de las medidas que hemos estudiado hasta ahora, el Coeficiente de Variación es una indicación relativa de la variación.- Siempre se expresa como porcentaje, y lo simbolizamos con CVx.- El hecho de no tener unidad de medida hace que pueda usarse para comparar distribuciones en diferentes unidades de medidas, y poder decir de ellas cual es más homogénea en sus datos respecto a la media.- Se calcula como: El coeficiente de variación es igual a la desviación estándar dividida entre la media, multiplicada por 100 por ciento.- S CVx = * 100 x

326 Cuando comparamos dos distribuciones de datos en diferentes unidades de medida, y queremos saber cual es más homogénea en sus datos referentes a su media, no tenemos más opción que comparar los CV, a menor CV más homogéneos son los datos.- Por ejemplo, si tenemos una distribución donde estudiamos sueldos de la empresa y en la otra la antigüedad en la empresa de esos mismos empleados, y nos preguntamos en que son más homogéneos esos empleados, en sueldos o en antigüedad.-

327 Cuando comparamos dos distribuciones de datos en igual unidad de medida podemos preguntarnos en cual distribución son más homogéneos los datos respecto a su media.- En este caso podemos comparar los desvíos estándar solo si las medias son iguales, y el menor desvío estándar más homogéneos son los datos.- Cuando las medias son diferentes no es objetivo comparar las desviaciones, y en esos casos recurrimos a comparar los Coeficientes de Variación.- A menor CV más homogéneos son los datos respecto a su media.-

328 EJERCICIO PARA HACER EN CLASE
1.- Los siguientes datos representa los montos de ventas diarias, de una muestra aleatoria de 15 días de dos comercios de artículos del hogar, durante el año (en miles de pesos).- Comercio A Comercio B Para cada serie de datos calcule: Indique que Comercio tiene ventas más homogéneas.-

329 MEDIDAS DE FORMA.- Las medidas de forma hacen referencia a la forma de la distribución de datos.- Ya hemos comentado que pueden ser simétricas, o asimétrica o segadas.- Para describir la forma, solamente se deben comparar la media y la mediana.- Si ambas medidas son iguales, por lo general se considera que los datos son simétricos o con sesgo cero.- Por el contrario, si la media excede a la mediana, los datos se describen como sesgados a derecha o con sesgo positivo.- Si la mediana excede a la media, los datos suelen llamarse sesgados a izquierda o con sesgo negativo.- Media > Mediana : sesgo positivo a la derecha Media = Mediana; simetría o sesgo cero Media < Mediana: sesgo negativo o a la izquierda.-

330 El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco usuales; el sesgo negativo ocurre cuando la media se reduce debido a algunos valores muy pequeños.- Los datos son simétricos cuando en realidad no hay valores extremos en ninguna dirección, de tal manera que los valores grandes y pequeños se equilibra.- Asimétrica a izquierda o negativa Asimetría a derecha o positiva Simétrica

331 COMO MEDIR LA ASIMETRIA

332 Como señaláramos oportunamente la silueta de la forma de la distribución (polígono de frecuencias) nos da una idea acerca de la simetría del conjunto de datos.- Así teníamos que, en la situación de simetría, cada mitad de la curva es una imagen espejada de la otra mitad y la recta que hace de espejo (eje de simetría) es la que pasa por las medidas de tendencia central media, mediana y modo, que coinciden en el mismo valor.- Eje de simetría X = Me = Mo

333 A medida que la distribución se hace más asimétrica hacia uno u otro lado (derecha e izquierda), las medidas de tendencia central tienden a alejarse una de otra, siendo la media por estar afectada por los valores extremos la que más se desplaza hacia la cola de la distribución.- X Me Mo Mo Me X X < Me < Mo X > Me > Mo

334 Vemos en los Gráficos que, en el caso de una asimetría a la izquierda, la media es menor que la mediana y esta a su vez menor que el modo.- Inversamente en la asimetría hacia la derecha, la media es mayor que la mediana y a su vez esta mayor que el modo.- Se puede ver además que la mediana toma un valor intermedio entre las otras dos medidas, ubicándose más próxima a la media.- A medida que la asimetría crece en una u otra dirección, también las distancias entre la media, mediana y modo crecen.- En consecuencia, podemos usar estas diferencias (X – Mo) o (X - Me) como medidas absoluta de la asimetría de una distribución.- Además, se puede ver que si la asimetría es a la izquierda, (X – Mo) dará un valor negativo, en tanto que si la asimetría es a la derecha dará un valor positivo.-

335 EN SINTESIS: x - MO = SIMÉTRICA X - MO < ASIMETRIA NEGATIVA X - MO > ASIMETRIA POSITIVA Además, cuanto mayor sea el valor absoluto de la diferencia, mayor será el grado de asimetría de la distribución: a mayor | X - Mo| mayor asimetría

336 Para poder comparar asimetría de distribuciones de variables medidas en distintas escalas o para valores de distintas magnitudes, la solución es construir medidas relativas de asimetría.- COEFICIENTE DE ASIMETRIA DE PEARSON.- (CAP) Una de las medidas de asimetría más difundida es este Coeficiente, que se calcula esa diferencia en términos del desvío estándar.- CAP = o CAP = X - Mo 3(X - Me) s s

337 Comentarios La magnitud absoluta del coeficiente indica la “cantidad de desvío estándar” a los que se encuentra la media del modo.- Se lo puede expresar en porcentaje, multiplicando por cien el resultado de la expresión anterior.- Si el coeficiente es igual a cero, estamos en una situación de simetría perfecta.- En situaciones de asimetría el coeficiente puede tomar una asimetría a derecha o a izquierda.- Recordemos que una es positiva y la otra negativa.- En términos teóricos, este Coeficiente puede tomar valores que varían entre - 3 y +3.-

338 RESUMEN DE CINCO NUMEROS
ANALISIS EXPLORATORIO DE DATOS RESUMEN DE CINCO NUMEROS

339 Cuando hemos desarrollado el Análisis Exploratorio de Datos, se dijo que ordenábamos los datos mediante un diagrama de tallo y hoja.- Es importante identificar y describir las características principales de los datos en forma resumida.- Un enfoque a este Análisis Exploratorio de datos es desarrollar un resumen de cinco números y construir un diagrama de caja y bigotes.- En un resumen de cinco números se emplean los siguientes datos 1.- Valor mínimo.- 2.- Primer cuartil.- 3.- Mediana.- 4.- Tercer cuartil.- 5.- Valor máximo.-

340 DIAGRAMA DE CAJA Y BIGOTES.- (Boxplot)
La forma más fácil de elaborar un resumen de cinco números es poner los datos en orden ascendente, así es fácil identificar los cincos datos.- Veamos un ejemplo: Supongamos tener los salarios de 12 gerentes de empresas medianas, ordenados son: La mediana es Me = y los cuartiles Q1 = 2880 y Q3 = 3050 los otros dos datos es fácil verlos.- DIAGRAMA DE CAJA Y BIGOTES.- (Boxplot) Un diagrama de caja es un resumen gráfico de los datos basado en un resumen de cinco datos y nos da una idea de forma de la distribución de los datos, además de poder determinar si tenemos valores atípicos.-

341 Los pasos para trazar un diagrama de caja y bigote son:
1.- Se traza un rectángulo con los extremos en el primer cuartil y tercer cuartil.- Este rectángulo contiene el 50% de los datos.- 2.- En la caja se traza una recta vertical en el lugar de la mediana, así, la línea de la mediana divide los datos en dos partes iguales.- 3.- Se ubican los límites mediante el rango intercuartil RIC = Q3 – Q1 . Los límites en el diagrama estarán dados según la Regla de Tukey en Q1 - 1,5 * RIC y Q ,5 * RIC.- Todos los valores que nos queden fuera de esos límites son considerados valores atípicos.- 4.- Las líneas punteadas a los costados de la caja se llaman bigotes de la caja y se trazan de Tukey al cuartil 1 y del cuartil 3 al valor Tukey.- 5.- Por último se marca con asterisco si hay algún valor atípico.-

342 ----------- ---------- *

343

344 1obs 2obs 3obs Suponga que tiene las tres observaciones correspondientes a tres meses diferentes de su empresa.- Decide comparar la situación de su empresa en los tres meses mediante diagramas de caja y bigote.- Resulta el diagrama siguiente:

345

346 VEAMOS OTRO EJEMPLO.- La tabla siguiente muestra las puntuaciones obtenidas en el examen final de Estadística para quince estudiantes de Economía, quince de Administración y quince de Contador.- ECONOMIA ADMINISTRACION CONTADOR 47 72 56 76 43 80 52 59 48 78 83 50 57 81 61 55 85 63 67 84 89 64 86 69 90 91 73 94 97 71

347 D a t 3 2 1 9 8 7 6 5 4 B o x p l f ;

348 La figura anterior contiene los diagramas de caja de las puntuaciones de cada uno de estos tres grupos.- En este ejemplo concreto, puede apreciarse que no hay observaciones excesivamente atípicas en ninguno de los tres grupos.- Por eso, los bigotes de las cajas corresponden a la menor y mayor puntuación de cada grupo.- En el diagrama se observa que los estudiantes de Contador consiguieron la mejor mediana, pero sus puntuaciones tienen una variabilidad considerablemente mayor que la de los otros grupos.- Otro hecho que llama la atención es la gran cantidad de puntuaciones bajas obtenidas por los estudiantes de Economía.-

349 EJERCICIO DE MEDIDAS DESCRIPTIVA Y DIAGRAMA DE CAJA CON INFOSTAT

350 Supongamos tener el Rendimiento anual, de una muestra de 50 fondos mutuos que se tomaron de 6858 fondos mutuos que se publicaron en una Revista Económico Financiera en febrero del Para cada fondo el rendimiento anual se da como porcentaje, los valores fueron: 0,5 1,1 2,0 3,6 1,9 2,6 1,3 3,2 2,4 1,5 1,8 1,6 3,8 2,3 3,1 3,0 2,8 0,7 4,0 0,8 1,2 2,5 2,7 3,7 1,0 3,5 3,4 1,7 4,5 2,2 1,4 5,0 2,1

351 Estadística descriptiva
C:\ Archivos de programa\ InfoStat\datos\Rendimientos fondos (pier).IDB: 22/03/ :41:08 Estadística descriptiva Resumen Columna1 n ,00 Media ,31 D.E ,98 Var(n-1) ,95 CV ,22 Mín ,50 Máx ,00 Mediana ,30 Q ,70 Q ,00 Asimetría ,53 Kurtosis ,21 P(90) ,60

352 Boxplot con InfoStat

353

354 EJEMPLOS PARA RESOLVER EN CLASE
1.- Pedro Cuello, trabaja como corredor para E. F. Hutton.- Sus registros muestran que las tasas de rendimiento (en porcentaje) sobre dos valores para 10 meses seleccionados al azar fueron: Valor 1: , , , , ,1 8, , , , ,2 Valor 2: , , , , ,2 8, , , , ,3 ¿Cuál valor puede ser mejor para los clientes que están interesados en un rendimiento más alto?.- ¿Cuál valor debería aconsejar Pedro a sus clientes que prefieren menos riesgo?.-

355 2.- Aquí se muestran las relaciones precio ganancia para 30 acciones diferentes transadas en la Bolsa de Valores de Nueva York.- 4,8 5,2 7,6 5,7 6,2 6,6 7,5 8,0 9,0 7,7 3,7 7,3 6,7 8,2 9,2 8,3 6,5 5,4 9,3 10,0 9,7 8,4 4,7 7,4 Calcule y explique la media y desviación estándar.- De acuerdo con el Teorema de Chebycheff, por lo menos ¿Cuántas relaciones precios ganancias están dentro de dos desviaciones estándar de la media?.- ¿Cuántas están realmente a dos desviaciones estándar de la media?.- Resp. a) 7, , b) 22, c) 29

356 3.- Un profesor enseña a dos grupos de introducción al marketing y selecciona aleatoriamente una muestra de calificaciones de los exámenes realizados por los dos grupos.- Halle el rango y la desviación estándar de cada muestra.- Compare y de conclusiones.- Grupo 1: Grupo 2: 4.- Las hermanas Tolosa son dueñas de una casa de fotografía, están considerando la posibilidad de invertir en el Activo A o el B.- No saben cual de los dos es mejor y le piden consejo a Carlos que entiendo sobre planificación financiera.- Carlos obtiene las tasas de rendimiento de cada activo de los cinco últimos años, que son:

357 Tasa de rendimiento en %
ACTIVO A ACTIVO B HACE 5 AÑOS 11.3 9.4 HACE 4 AÑOS 12.5 17.1 HACE 3 AÑOS 13.0 13.3 HACE 2 AÑOS 12.0 10.0 HACE 1 AÑO 12.2 11.2 TOTAL 61.0 Calcule la media y desviación estándar.- Conclusiones.- 5.- En el ejercicio anterior hemos examinado dos inversiones que tenían la misma tasa media de rendimiento.- Ahora los propietarios están considerando la posibilidad de comprar acciones de la empresa A o de la empresa B que cotizan de bolsa.-

358 Basándose en los precios de cierre de las acciones de las dos empresas de los últimos meses, se observó que las desviaciones típicas eran muy diferentes: SA = 2,00 $ y SB = 8,00 $.- ¿Deben comprarse las acciones de la empresa A, dado que la desviación típica de las acciones de la B es mayor?.- 6.- Los registros de los minutos consumidos por una muestra de 110 abonados al plan más barato de una compañía de telefonía móvil (250 como máximo en horas) se encuentran en el fichero.- El análisis estadístico arrojo los siguientes resultados:

359 Explique cada medida calculada.- Prepare un informe.-
Minutos consumidos Valores Media 17.51 Mediana 263.0 Modo 252.0 Variancia 306.68 Desviación estándar Cuartil 1 251.75 Cuarti 3 271.25 RIC 19.50 Coeficiente de variación 6.71% Valor máximo 299.0 Valor mínimo 222.0 Sesgo Explique cada medida calculada.- Prepare un informe.-

360 7.- El tiempo en segundos que tardo una muestra aleatoria de empleados en realizar una tarea es:
23 35 14 37 45 28 12 40 27 13 25 26 20 29 49 16 66 Calcular y explicar la media y el desvío estándar.- Realice un resumen de cinco datos.- Explique.- Calcule y explique el Coeficiente de variación.-

361 8.- Los rendimientos porcentuales anuales de las acciones fueron los siguientes en un período de 7 años: (en %) Durante ese mismo período, los rendimientos porcentuales anuales de las Letras del Tesoro fueron los siguientes: Compare las medias de estas dos distribuciones poblacionales.- Compare las desviaciones estándar de estas dos distribuciones poblacionales.- Comente y haga un informe.-

362 9.- Los beneficios por acción de una muestra de ocho empresas americanas experimentaron las siguientes variaciones porcentuales este año en comparación con el año anterior: Halle la variación porcentual media muestral de los beneficios por acción.- 10.- El director de operaciones de una planta embotelladora de agua mineral quiere estar seguro de que el proceso de embotellado de botellas de 1 galón esta funcionando correctamente.- (1 galón = litros) Se selecciona una muestra aleatoria de 75 botellas y se mide el contenido.- El volumen de cada botella se encuentra en el fichero (Water).-

363 Prepare un informe para el director.-
MEDIDAS CALCULADAS VALORES MEDIA 3.8079 VARIANCIA 0.0105 DESVIO ESTANDAR 0.1024 COEFICIENTE DE VARIACION 2.6900 VALOR MÍNIMO 3.5700 VALOR MAXIMO 4.1100 CUARTIL 1 3.7400 QUARTIL 3 3.8700 MEDIANA 3.7900 MODO 3.7700 RIC 0.1300 RANGO 0.5400 SESGO 0.4500 Prepare un informe para el director.-

364 11.- Se ha pedido a una muestra de 20 analistas financieros que hagan un análisis estadístico de los beneficios por acción que obtendrá una empresa el próximo año.- La tabla adjunta resume los resultados: $ por acción Número de analista 2 8 6 3 1 Realice un análisis estadístico completo.- Prepare un informe para su cliente.-

365 12.- Un editor recibe de una imprenta un ejemplar de un libro de texto de 500 páginas.- Las pruebas se leen minuciosamente, se anota el número de erratas que hay en cada página y se obtienen los datos de la tabla siguiente: Número de erratas Número de páginas 102 1 138 2 140 3 79 4 33 5 8 Prepare un informe para el editor, realizando un análisis estadístico.-

366 MEDIDAS DE LAS RELACIONES ENTRE VARIABLES

367 Cuando hemos hablados de los distintos gráficos para mostrar los datos, hemos hecho referencia al diagrama de dispersión como grafico para mostrar las relaciones entre variables.- Ahora introduciremos la covariancia y la correlación, que permiten describir numéricamente una relación lineal y que después en la Unidad de Regresión lineal simple y Correlación nos dedicaremos en detalle.- La covariancia es una media del sentido de una relación lineal entre dos variables.- Un valor positivo indica una relación lineal directa o creciente y un valor negativo indica una relación lineal decreciente.- Una covariancia poblacional será: Cov (x; y) = σx,y =  (xi – μx) (yi - μy) N N

368 Una covariancia muestral es:
Donde X e Y son los valores observados, μx y μy son las medias poblacionales y N es el tamaño de la población.- Una covariancia muestral es: Cov (X;Y) = Sxy =  (xi – x) (yi - y) n - 1 El coeficiente de correlación muestral nos da una medida estandarizada de la relación lineal entre dos variables.- Generalmente es una medida mas útil, ya que indica tanto el sentido como el grado de la relación.- La covariancia y el coeficiente de correlación correspondiente tienen el mismo signo (ambos son negativos o ambos son positivo).-

369 El coeficiente de correlación se calcula dividiendo la covariancia por el producto de las desviaciones estándares de las dos variables.- El Coeficiente de Correlación poblacional será: ρ = Donde σx σy son las desviaciones estándar poblacionales de las dos variables.- El coeficiente de correlación muestral será: r = Donde Sx y Sy son las desviaciones estándar muéstrales de las dos variables.- Cov (x; y) σx σy Cov (x; y) sx sy

370 Una regla útil y practica que se suele usar es que existe una relación entre las variables numéricas si: │r│ = 2 n El coeficiente de correlación señala la relación o asociación lineal entre dos variables numéricas.- Cuando el coeficiente de correlación se acerca a +1 o a -1, es mas fuerte la relación o asociación entre las dos variables.- Cuando el coeficiente de correlación se acerca a cero, existe poca o ninguna relación lineal entre las dos variables numéricas

371 Veamos un ejemplo de diagrama
El signo del coeficiente de correlación lineal nos indica de que tipo es la asociación.- Si el diagrama de dispersión nos muestra una nube de puntos creciente, es decir que a medida que crece una variable crece la otra el coeficiente de correlación lineal será positivo, caso inverso será negativo.- Será cero cuando no se evidencia ningún tipo de relación entre ambas variables.- Veamos un ejemplo de diagrama de dispersión y su Coeficiente de correlación.

372 EJERCICIO PARA DISCUTIR EN CLASE
Royal Manufacturas SRL, desea estudiar la relación entre el numero de trabajadores, X y el numero de mesas, Y, producidas en su planta de Córdoba.- Ha tomado una muestra aleatoria de 10 horas de producción.- Se han obtenido los siguientes pares de datos: (12;20) (30:60) (15;27) (24;50) (14;21) (18;30) (28;61) (26;54) (19;32) (27;57) Calcule la covarianza y el coeficiente de correlación.- Analizar brevemente la relación entre el numero de trabajadores y el numero de mesas producidas por hora.- SOLUCION

373

374 La planilla de calculo para calcula la Covarianza y el Coeficiente de correlación será:
x y Xi - x (xi - x)² (yi - y) (yi - y)² (xi - X) (yi- Y) 12 20 - 9,3 86,49 - 21,2 449,44 197,16 30 60 8,7 75,69 18,8 353,44 163,56 15 27 - 6,3 39,69 - 14,2 201,64 89,46 24 50 2,7 7,29 8,8 77,44 23,76 14 21 - 7,3 53,29 - 20,2 408,04 147,46 18 - 3,3 10,89 - 11,2 125,44 36,96 28 61 6,7 44,89 19,8 392,04 132,66 26 54 4,7 22,09 12,8 163,84 60,16 19 32 - 2,3 5,29 - 9,2 84,64 21,16 57 5,7 32,49 15,8 249,64 90,06 213 412 378,1 2505,6 962,4

375 Aplicando la ecuación de la covarianza tenemos: Cov (x,y) = Sxy = =
= = 106,93 Luego tenemos que el Coeficiente de correlación es: r = = = 0,989 Luego aplicando la relación 0,989 ≥ 0,64 Llegamos a la conclusión de que existe una estrecha relación positiva entre el número de trabajadores y el número de mesas producidas por hora.-  (xi – x) (yi - y) n - 1 962,4 9 Cov (x; y) 106,93 Sx Sy 108,14758

376 OBTENCION DE RELACIONES LINEALES

377 Hemos visto como puede describirse la relación entre dos variables utilizando datos muestrales.- Los diagramas de dispersión representan la relación y los coeficientes de correlación son una medida numérica.- En muchos problemas económicos y empresariales se desea una relación específica.- Por ejemplo: Si se emplean 250 trabajadores, ¿Cuántas unidades cabe esperar?.- ¿Qué nivel medio de ventas cabe esperar si el precio se fija en 10$ por unidad?.- Si un país en vía de desarrollo aumenta su producción de fertilizantes en un millón de toneladas, ¿Cuánto cabe esperar que aumente la producción de cereal?.- Si aumento el gasto de publicidad, ¿en cuanto espero que se incremente las ventas del comercio? etc.-

378 Los modelos económicos utilizan relaciones funcionales específicas para indicar el efecto que producen en una variable dependiente Y, algunas variaciones de la variable independiente X.- En muchos casos, podemos calcular aproximadamente las relaciones funcionales deseadas mediante una ecuación lineal; Y = β β1 X + εi Donde Y es la variable dependiente; X es la variable independiente, β0 es la ordenada en el origen y β1 es la pendiente de la recta, o sea, la variación que experimenta Y por cada variación unitaria de X.- En nuestras aplicaciones, partimos de supuesto nominal de que podemos fijar X en diferentes valores y a cada uno le corresponderá un valor medio de Y debido a la relación lineal subyacente en el proceso estudiado.-

379 El modelo de la ecuación lineal calcula la media de Y para cada valor de X.- Esta idea es la base para obtener muchas relaciones económicas y empresariales, entre las que se encuentran las funciones de demanda, las funciones de producción, las funciones de consumo y las predicciones sobre las ventas.- Utilizamos regresiones para averiguar cual es la mejor relación entre X e Y para una aplicación específica.- Para esto es necesario hallar los mejores valores de los coeficientes β0 y β1.- Generalmente utilizamos los datos de una muestra para calcular estimaciones de estos dos coeficientes, generalmente se calculan utilizando el método de ajustamiento de mínimos cuadrados, técnica que se aplica mucho en paquetes estadísticos como Excel y Minitab.- El método de mínimo cuadrado selecciona la recta que mejor se ajusta, dado un conjunto de pares de puntos.-

380 Veamos por ejemplo: } Ŷ = b0 + b1 X εi

381 Consideremos el ejemplo de la placa anterior, donde tenemos pares de puntos de un proceso que tiene una relación lineal.- La ecuación lineal representada por la recta es la ecuación lineal que mejor se ajusta.- Vemos que los puntos de datos individuales se encuentran por encima y por debajo de la recta y que esta tiene puntos con desviaciones positiva como negativas.- Se han usado también otros métodos para determinar la recta pero se llego a la conclusión que el método de mínimos cuadrado es la mejor que ajusta los puntos a la recta, haciendo mínima las distancias de los puntos a la recta.- Más adelante veremos que los coeficientes desarrollados utilizando este método tienen propiedades estadísticas muy importantes.-

382 Una importante cautela que se debe tener es que el caso de método de mínimo cuadrado, es que los puntos atípicos extremos pueden tener tal influencia en la recta de regresión que toda la recta se dirija hacia esos puntos.- Por lo tanto, siempre debemos examinar los diagrama de dispersión para asegurarnos de que la relación de regresión no se basa solamente en unos cuantos puntos extremos.- En la Unidad de regresión y correlación, desarrollaremos con mayor precisión este tema.- La regresión por mínimos cuadrados elige los valores de b0 y b1 con los que se minimiza la suma de los cuadrados de los residuos.- Entonces:

383 Ŷ = b b1 X b1 es la pendiente de la recta o sea la variación de Y por cada variación unitaria de X y se calcula mediante la siguiente formula: b1 = Donde b0 es la ordenada en el origen cuando X = 0 y se calcula mediante la siguiente formula: b0 = x - b1 y Cov. (x;y) S²x Veamos un ejemplo

384 Supongamos que tenemos el numero de trabajadores X y el numero de mesas producidas por hora Y, para una muestra de 10 trabajadores.- Si la dirección decide emplear 25 trabajadores, estime el número de mesas que es probable que se produzcan.- (los datos están en el fichero como Rising Hills).- En un ejemplo anterior hemos calculado la covarianza y el coeficiente de correlación, y nos daba; Cov (x; y) = 106, r = 0,989 La covarianza muestra que el sentido de la relación es positiva, la elevada correlación de 0,989 también indica que los pares de datos muestrales están muy cerca de una recta ascendente, y los podemos ver en el diagrama de dispersión siguiente:

385 Calculamos los coeficientes de regresión muestrales:
b1 = = = Cov. (x;y) 106.93 S²x 42.01

386 b0 = x - b1 y = * (21.3) = Entonces ahora podemos decir que la recta de regresión muestral es: Ŷ = b0 + b1 X = X Con 25 trabajadores es de esperar que se produzcan, Ŷ = ,545 * (25) = = 51 mesas O sea que se espera que se produzcan alrededor de 51 mesas.-

387 Por ahora considero que esto es suficiente.-
En esta parte de la Unidad, solo se pretende aprender a describir dos datos numéricamente y no hacer un análisis exhaustivo de regresión, ya que esto lo veremos en una Unidad más adelante.- Por ahora considero que esto es suficiente.-

388 EJERCICIO PARA HACER EN CLASE Miles de trozos vendidos Y
1.- A continuación se presenta una muestra aleatoria del precio por tabla de contrachapado, X y la cantidad vendida, Y en miles.- Precio por trozo X Miles de trozos vendidos Y 6.5 80 7 60 8 70 9 40 10 Calcule y explique la covarianza.- Calcule y explique el coeficiente de correlación.- Calcule y explique b0 y b1.- ¿Que cantidad de tabla es de esperar que vendamos si el precio es de 7,5 por tabla?.-

389 2.- Un hospital tiene interés en averiguar la eficacia de un nuevo medicamento para reducir el tiempo necesario para recuperarse totalmente de una operación de rodilla.- La recuperación total se mide por medio de una serie de test de fuerza que comparan la rodilla operada de la no operada.- El medicamento se administró en dosis diferentes a 18 pacientes durante un período de seis meses.- Los datos (X;Y) siguientes indican el número de unidades de medicamento X y los días necesarios para la recuperación total Y de cada pacientes: (5; 53) (21; 65) (14; 48) (11; 66) (9; 46) (4; 56) (7; 53) (21; 57) (17; 49) (14; 66) (9; 54) (7; 56) (9; 53) (21; 52) (13; 49) (14; 56) (4; 56) (9; 59)

390 Calcular la covarianza.-
Calcule el coeficiente de correlación.- Analice brevemente la relación entre el número de unidades de medicamento y el tiempo de recuperación.- ¿Qué dosis deberíamos recomendar basándonos en este análisis inicial?.- 3.- Solano SRL, ofrece tarifas distintas de envío de paquetes de menos de 5 libras de (recuerde 1 libra es igual a kilogramos) de Córdoba a Capital Federal; ordinarios 3$, urgente 5$ y superurgentes 10$.- Para comprobar la calidad de estos servicios, un importante minorista de ventas por correo envió 15 paquetes de Córdoba a Capital Federal, en momentos elegidos aleatoriamente.- Los paquetes fueron enviados en grupos de tres por los tres servicios al mismo tiempo para reducir las diferencias resultantes del día de envío.-

391 Los datos siguientes muestran el costo de envio X y el número de días Y, en pares (x; y):
(3; 7) (5; 5) (10; 2) (3; 9) (5; 6) (10; 5) (3; 6) (5; 6) (10; 1) (3; 10) (5; 7) (10; 4) (3; 5) (5; 6) (10; 4) Describa los datos numéricamente, (covarianza; coeficiente de correlación).- Analice el valor de los servicios de precio más alto desde el punto de vista del envío más rápido.- 4.- Una muestra aleatoria de 7 días de operaciones produjo los siguientes valores de los datos (precio, cantidad)

392 b) Calcule e interprete b0 y b1.-
Precio por litro de pintura X Cantidad vendida Y 10 100 8 120 4 200 90 7 110 6 150 5 a) Describa numéricamente los datos, calcule la covarianza y la correlación.- b) Calcule e interprete b0 y b1.- c) ¿Cuántos litros de pintura es de esperar que vendamos si el precio es de 7$ el litro?.-

393 EJEMPLOS QUE ESTAN CARGADOS EN INFOSTAD
EJEMPLO 1.- (Pier 1).- La tabla representa la resistencia a la tensión, en libras por pulgadas cuadrada (psi) de 80 muestras de una aleación de aluminio y litio que esta siendo evaluada como posible material para la fabricación de elementos estructurales de aeronaves.- EJEMPLO 2.- (Pier 2).- El Director de producción de cierta fábrica de alfombras es responsable de 500 telares.- Para no tener que medir la producción diaria (en metros) de cada telar, toma una muestra diaria de 30 telares, con lo que llega a una conclusión sobre la producción promedio de alfombras de los 500 telares.- EJEMPLO 3.- (Pier 3).- Cuando se diseña un puente, los Ingenieros se preocupan por la tensión que un dado concreto, deberá soportar.- En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de resistencia, los ingenieros toman una muestra del concreto, la prueban y llegan a la conclusión sobre que tanta tensión, en promedio, puede resistir ese tipo de concreto.- Se presentan los datos de una muestra de 40 bloques de concretos que se utilizarán para construir un puente.-

394 Ejemplo 4.- (Pier 5).- Los costos de ejecución de programa de computadora con el proceso de tiempo compartido varían de una sesión a otra.- Las observaciones siguientes se obtuvieron respecto de la variable X, el costo por sesión para el usuario.- Ejemplo 5.- (Pier 6).- Se obtuvieron los siguientes datos sobre la variable X: tiempo de CPU en segundos necesarios para ejecutar un programa con un software estadístico.- Ejemplo 6.- (Pier 7).- En un intento por estudiar el problema de fallas en equipos de computo instalados, se recopilan datos en 50 recorridos de campo efectuados para reparar equipos.- La variable estudiada es X: tiempo en horas necesarios para identificar y corregir el problema.- Ejemplo7.-(Pier 8).-El acabado superficial de protección anticorrosiva suele ser el último proceso de manufactura que tiene lugar antes de la venta o ensamblaje de partes metálicas usadas en producto como los artefactos domésticos.- Una técnica para la aplicación de plateado de zinc brillante al acero es sometida a prueba.- La variable en estudio es el grosor del recubrimiento obtenido en micras en 25 franjas de pruebas.-

395 Ejemplo 8.- (Pier 9).- Un proveedor de artículos de escritorio realiza la tercera de sus negocios surtiendo a las escuelas y a los gobiernos locales.- Las ventas se llevan a cabo a través de licitaciones públicas.- Cada venta potencial requiere que un empleado llene el formulario en que se hace la oferta.- Como la empresa no tenía una idea real del esfuerzo que requiere preparar una licitación, pidió al empleado que las hace que registrase las horas de inicio y terminación correspondientes a una muestra de 65 ofertas.- Los datos se guardaron en dos formas: minutos gastados en cada oferta y número de ofertas por hora.- Ejemplo 9.- (Pier 10).- En el estudio de una variable aleatoria X, la vida útil es horas de baterías de litio para un modelo específico de calculadora de bolsillo, se obtiene una muestra aleatoria de 50 baterías y se determina la vida útil de cada una.- Los datos resultantes fueron:


Descargar ppt "UNIDAD 1."

Presentaciones similares


Anuncios Google