Estadística: Errores y omisiones Pere Grima pere.grima@upc.edu Maratón Científico Cajastur, 2 de junio de 2011 1
Dificultad de contratar Iceberg y estadística Calidad y costos Costos de la calidad Costos de la no calidad Costos totales de la calidad El tratamiento de los costes en los proyectos Seis Sigma Chatarra Reprocesos Garantías Tiempo perdido “apagando fuegos” No hacer lo importante Paradas en la fabricación Aumento de stocks Disminución de la capacidad de producción Pérdida de pedidos Desmoralización del personal Dificultad de contratar a los mejores Costes normalmente medidos Costes ocultos Costes
Hay más de lo que se ve Porcentajes Sondeos electorales Medias Control de la Calidad: ¿Qué podemos hacer para mejorar? Previsiones: ¿Cuanta electricidad se gastará mañana? Estudios sociológicos: ¿Qué quieren los jóvenes? Biología: Animales en extinción Fiabilidad. ¿Cada cuanto se deben revisar las piezas de un avión? Economía: ¿Cuánto suben los precios? Estudios de mercado: ¿Qué quieren los consumidores? Investigación médica: ¿Es mejor un nuevo medicamento?
¿De qué estamos hablando? (Definiciones claras) Contenido ¿De qué estamos hablando? (Definiciones claras) Descripción de los datos Representaciones gráficas Estudios basados en muestras Precisión adecuada No ignorar la variabilidad Originalidad / Claridad Proporcionalidad Margen de error / Tamaño Representatividad 4
¿De qué estamos hablando? (Definiciones claras) Contenido ¿De qué estamos hablando? (Definiciones claras) Descripción de los datos Representaciones gráficas Estudios basados en muestras Precisión adecuada No ignorar la variabilidad Originalidad / Claridad Proporcionalidad Margen de error / Tamaño Representatividad 5
¿Qué es una família?
¿Los que fuman tienen algún trastorno mental? El País, 28 noviembre 2000 7
Jóvenes.... ! 8
Jóvenes… http://www.ajemadrid.es/
Salud mental Popularidad Inteligencia Pobreza . . . “Estadísticas...” http://es.wikipedia.org/wiki/Pobreza 10
¿De qué estamos hablando? (Definiciones claras) Contenido ¿De qué estamos hablando? (Definiciones claras) Descripción de los datos Representaciones gráficas Estudios basados en muestras Precisión adecuada No ignorar la variabilidad Originalidad / Claridad Proporcionalidad Margen de error / Tamaño Representatividad 11
Precisión exagerada 12
Esto es hilar fino... 13
Precisión ridícula ! 14
¿De qué estamos hablando? (Definiciones claras) Contenido ¿De qué estamos hablando? (Definiciones claras) Descripción de los datos Representaciones gráficas Estudios basados en muestras Precisión adecuada No ignorar la variabilidad Originalidad / Claridad Proporcionalidad Margen de error / Tamaño Representatividad 15
1 pollo + 0 pollos El País, 1 de marzo de 2011
La media no necesariamente representa a todos La Vanguardia 25 noviembre 2005. Pág. 5 (suplemento Vivir) El Periódico 25 noviembre 2005; Pág. 45
Sueldos El País, 6 de marzo de 2011, pág. 25
Confundir la media con el conjunto La Vanguardia, 26 de Febrero de 2002. Página 16
¿De qué estamos hablando? (Definiciones claras) Contenido ¿De qué estamos hablando? (Definiciones claras) Descripción de los datos Representaciones gráficas Estudios basados en muestras Precisión adecuada No ignorar la variabilidad Originalidad / Claridad Proporcionalidad Margen de error / Tamaño Representatividad 20
Original, pero poco claro 0,7 0,6 El País, 22 de noviembre de 2005. Página 15
¿Qué? La Vanguardia, 3 marzo 2006. Página 40
Evolución de las ventas...
¿De qué estamos hablando? (Definiciones claras) Contenido ¿De qué estamos hablando? (Definiciones claras) Descripción de los datos Representaciones gráficas Estudios basados en muestras Precisión adecuada No ignorar la variabilidad Originalidad / Claridad Proporcionalidad Margen de error / Tamaño Representatividad 24
Impacto del eje vertical
Gráfico universal Es muy rápido. Sobre el mismo dibujo se cambian los números
Sin escala
Unidad = Unidad
¿De qué estamos hablando? (Definiciones claras) Contenido ¿De qué estamos hablando? (Definiciones claras) Descripción de los datos Representaciones gráficas Estudios basados en muestras Precisión adecuada No ignorar la variabilidad Originalidad / Claridad Proporcionalidad Margen de error / Tamaño Representatividad 29
Intervalo de confianza del 95 % Ideas clave Intervalo de confianza del 95 % 42,8 % ± 3,2 % Estimación puntual Margen de error Dice la verdad el 95 % de les veces
¡Empate técnico! El País, 18 febrer 2006. Pàgina 18
Consumo de cannabis El País, 7 febrer 2003
Augmenta el consum?
Cuchara para catar la sopa Cuchara para catar la sopa Tamaño de la muestra Cuchara para catar la sopa a diario Cuchara para catar la sopa con invitados Olla para la sopa a diario Olla para la sopa con invitados
¿De qué estamos hablando? (Definiciones claras) Contenido ¿De qué estamos hablando? (Definiciones claras) Descripción de los datos Representaciones gráficas Estudios basados en muestras Precisión adecuada No ignorar la variabilidad Originalidad / Claridad Proporcionalidad Margen de error / Tamaño Representatividad 35
Asegurar la representatividad
Curiosa encuesta
Dificultad de contratar Iceberg y estadística Calidad y costos Costos de la calidad Costos de la no calidad Costos totales de la calidad El tratamiento de los costes en los proyectos Seis Sigma Chatarra Reprocesos Garantías Tiempo perdido “apagando fuegos” No hacer lo importante Paradas en la fabricación Aumento de stocks Disminución de la capacidad de producción Pérdida de pedidos Desmoralización del personal Dificultad de contratar a los mejores Costes normalmente medidos Costes ocultos Costes
Créditos: Una parte de este material proviene de una exposición sobre pifias y malos usos de la estadística que preparé con el prof. Lluís Marco. http://www-eio.upc.es/~grima/Varios.html Otros ejemplos y la estructura estructura general está inspirada en el trabajo que hicieron Sara Fontdecaba y Maria Montón, y que está resumido en el capítulo 15 del libro “Estadística en acción”. Editado por la Facultad de Matemáticas y Estadística de la UPC: http://hdl.handle.net/2117/7854