La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 1 Capítulo 1. Vistazo y Estadística Descriptiva I Parte.

Presentaciones similares


Presentación del tema: "Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 1 Capítulo 1. Vistazo y Estadística Descriptiva I Parte."— Transcripción de la presentación:

1 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Capítulo 1. Vistazo y Estadística Descriptiva I Parte 1.0.Introducción 1.1 Poblaciones, Muestras y Procesos 1.2 Métodos Gráficos y Tabulares

2 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual ¿Estadística? Ejemplo 1. Para la población de USA de más de 18 años. La propiedad de interés podría ser el peso aquellos que estudian ingeniería y que además son estudiantes universitarios. Ejemplo 2. La tragedia del Challenger de enero 28, Los datos incluyen las temperaturas de los anillos O para cada encendido de prueba o lanzamiento real del transbordador. Estamos interesados en si la temperatura ambiente al lanzamiento, tiene algún efecto sobre la posibilidad de un lanzamiento exitoso o fallido.

3 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

4 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

5 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

6 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

7 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Mmm … ¿Qué respondo? ¿Si? o ¿No?

8 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Poblaciones,Muestras, y Procesos

9 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Poblaciones y muestras Una población (population) es una colección bien definida de objetos, sobre la cual hay interés de obtener información. Normalmente es demasiado grande como para poder abarcarla Cuando al información está disponible para la población entera se tiene un censo (census). Un subconjunto de la población es una muestra (sample). Generalmente es el subconjunto al cual se tiene acceso y sobre el cual se hacen realmente las observaciones o mediciones

10 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Variable Una variable es cualquier característica cuyo valor puede cambiar de objeto en objeto. Es decir, es una característica observable que varía entre los diferentes objetos de una población. La información de la cual se dispone de cada objeto se resume en variables Género, altura, ingreso, y PGB

11 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Unidades de Observación Los elementos de una población se llaman en general unidades de observación. Las características de interés (edad, consumo, resultado) se denominan variables pues su valor varía en función de la unidad observada

12 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Propiedades deseables de las Muestras Deberían ser representativas Están formadas por objetos seleccionados de la población (individuos, unidades experimen- tales) Estos dos puntos son básicos para hacer lo esencial de esta disciplina: hacer inferencia (inducción) hacia lo general. El proceso de extraer muestras de la población se llama Muestreo

13 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Variables según variación Las variables pueden ser de acuerdo a su variación: –Determinísticas cuando varían de objeto en objeto de la población de un modo completamente predecible. –Aleatorias cuando varían de objeto en objeto de la población de un modo impredecible o de un modo que parece o se supone depende del azar.

14 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Datos y Observaciones Los datos univariados constan de observaciones de una sola variable (multivariable – más de dos variables).

15 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Notación Las variables se denotarán por su inicial mayúscula ( A, B, R...) o de un modo más general por X, Y, Z, etc. Los valores numéricos o no numéricos (ver ejemplos más adelante) o modalidades de una variable serán indicados por la misma letra pero minúscula tal vez subindiciada: x 1, x 2,..., y 1, y 2,... Las modalidades de una variable X son todas diferentes Si no hay lugar a confusión, se utilizan las mismas notaciones x 1, x 2,..., x n para indicar los n valores observados de X para una muestra particular. En este caso, ciertos valores podrán ser idénticos. Se dirá que x 1, x 2,..., x n son n observaciones de X.

16 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Tipos de variables Por características variable cuantitativa : cuando puede asumir cualquier valor numérico las modalidades son números que expresan cantidades, con las cuales tiene sentido realizar operaciones algebraícas con ellos (ingresos de 300 pesos, altura 185 cm, etc..); variable cualitativa o categórica ( nominal ): cuando las modalidades representan cualidades o atributos (sexo : masculino, femenino, genotipo, fenotipo, etc) ; Es decir, cuando no se les puede asociar naturalmente números a los valores (y en consecuencia, no es posible realizar operaciones algebraícas con ellos).

17 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Variables Cuantitativas variable cuantitativa continua (o de intervalo): si el conjunto de valores o modalidades es un intervalo (posiblemente no acotado) de los números reales (pesos entre 0 y 300 Kg, talla entre 20 y 50 cm, etc.), surgen de mediciones; variable cuantitativa discreta: si el conjunto de los valores posibles es finito o infinito numerable (número de hermanos, número de accidentes de un seguro), es decir puede sumir valores numéricos aislados, surgen de conteos;

18 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Variables Cualitativas variable cualitativa o categórica (nominal): cuando las modalidades representan cualidades o atributos (sexo : masculino, femenino, genotipo, fenotipo, etc); variable categórica ordinal: cuando las modalidades no son cantidades numéricas pero pueden ser ordenadas de un modo natural (el estado de un paciente: si va mal, delicado, está estable, si le va mejor).

19 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Variables Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables. En los individuos de la población chilena, de uno a otro es variable: –El grupo sanguíneo {A, B, AB, O} Var. Cualitativa –Su nivel de felicidad declarado {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal –El número de hijos {0,1,2,3,...} Var. Numérica discreta –La altura {162 ; 174;...} Var. Numérica continua

20 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador. Es conveniente asignar etiquetas a los valores de las variables para recordar qué significan los códigos numéricos. –Sexo (Cualit: Códigos arbitrarios) 1 = Hombre 2 = Mujer –Raza (Cualit: Códigos arbitrarios) 1 = Blanca 2 = Negra,... –Felicidad Ordinal: Respetar un orden al codificar. 1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz Se pueden asignar códigos a respuestas especiales como 0 = No sabe 99 = No contesta... Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (missing data)

21 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de cálculo estadístico. No todo está permitido con cualquier tipo de variable.

22 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual ¿Para qué sirve la estadística? La Ciencia se ocupa en general de fenómenos observables La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes Los modelos que crea la ciencia son de tipo determinista o de tipo aleatorio (estocástico) La Estadística se utiliza como tecnología al servicio de las ciencias puras e ingenieriles donde la variabilidad y la incertidumbre forman parte de su naturaleza; es decir, donde estas no son la excepción sino la regla

23 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

24 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Definición La Estadística es la Ciencia de la Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de deducir las leyes que rigen esos fenómenos, y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones (inducción). Descriptiva Probabilidad Inferencia

25 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Pasos en un estudio estadístico Plantear hipótesis sobre una población Los fumadores tienen más licencias laborales que los no fumadores ¿En qué sentido? ¿Mayor número? ¿Tiempo medio? Decidir qué datos recoger (diseño de experimentos) –Qué individuos pertenecerán al estudio (muestras) Fumadores y no fumadores en edad laboral. Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas? –Qué datos recoger de los mismos (variables) Número de licencias Tiempo de duración de cada licencia ¿Sexo? ¿Sector laboral? ¿Otros factores? Recoger los datos (muestreo) –¿Estratificado? ¿Sistemáticamente? Describir (resumir) los datos obtenidos tiempo medio de licencia en fumadores y no (estadísticos) % de licencias por fumadores y sexo (frecuencias), gráficos,... Realizar una inferencia sobre la población Los fumadores están de licencia al menos 10 días/año más de media que los no fumadores. Cuantificar la confianza en la inferencia –Nivel de confianza del 95% –Significación del contraste: p=2% Todavía no es necesario entender esto

26 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Plantear hipótesis Obtener conclusiones Recoger datos y analizarlos Diseñar experimento Método científico y estadística (Primera aproximación)

27 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Ramas de la Estadística Estadística descriptiva – resumen y descripción de los datos recolectados. Estadística inferencial – generalización de una muestra a una población. Probabilidad

28 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Relaciones entre Probabilidad y Estadística Inferencial Población Muestra Probabilidad (deducción) Estadística inferencial (inducción)

29 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

30 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Ejemplo 1: Datos del Challenger >STEM C1 Stem and Leaf Plot of variable: C1, N = 36 Minimum: Lower hinge: Median: Upper hinge: Maximum: * * * Outside Values * * * H M H Min. 1st Qu. Median Mean 3rd Qu. Max The decimal point is 1 digit(s) to the right of the | 3 | 1 4 | | | | | 0134

31 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Histograma >DENSITY C1/ HIST Programa Comercial R

32 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Ejemplo 2: Resistencia del concreto + superplatificantes >STEM C1 Stem and Leaf Plot of variable: C1, N = 27 Minimum: Lower hinge: Median: Upper hinge: Maximum: H M H * * * Outside Values * * * 11 8 C1 = Presión en mega pascales

33 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Métodos gráficos y Tabulares de la Estadística Descriptiva

34 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

35 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

36 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

37 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

38 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

39 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

40 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

41 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

42 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

43 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Datos reales

44 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Diagrama de puntos Los datos se representan con puntos. Para pocos datos con relativamente pocos valores distintos de los datos.. Temperatura de los anillos O (para los pernos de junturas) Temperatura de los anillos O

45 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

46 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

47 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Diagramas de Tallo y Hojas 1. Selecciones uno o más dígitos iniciales para valores del tallo. El dígito, o dígitos, final(es) se convierte(n) en hojas. 2. Haga una lista de los valores de tallos en la columna vertical. 3.Registre una hoja por cada observación junto al valor correspondiente del tallo. 4. Indique las unidades para tallos y hojas en algún lugar del diagrama

48 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

49 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

50 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

51 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Otro ejemplo de tallo y hojas 9, 10, 15, 22, 9, 15, 16, 24,11 Valores observados: Tallo: DecenasHojas: unidades

52 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Despliegues de los Diagramas de Tallo y hojas Identificación de un valor característico o representativo. Grado de dispersión respecto al valor característico. Presencia de huecos en los datos. Grado de simetría en los valores de la distribución Cantidad y ubicación de los picos Presencia de cualquier valor alejado o atípico.

53 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Otro ejemplo de tallo y hojas Porcentaje de alumnos que consumen alcohol en 140 colegios, 1994 (P12) 0 | 4 1 | | | | | | | 2 se lee 62 DecenasUnidades

54 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Diagrama de Tallos y Hojas La idea que está detrás del diseño de los diagramas de tallo y hojas es hacer efectivo todo elemento gráfico de la información. Al presentar su invención, John Tukey escribió Si uno hace una marca, puede que tenga algún sentido. La marca mas simple, con mayor sentido y más útil es un dígito. Decodificar los datos para: Calcular estadísticos básicos. ¿Qué tipo de distribución es esta? ¿Normal?

55 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual No siempre conviene el stem stem(ventas,.5) 3 | | | | | Tiempo Sin tomar en cuenta el tiempo Tomando en cuenta el tiempo Producción de cerveza

56 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Tipos de Variables Una variables es discreta si su conjunto de valores posibles constituye un conjunto finito o una secuencia infinita. Una variable es continua si su conjunto de valores posibles consiste de un intervalo entero de la recta numérica.

57 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual : Una dama victoniana..

58 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual La estadística (posterior enfermera) Florence Nightingale recogió las estadísticas de los hospitales militares británicos, produciendo histogramas como este que se presenta aquí: El eje radial indica los muertos – en hospitales como también en el campo de batalla de soldados británicos en la guerra de Crimea. Sus esfuerzos estadísticos mejoraron directamente las condiciones de los hospitales y la reducción de las tazas de mortalidad.

59 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Histogramas de Datos Discretos Determine las frecuencias absolutas y relativas para cada valor de x. Después marque los valores posibles de x sobre una escala horizontal. Arriba de cada valor, dibuje un rectángulo cuya altura relativa es la frecuencia de ese valor.

60 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Ej. A 150 estudiantes de un pequeño CFT se les pregunta sobre cuando cambios de tarjetas de crédito realizaban. x es la variable que representa el número de tarjetas y resultados de abajo. x#personas Frec. Rel Distribución de frecuencia

61 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Histogramas xRel. Freq Resultados de las tarjeta de crédito:

62 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Histogramas Datos Continuos: Caso de Anchos Iguales Determine la frecuencia absoluta y relativa de cada clase. Marque los límites de clase en el eje de medición horizontal. Arriba de cada intervalo de clase, dibuje un rectángulo cuya altura es la frecuencia relativa.

63 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Histogramas Datos Continuos: Caso de Anchos Desiguales Después de determinar las frecuencias absolutas y relativas, calcule la altura de cada rectángulo usando: Las alturas que resultan se llaman densidades y la escala vertical se llama escala de densidad. Altura del rectángulo Frecuencia relativa de la clase Ancho de clase

64 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Formas de Histogramas Unimodal SimétricaBimodal Asimétrica PositivaAsimétrica Negativa

65 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Ejemplo Población: conjunto de estudiantes de en la UACH en Unidad de observación: estudiantes de primer año en la UACH Variables: Sexo (S, cualitativa), Talla en cm (T, cuantita- tiva continua), Pesos en Kg (P, cuantitativa continua), Número de hermanos y de hermanas (F, cuantitativa discreta), Color de los ojos (C, cualitativa). Modalidades o valores de las variables: S: {hombre, mujer}; T: [120, 210]; P: [40, 200]; F: {0, 1,..., 10}; C: { café, azul, verde, negro, gris}.

66 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Ejemplo

67 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Distribución de una variable cualitativa

68 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Ejemplo

69 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Histograma de color de ojos

70 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Distribución de una variable cuantitativa

71 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Número de observaciones << n

72 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual n > 20

73 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Recomendaciones para histogramas

74 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Organización de los datos

75 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Tabla de frecuencias

76 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

77 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

78 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Curva de distribución de una población

79 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Función de distribución acumulativa empírica

80 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual F n (x) suavisada

81 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Características principales de una distribución

82 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Ej. 1.9: Distribución de los hits de los juegos de beisball de 9 entradas desde 1989 a 1993 Hit/juego Frecuencia relativa

83 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Ejemplo 1.10: Consumos de energía en BTU C1= Consumo de energía en BTU

84 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Ejemplo 1.11: Corrosión del acero reforzado en estructuras de concreto Stem and Leaf Plot of variable: C1, N = 48 Minimum: Lower hinge: Median: Upper hinge: Maximum: H M H * * * Outside Values * * *

85 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual

86 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Histograma de los accidentes

87 Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual Tarea Cap 1. Sec 1. Problemas: 4, 6, 8. Cap 1. Sec 2. Problemas: 10, 12, 14, 16, 22, 24, 26, 28, 32.


Descargar ppt "Cap 01 Sec 01 y 02 Prof. Heriberto Figueroa S. Material de clases para estudio individual 01-02 1 Capítulo 1. Vistazo y Estadística Descriptiva I Parte."

Presentaciones similares


Anuncios Google