La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Estadística I Plutarco Martínez Bustos.

Presentaciones similares


Presentación del tema: "Estadística I Plutarco Martínez Bustos."— Transcripción de la presentación:

1 Estadística I Plutarco Martínez Bustos

2 ESTADÍSTICA EN PSICOLOGÍA
PLUTARCO MARTÍNEZ BUSTOS

3 Calendario académico 2014 – 2
Primer seguimiento: del 1 – al 6 de septiembre Segundo seguimiento: del 6 al 11 de octubre Tercer seguimiento: del 10 al 15 de noviembre

4 Contenido Unidad I: Conocimientos Básicos y Generales Sobre Estadística Descriptiva ¿Qué es Estadística? ¿Por qué la Estadística en el grado de Psicología? Que es investigación estadística Conceptos Básicos: Estadística descriptiva, estadística inferencial, población, Muestra, variable, variables cuantitativas y cualitativas Elaboración de una tabla de frecuencias de frecuencias. Análisis e interpretación de tablas de frecuencias. Variables cuantitativas discretas y continuas y variables cualitativas Representaciones gráficas Aplicación de lo visto utilizando la herramienta de Excel

5 Contenido Unidad II. Medidas de Tendencia Central, de Dispersión y de Forma Medidas de Tendencia Central: Media, mediana, moda, cuartiles, deciles y percentiles. Medidas de dispersión: Varianza, desviación típica, coeficiente de variación. Medidas de Forma: Asimetría y curtosis Aplicación de lo visto utilizando la herramienta de Excel Unidad III. Relación Entre Variables Covarianza Coeficiente de correlación Relación entre variables

6 Contenido Unidad IV. Probabilidad Experimento, Espacio Muestral,
Eventos Permutaciones y Combinaciones Probabilidad de un Evento Aplicación de todo lo visto

7 Estadística Es la ciencia que se ocupa de 1) La recolección, organización, resumen y análisis de los datos y 2) la obtención de inferencias a partir de un volumen de datos cuando se examina solo una parte de estos. Las personas que realizan esta actividad estadística deben estar preparadas para interpretar y comunicar los resultados a los demás, tal como lo demande la situación. En términos sencillos, se puede decir que los datos son números, que los números contienen información y que el propósito de la estadística es investigar y evaluar la naturaleza y el significado de esa información.

8 ¿Por qué la Estadística en Psicología?
La estadística es una herramienta básica para la investigación. En Psicológica juega un papel importante porque permite abstraer y elaborar categorías conceptuales a partir de los datos, las cuales permiten describir, predecir y/o explicar la conducta humana. La presencia de la estadística en el plan de formación de psicólogos se justifica desde la perspectiva de la formación investigativa, la cual favorece el desarrollo de hábitos de rigor científico, así como el desarrollo del pensamiento lógico formal. Es necesario que los psicólogos desarrollen la competencia para leer, comprender, analizar y criticar los resultados descriptivos de las publicaciones científicas desarrolladas en la disciplina psicológica, las cuales en su gran mayoría utilizan como método de análisis para sus datos procedimientos estadísticos.

9 ¿Qué es Investigación Estadística?
Es la metodología orientada a la recopilación de información sobre una población. Es la que permite identificar, determinar y seleccionar todos los elementos necesarios (variables, población, datos, métodos) para medir la investigación. El conocimiento de la estadística interviene en todas las fases del trabajo de investigación, desde la decisión sobre las variables que se investigan y la planificación de la forma que se ha de recoger los datos, hasta la interpretación de los resultados obtenidos en el análisis del mismo.

10 ¿Qué es Investigación Estadística?
Los aspectos básicos en el planteamiento de una investigación estadística son: Objeto de la investigación Unidad de investigación Recolección de la información Procesamiento de la información Publicación

11 Conceptos Básicos en Estadística

12 Estadística Descriptiva
Procedimientos empleados para organizar y resumir conjuntos de observaciones en forma cuantitativa, puede hacerse mediante tablas y gráficos, estos permiten simplificar la complejidad de los datos que intervienen en la distribución. Así mismo se calculan parámetros estadísticos que caracterizan la distribución. No se hace uso del cálculo de probabilidades y únicamente se limita a realizar deducciones directamente a partir de los datos y parámetros obtenidos. Con este método, se obtienen conclusiones sobre el conjunto de datos sin que sobrepasen el conjunto de conocimientos que proporcionan.

13 Estadística Inferencial
Plantea y resuelve el problema de establecer previsiones y conclusiones generales sobre una población a partir de la información contenida en una muestra. Los modelos estadísticos actúan de puente entre lo observado (muestra) y lo desconocido (población). Su conclusión y estudio están basado en el cálculo de las probabilidades. Método y conjunto de técnicas utilizadas para obtener un conjunto de datos, conclusiones que sobrepasan los límites de los conocimientos aportados por el conjunto de datos. Generalmente este proceso se determina mediante el estudio de muestras.

14 Conceptos Básicos Población: Es el conjunto de todos los elementos que cumplen ciertas propiedades y entre los cuales se desea estudiar un determinado fenómeno. Muestra: Es el subconjunto de la población que es estudiado y a partir de la cual se sacan conclusiones sobre las características de la población. La muestra debe ser representativa, en el sentido de que las conclusiones obtenidas deben servir para el total de la población. Variable: Cada uno de los rasgos o característica de los elementos de una población y que varían de un individuo a otro (salario, color de ojos, sexo, número de hijos, etc.)

15 Conceptos Básicos Tipos de Variables Variables cualitativas (o categóricas): Aquellas que no aparecen en forma numérica, sino como categorías o atributos (sexo, estado civil, color de ojos, etc.) Estas pueden agruparse en variables nominales u ordinales. Variable nominal: Cuando los datos correspondan a una variable cualitativa que se agrupa sin ninguna jerarquía entre sí, como por ejemplo: nombres de personas, de establecimientos, raza, grupos sanguíneos, estado civil. Estas variables no tienen ningún orden inherente a ellas ni un orden de jerarquía. Variable ordinal: Cuando las categorías o valores que adopte una variable cualitativa poseen un orden, secuencia o progresión natural esperable, por ejemplo: grados de desnutrición, respuesta a un tratamiento, nivel socioeconómico, intensidad de consumo de alcohol, días de la semana, meses del año, etc.

16 Conceptos Básicos Variables cuantitativas: Las que pueden expresarse numéricamente (temperatura, producción, edad, etc.) Las Variables cuantitativas se clasifican en variables discretas y variables continuas Si entre dos valores determinados existen infinitas posibilidades de valores, hablaremos de una variable de tipo continuo. Ejemplos de este tipo de variables son: el peso, la talla, la presión arterial o el nivel de colesterol, etc. Si la variable a medir sólo puede adoptar un sólo valor numérico, entero, con valores intermedios que carecen de sentido, hablaremos de variable cuantitativa de tipo discreto. Son ejemplos de ellas: el número de hijos, de unidades vecinales del sector, número de exámenes de laboratorio o de pacientes atendidos.

17 Elaboración de una Tabla de Frecuencias – Datos no Agrupados
Para elaborar una tabla de frecuencias se procede de la siguiente manera: Marca de clase (𝑋𝑖): Son las observaciones Frecuencia absoluta (𝑓𝑎): Es el número de veces que se repite cada observación Frecuencia absoluta acumulada (𝐹𝐴): Es la suma sucesiva de la frecuencia absoluta Frecuencia relativa (𝑓𝑟): Es la relación entre la frecuencia absoluta y el total de observaciones multiplicado por cien. Esto es: 𝑓𝑟= 𝑓𝑎 𝑛 ∗100 Frecuencia relativa acumulada (𝐹𝑅): Es la suma sucesiva de la frecuencia relativa

18 Ejemplo 1 Según la Asociación de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que la delgadez sea sinónimo de éxito social. Muchos jóvenes luchan para conseguir el “físico ideal” motivados por modelos, artistas o por la publicidad comercial. Durante el mes de marzo, en un colegio de la ciudad, después de las vacaciones de mitad de año, se observó con precaución a 27 alumnos con síntomas de anorexia, registrándose los siguientes signos visibles: Dieta Severa Miedo a engordar Hiperactividad Uso de ropa holgada Uso de laxantes

19 Representación Gráfica
Para dar una información general de los datos, se usan las representaciones gráficas. Las gráficas sirven visualizar mejor la información, pero nunca sustituyen al cuadro, tan solo se les debe considerar como complemento. Gráfico de frecuencias (Gráfico de barra): En el eje horizontal se colocan los distintos valores de la variable Xi y en el eje vertical van los valores de las frecuencias absolutas o relativas.

20 Representación Gráfica
Gráfico circular: Es el área del circulo dividido en sectores o porciones de área correspondiente a la frecuencia relativa, cada sector circular se encuentra por la expresión. 𝛼= 𝑓𝑟 100 ∗360 donde 𝑓𝑟 es la frecuencia relativa.

21 Ejemplo 2 El tratamiento de los niños con desórdenes de la conducta puede ser complejo. El tratamiento se puede proveer en una variedad de escenarios dependiendo de la severidad de los comportamientos. Además del reto que ofrece el tratamiento, se encuentran la falta de cooperación del niño/niña y el miedo y la falta de confianza de los adultos. Para poder diseñar un plan integral de tratamiento, el siquiatra de niños y adolescentes puede utilizar la información del niño, la familia, los profesores y de otros especialistas médicos para entender las causas del desorden. Para ello, un siquiatra local ha considerado una muestra aleatoria de 30 niños, anotando el tiempo necesario que requiere en cada niño para lograr un plan integral del tratamiento, obteniéndose lo siguiente (en horas): 7 12 8 10 6 9

22 Ejemplo 3 En una población del Cauca, el dpto. de planeación de la alcaldía tomó una muestra de familias para observar el número de niños menores de 7 años, con el propósito de estimar algunos indicadores sobre demanda potencial de educación Pre escolar. Esta arrojó los siguientes resultados por familia: Construir una tabla de frecuencias y hacer una interpretación general de la información ¿Qué porcentaje de familias tienen 2 niños menores de 7 años? ¿Qué porcentaje de familias tienen menos de tres niños menores de 7 años? ¿Qué porcentaje de familias tienen entre un y tres niño menor de 7 años? ¿Qué porcentaje de familias tienen como mínimo dos niños menores de 7 años? Grafico de barras para fr y grafico circular 1 2 4 3

23 Elaboración de una Tabla de Frecuencias – Datos Agrupados
Los siguientes datos representan las estaturas de una muestra de 50 estudiantes del programa de Psicología 163 144 190 158 138 180 164 193 195 159 178 196 189 152 174 168 170 167 146 198 147 165 134 175 172 194 199 136 169 151 184 202 176 154 153 166 183

24 Ejemplo 2 Los siguientes resultados representan el número de niños en 50 hogares de la cuidad de Montería. 1 4 2 3 5

25 Ejemplo 2 Los siguientes datos representan las edades de 40 personas
77 18 63 84 38 54 50 59 56 36 34 44 41 58 53 62 43 52 61 60 45 66 83 71

26 Ejemplo 3 Los siguientes datos representan los pesos en kg. de 50 estudiantes. Elabore la tabla de frecuencias Realice un histograma para fr Realice una ojiva para FA 65 51 63 69 67 53 58 60 61 73 74 64 72 68 66 55 57 62 71 75 56 59 52 70

27 Representación Gráfica
Histograma: Son diagramas de frecuencias unidimensionales en los cuales en un plano cartesiano se levantan rectángulos de área proporcionales a las frecuencias sobre los intervalos del eje horizontal. en ellos se representan las frecuencias absolutas y relativa. Ojiva: La representación gráfica para las frecuencias absolutas y relativas acumuladas en una variable se hace a través de una ojiva ascendente. Para ello se determinan los puntos de intercepción entre cada valor de la variable y su respectiva frecuencia, luego se une con trazos rectilíneos

28 Ejemplo Para el siguiente conjunto de datos Hallar: Media Mediana Moda
3 5 4 10 8 7 2 6 9

29 Medidas de Tendencia Central
Las medidas de tendencia central nos permiten determinar la posición de un valor respecto a un conjunto de datos, el cual consideramos como representativo para el total de las observaciones. Dentro de las medidas de tendencia central tenemos: Media Aritmética, mediana, moda. Media Aritmética 𝑿 : Es la mas conocida y sencilla de calcular, de gran estabilidad en el muestreo y sus formulas admiten tratamientos algebraicos. Su principal desventaja es el de ser muy sensibles a los cambios que se le haga en algunos de sus valores, o cuando los valores extremos son demasiado grandes o pequeños. La media se define como:

30 Medidas de tendencia Central
𝑥 = 𝑥 𝑛 Mediana (Me):Se dene como el valor central en la distribución de los datos. De la mediana se puede decir que es única, es simple y los valores extremos no tienen efectos importantes sobre la mediana, lo que si ocurre con la media. a. Número impar de observaciones: Si tomamos los datos originales para calcular la mediana, lo primero que debemos hacer es ordenar los datos de menor a mayor o de mayor a menor y luego tomamos el valor central.

31 Medidas de tendencia Central
b. Número par de observaciones: Cuando el número de observaciones es par, la mediana es igual al promedio aritmético de los dos términos centrales, es decir, el valor resultante de la suma de las dos observaciones centrales dividida por dos.

32 Medidas de tendencia Central
Moda (Mo): Es el valor de la variable que presenta mayor frecuencia. La moda se puede hallar en variables cuantitativas y cualitativas. Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda

33 Medidas de Posición Cuando la distribución contiene un número alto de intervalos o de marca de clases y se requiere obtener un promedio de una parte de ella, se puede dividir la distribución en cuatro, diez o cien partes. En el primer caso se habla de cuartiles, en el segundo se denomina deciles y en el último centiles o percentiles.

34 Medidas de Posición Cuartiles: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales. El primer cuartil Q1 se dene como aquel valor de la variable que supera el 25% de la observaciones y es superado por el 75% de las observaciones El segundo cuartil Q2 (la mediana), es aquel valor de la variable que supera al 50% y es superado por el 50% El tercer cuartil Q3 es aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones

35 Medidas de Posición Deciles: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales. Percentiles: Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados en cien partes iguales.

36 Ejemplos 1. Para el siguiente conjunto de datos Hallar: D3, D6 y D9
P8; P35; P60 14 17 10 6 8 15 19 11 13 9

37 Ejemplos 2. Los siguientes datos representan los ingresos mensuales de 15 persona. Hallar: Ingreso medio Ingreso central Ingreso que mas se repite Q1, D4; P80 650 670 700 750 800 850 900

38 Medidas de dispersión Son aquella que nos determinan como se agrupan o se dispersan los datos alrededor de un promedio (o media). Entre las mas importantes tenemos: Varianza, desviación típica o desviación estándar y coeficiente de variación.

39 Medidas de dispersión Varianza: De todas las medidas de dispersión es la mas importante, mas conocida y usada. Se le define como la media aritmética de los cuadrados de las desviaciones respecto a su media. Esta dada por: 𝑆 2 = 𝑥 𝑖 − 𝑥 2 𝑛−1

40 Medidas de dispersión Desviación típica o desviación estándar: Es la raíz cuadrada de la varianza, y está dada por: 𝑠= 𝑠 2 Coeficiente de variación: En ocasiones nos interesa comparar la variabilidad de dos series de datos. Generalmente podemos encontrar que ambas series están expresadas en diferentes unidades. Puede darse el caso en que estén expresadas en la misma unidad, pero nos interesa determinar la variación respecto a una base. Para resolver el anterior problema se usa 𝐶𝑉= 𝑠 𝑥 100

41 Ejemplo Los siguientes datos representan las calificaciones en las 10 asignaturas que reciben en su carrera dos estudiantes universitarios. ¿Cuál estudiante tiene menor variabilidad en sus calificaciones? Estudiante 1 fa Estudiante 2 3 1 2 3,5 4 5 Total 10

42 Medidas de Distribución
Las medidas de distribución nos permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su representación gráfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son la Asimetría y la Curtosis.

43 Asimetría Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor de la Media aritmética. La asimetría presenta tres estados diferentes, los cuales son: 1. Asimetría es positiva cuando 𝑋 > 𝑀 𝑒 > 𝑀 𝑜 2. Simétrica cuando 𝑋 = 𝑀 𝑒 = 𝑀 𝑜 3. Asimetría negativa cuando 𝑋 < 𝑀 𝑒 < 𝑀 𝑜

44 Asimetría

45 Coeficiente de Asimetría de Fisher
El Coeficiente de asimetría, se calcula mediante la siguiente fórmula: 𝐴𝑠= 𝑥 𝑖 − 𝑋 3 𝑛 𝑠 3 Si As = 0 la distribución es simétrica. Si As > 0 La distribución es asimétricamente positiva. Si As < 0 La distribución es asimétricamente negativa

46 Curtosis Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución TIPOS DE CURTOSIS Así puede ser: Leptocúrtica.- Existe una gran concentración. Mesocúrtica.- Existe una concentración normal. Platicúrtica.- Existe una baja concentración.

47 TIPOS DE CURTOSIS

48 Coeficiente de Curtosis
Para calcular el coeficiente de Curtosis se utiliza la ecuación 𝑎= 𝑥 𝑖 − 𝑋 4 𝑛 𝑠 4 Si a < 3 la distribución es platicúrtica Si a = 3 la distribución es normal o mesocúrtica Si a > 3 la distribución es leptocúrtica

49 Ejemplos Determinar qué tipo de asimetría y curtosis tienen las siguientes distribuciones 8, 14, 16, 13, 16 6, 9, 9, 12, 12, 12, 15 y 17

50 Medidas de las relaciones entre variables
A menudo se utilizan las relaciones entre variables. La covarianza y la correlación permiten describir numéricamente una relación lineal. Covarianza (Cov): Es una medida de la relación lineal entre dos variables. Un valor positivo indica una relación lineal directa o creciente y un valor negativo una relación lineal decreciente. La Cov está dada por 𝐶𝑜𝑣 𝑥,𝑦 = 𝑥 𝑖 − 𝑥 𝑦 𝑖 − 𝑦 𝑛−1

51 Coeficiente de correlación: Nos da una medida de la relación lineal entre dos variables, nos indica el sentido como el grado de relación. La covarianza y el coeficiente de correlación tienen el mismo signo (ambos positivos o ambos negativos). Esta dado por: 𝑟= 𝐶𝑜𝑣(𝑥,𝑦) 𝑆 𝑥 𝑆 𝑦 El coeficiente de correlación va de -1 a +1. Cuanto más cerca se encuentra r de +1, mas cerca se encuentran los datos de puntos de una línea recta ascendente que indican una relación lineal positiva. Cuanto más se encuentra r de -1, mas cerca se encuentran los datos de puntos de una línea recta descendente que indican una relación lineal negativa. Cuando r=0, no existe relación entre x e y.

52 Ejemplo Para las variables X e Y. Encuentre la covarianza y el coeficiente de correlación X Y 6 80 7 60 8 70 9 40 10

53 Relaciones Lineales Las relaciones lineales se expresan en términos matemáticos de la forma siguiente: 𝑦=𝑓 𝑥 Donde f(x) es una función que puede adoptar muchas formas lineales y no lineales. En el modelo de regresión lineal simple hay dos variables una independiente(x) y una dependiente (y) , el cual esta dado por: 𝑦=𝑎+𝑏𝑥 Con 𝑎 como la ordenada en el origen y 𝑏 la pendiente de la recta. Es decir la variación que experimenta 𝑦 por cada variación unitaria de 𝑥

54 Regresión por mínimos cuadrados La recta de regresión 𝑦=𝑎+𝑏𝑥 Donde 𝑏= 𝐶𝑜𝑣(𝑥,𝑦) 𝑠 𝑥 2 Y 𝑎= 𝑦 −𝑏 𝑥

55 Ejemplo Una empresa fija un precio distinto para un sistema de DVD en ocho regiones del país. Los siguientes datos muestran los precios (x) y el número de unidades vendidas (y) (en miles de dólares) a. Encuentre los valores de a y b para la recta de regresión b. Estime la venta para un precio de 7.0 c. Represente los datos en un grafico de dispersión Precio 5.5 6.0 6.5 5.0 4.5 Ventas 420 380 350 400 440 450

56 Promedio de exámenes cortos
Ejemplo Un profesor intenta mostrar a sus estudiantes la importancia de los exámenes cortos, aun cuando el 90% de la calificación final esté determinada por los exámenes parciales. Él cree que cuanta más alta son las calificaciones de los exámenes cortos, más alta será la calificación final. Seleccionó una muestra aleatoria de 10 estudiantes de su clase con los siguientes datos: 1. Encuentre la recta de regresión 2. Estime la nota promedio final para una nota promedio de exámenes cortos de 80 3. Dibuje un diagrama de dispersión para estos datos y trace la recta de regresión Promedio de exámenes cortos 59 92 72 90 95 87 89 77 76 65 Promedio Final 84 80 81 69

57 Bibliografía Levin Jack, Fundamentos de estadística en la investigación social. 2da edición, Harla. Wayne D. Bioestadística Base Para el Análisis de las Ciencias de la Salud. 4ta edición, Limusa Molina J y Rodrigo M. Estadística descriptiva en Psicología. Material de clase. Disponible en:

58


Descargar ppt "Estadística I Plutarco Martínez Bustos."

Presentaciones similares


Anuncios Google