La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión.

Presentaciones similares


Presentación del tema: "CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión."— Transcripción de la presentación:

1 CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

2 CAPÍTULO 4: Estadística. Modelos de regresión Estadística unidimensional Estadística bidimensional

3 Estadística Unidimensional 4.1 Origen de la Estadística 4.2 Nociones generales 4.3 Tablas de frecuencias 4.4 Parámetros estadísticos: Medidas de centralización Medidas de dispersión

4 4.1 Origen de la Estadística El origen de la Estadística está estrechamente relacionado con los censos realizados a lo largo de la historia. Desde las culturas más antiguas, existe una enorme preocupación por conocer el capital humano y la distribución de los recursos.

5 4.1 Origen de la Estadística En China, desde la cultura Han hasta los tiempos modernos, se han llevado a cabo numerosos recuentos de la población. El Imperio Romano erigió la figura del censor, que, con el paso del tiempo, fue desempeñando una labor fundamental en el control del Imperio. En la Edad Media, Carlomagno ordenó la creación de un registro de todas sus propiedades, así como de los bienes privados.

6 4.1 Origen de la Estadística En el año 1662, el inglés John Graunt publicó un tratado con las observaciones políticas y naturales referidas a la ciudad de Londres. Puede considerarse el primer trabajo estadístico serio sobre la población. Nacía así una nueva ciencia: la Estadística.

7 4.1 Origen de la Estadística Curiosamente, J. Graunt no conocía los trabajos de B. Pascal (1623- 1662) ni de C. Huygens (1629-1695) sobre estos mismos temas. En Londres y en París se estaban construyendo, casi de manera simultánea, las dos disciplinas que actualmente llamamos Estadística y Probabilidad.

8 4.1 Origen de la Estadística La estadística es sus orígenes era más bien una ciencia de carácter demográfico pero, con el matemático belga Adolphe Quetelet (1796-1874), dio un paso de gigante, asentándose las bases fundamentales del futuro trabajo estadístico. De esta forma, la estadística fue invadiendo la mayoría de los campos de las ciencias naturales y humanas.

9 4.1 Origen de la Estadística Hoy, la Estadística es, sobre todo, un instrumento de decisión, una ciencia que usa los números para tener más conocimiento de la naturaleza y de la experiencia. La estadística es un conjunto de métodos que nos ayudan a tomar decisiones razonables, incluso en casos de incertidumbre.

10 4.2 Nociones generales La Estadística es el estudio de los mejores modos de acumular y analizar datos y de establecer conclusiones acerca del colectivo del que se han recogido tales datos. Los conceptos básicos son los siguientes:

11 4.2 Nociones generales Población. Conjunto de todos los elementos que nos interesan y que serán objeto de estudio. Muestra. Subconjunto, extraído de la población, cuyo estudio sirve para inferir (sacar conclusiones) de las características de toda la población. El número de elementos de la muestra se llama tamaño de la misma. Individuo. Cada uno de los elementos de la población o de la muestra.

12 4.2 Nociones generales Carácter estadístico. Cada una de las propiedades (aspectos) que pueden estudiarse en los individuos de una población. Un carácter permite clasificar a los individuos de la población. Caracteres cualitativos son los que no se pueden medir ni comparar, porque no toman valores numéricos: sexo, estado civil, raza,… Caracteres cuantitativos son los que se pueden medir, es decir, los que toman valores numéricos: edad, talla, peso, número de hermanos,..

13 4.2 Nociones generales Variable estadística: Conjunto de valores que toma un carácter estadístico. Pueden ser cualitativas o cuantitativas dependiendo del carácter estadístico Las variables estadísticas cuantitativas se llaman: discretas cuando los valores son aislados (edad, número de hijos, …) continuas cuando pueden tomar todos los valores de un intervalo (talla, peso,…).

14 4.2 Nociones generales Las dos ramas de la Estadística: Estadística descriptiva: Trata de describir y analizar algunas características de los individuos de un grupo dado, sin extraer conclusiones para un grupo mayor. Estadística inferencial: Trabaja con muestras y pretende, a partir de ellas, inferir características de toda la población. Es decir, se pretende tomar como generales propiedades que sólo se cumplen en casos particulares.

15 4.2 Nociones generales Nos ocupamos ahora de la Estadística descriptiva, para la que se siguen los siguientes pasos: Selección de los caracteres a estudiar. Análisis de cada carácter, anotando los valores que toman los individuos en ellos. Clasificación y organización en tablas de los resultados obtenidos. Cálculo de parámetros estadísticos a partir de los datos obtenidos. Realización de gráficos estadísticos.

16 4.3 Tablas de frecuencias Las tablas de frecuencias sirven para ordenar y organizar los datos. Si el carácter estadístico que estamos estudiando toma N valores, que podemos llamar x i ( ), estos serán los valores que toma la variable estadística.

17 4.3 Tablas de frecuencias La Frecuencia absoluta (f i ) es el número de veces que se repite el valor x i. La Frecuencia relativa (fr i ) del valor x i se calcula dividiendo su frecuencia absoluta por el número total de individuos que estamos estudiando. Esta frecuencia también se suele expresar en “tantos por ciento”. n = nº total de datos

18 4.4. Parámetros estadísticos Designamos con este nombre a los números que describen, de manera concisa, el comportamiento y las características generales de un conjunto de datos estadísticos. Se agrupan en dos categorías: Medidas de centralización Medidas de dispersión.

19 4.4. Parámetros estadísticos Medidas de centralización Se refieren al promedio de un conjunto de datos, y siempre llevan la unidad de medida del carácter que se está tratando. Vamos a estudiar: La Media La Moda La Mediana.

20 4.4. Parámetros estadísticos Medidas de centralización La Media Es el parámetro de centralización más importante, puesto que en la mayoría de los casos es el valor idóneo para representar a todos los datos. Es la media aritmética de los datos.

21 4.4. Parámetros estadísticos Medidas de centralización La Moda Es el valor que se presenta con mayor frecuencia en un conjunto de datos.

22 4.4. Parámetros estadísticos Medidas de centralización La Mediana Es el valor central de los datos cuando éstos se han dispuesto ordenadamente de menor a mayor. Cuando el número de datos sea par, la Mediana es la media aritmética de los dos datos que ocupan los lugares centrales.

23 Medidas de centralización EJEMPLO 1 Preguntados por su edad a diez alumnos/as de Primer Curso de CC. Ambientales, se han obtenido los siguientes resultados: 18, 20, 18, 19, 20, 18, 18, 18, 19, 19 años

24 Medidas de centralización EJEMPLO 1 Preguntados por su edad a diez alumnos/as de Primer Curso de CC. Ambientales, se han obtenido los siguientes resultados: 18, 20, 18, 19, 20, 18, 18, 18, 19, 19 años Moda = 18 años Es el dato que más se repite 5 veces (tiene la mayor frecuencia).

25 Medidas de centralización EJEMPLO 1 Para calcular la Mediana se ordenan los datos de menor a mayor: 18, 18, 18, 18, 18, 19, 19, 19, 20, 20 Como el número de datos es par la Mediana se obtiene tomando la media de los dos datos centrales, los de lugares 5º y 6º, que son 18 y 19.

26 Medidas de centralización EJEMPLO 2 De los empleados del ayuntamiento de Pozogrande, 38 cobran al mes 900 €, 8 perciben 1500 €, y los 4 restantes 2500 €. ¿Cuánto cobran los empleados por término medio? ¿Es representativa, en este caso, la media? ¿Calcula otras medidas de centralización que sean más representativas?

27 Medidas de centralización EJEMPLO 2 De los empleados del ayuntamiento de Pozogrande, 38 cobran al mes 900 €, 8 perciben 1500 €, y los 4 restantes 2500 €. Moda = 900 euros

28 Medidas de centralización EJEMPLO 2 Diagrama de Barras

29 4.4. Parámetros estadísticos Medidas de dispersión Las medidas de dispersión completan el análisis numérico de un conjunto de datos, pues determinan la mayor o menor variación de los datos. Dan una idea del alejamiento de ellos respecto a las medidas de centralización. Rango Desviación Media Varianza y Desviación Típica.

30 4.4. Parámetros estadísticos Medidas de dispersión El Rango (Amplitud o Recorrido) es la diferencia entre el mayor valor y el menor valor de los datos. En el ejemplo 2, sería: Rango = 2500 – 900 = 1600 €.

31 4.4. Parámetros estadísticos Medidas de dispersión La Desviación Media (DM) se define como la media aritmética de las desviaciones absolutas de cada valor respecto a la media.

32 4.4. Parámetros estadísticos Medidas de dispersión Las medidas de dispersión más importantes son: La Varianza (S x 2 ) y la Desviación Típica (S x ).

33 4.4. Parámetros estadísticos Medidas de dispersión Dos fórmulas para la Varianza (S x 2 ):


Descargar ppt "CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión."

Presentaciones similares


Anuncios Google