La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ANALISIS DE VARIABLES CUANTITATIVAS EN EL PROCESO DE INVESTIGACIÓN

Presentaciones similares


Presentación del tema: "ANALISIS DE VARIABLES CUANTITATIVAS EN EL PROCESO DE INVESTIGACIÓN"— Transcripción de la presentación:

1 ANALISIS DE VARIABLES CUANTITATIVAS EN EL PROCESO DE INVESTIGACIÓN

2 La Estadística tiene por objeto la recolección, presentación, análisis e interpretación de observaciones o mediciones hechas sobre un conjunto de objetos, personas, procesos, fenómenos, etc. La Estadística descriptiva es la rama de la Estadística dedicada a descubrir las regularidades o características existentes en un conjunto de datos mediante la utilización de gráficos y de medidas numéricas de resumen. A través de la cuantificación y ordenamiento de los datos intenta explicar los fenómenos observados, por lo que resulta una herramienta de suma utilidad para la toma de decisiones. La Estadística inferencial permite, mediante la utilización de métodos estadísticos basados en la teoría de las probabilidades, generalizar las conclusiones obtenidas a partir de una muestra a la población de la que ha sido extraída

3 VARIABLE: es la característica que se le estudia u observa a los individuos (o elementos) que conforman la población o muestra ”. Ej: peso, dimensiones, nºde defectuosos, nº de ausentes, etc De acuerdo a su naturaleza se las clasifica en cualitativas o cuantitativas. Cualitativas: asume modalidades o atributos Cuantitativas: asume valores numéricos. Las variables cuantitativas, según como se originen, pueden clasificarse en discretas o continuas. Las mediciones dan origen a datos continuos y las enumeraciones o conteos originan datos discretos. Discretas: surgen de un conteo y asumen valores enteros no negativos (naturales) Ej: nº de hijos, nº de hoteles, nºde autos, nº de empresas. Continuas: surgen de una medición y asumen valores reales, Ej: velocidad de un automóvil, altura de las personas, hectáreas en producción

4 ANÁLISIS En primer lugar el investigador describe sus datos y posteriormente realiza un análisis estadístico para relacionar sus variables. Es decir, realiza un análisis de estadística descriptiva para cada una de sus variables y luego describe la relación entre estas. Los principales análisis para las variables dentro de la estadística descriptiva son:    Distribución de frecuencias Medidas de tendencia central Medidas de variabilidad

5 Distribuciones de Frecuencias
Una distribución de frecuencias es una tabla que presenta en forma ordenada los distintos valores o categorías de una variable y sus correspondientes frecuencias.

6 Mediante un ejemplo veremos la presentación de una tabla de frecuencias simples para una variable discreta Consideremos la variable "número de cuartos por hogar" según datos de la Encuesta Permanente de Hogares para la ciudad de Formosa. Número de cuartos por hogar (1) Frecuencia absoluta (2) Frecuencia relativa (3) Frecuencia acumulada (4) Frecuencia relativa acumulada (5) 1 144 0,214 2 225 0,334 369 0,548 3 174 0,259 543 0,807 4 88 0,131 631 0,938 5 42 0,062 673 1,000 - En la columna (1) se observan los valores que toma la variable "número de cuartos por hogar", cuyo campo de variabilidad o recorrido es de 1 a 5. En la columna (2) se ha colocado la cantidad de hogares u observaciones correspondientes a cada valor de la variable, es decir la frecuencia absoluta que presenta cada valor de la misma. Si sumamos esta columna se obtiene la cantidad total de hogares.º Luego, en la columna (3) se calcula el cociente de cada uno de los valores de la columna (2) respecto al total de hogares. Llamamos a estos valores frecuencias relativas. Las frecuencias relativas representan la importancia relativa de cada valor de la variable en el total de casos. En la columna (4) se suman los hogares acumulados hasta cada uno de los valores de la variable. Por ejemplo: si queremos saber cuántos hogares hay que tienen como máximo 2 cuartos, se observa que se acumulan 369, o sea, 144 hogares con un cuarto y 225 con 2 cuartos. Estos valores se denominan frecuencias acumuladas.  Finalmente, en la columna (5) se efectúa el cociente entre los valores de la columna (4) y el total de hogares, lo que nos indica el peso relativo de los casos acumulados hasta cada uno de los valores de la variable, y llamamos a esta columna frecuencia relativa acumulada. IMPORTANTE: En la mayoría de los casos, principalmente cuando se trabaja con muestras, es mas importante tener información sobre las frecuencias relativas (simples y acumuladas) que sobre las absolutas.

7 Tablas de frecuencias para valores agrupados: en el caso de tener una variable discreta con muchas categorías o de tratarse de una variable continua, será necesario fijar intervalos de clase para llegar a un resumen efectivo de la información original. Esta información se presenta en una tabla de frecuencias para datos agrupados. Definimos como intervalos de clase a las subdivisiones o intervalos en que se divide el dominio o campo de variabilidad de la variable Por ejemplo, si se estudia la distribución por edad de la población de un país se está en presencia de una variable que toma muchos valores distintos. Estos valores se pueden agrupar en intervalos de clase tomando tramos de edades que cubran todo el recorrido de la variable. Se podrían definir, por ejemplo, los siguientes intervalos de clase: 0 a 10 años, 11 a 20 años, 21 a 30 años, etc. Llamamos límites de clase a los valores que definen los extremos de un intervalo. Por ejemplo: el intervalo 0 a 10 años, tiene como límites a los valores 0 y 10.   La amplitud del intervalo estará dada por la diferencia entre el límite superior y el límite inferior.   Cada intervalo tendrá también lo que se llama marca de clase, que es el punto medio del mismo. Observaciones: Generalmente se aconseja que las tablas de frecuencias tengan entre 5 y 15 intervalos de clase, de modo que no haya tantos como para que no sea manejable la tabla, ni tan pocos como para que la amplitud sea tan grande que haga perder información. Para calcular la amplitud de intervalo necesaria, se busca primero la amplitud o rango de la variable, es decir la diferencia entre el mayor y el menor de los valores que toma la variable, y luego, el resultado se divide por la cantidad de intervalos que se quieran formar.

8 Ejemplo: en una empresa se obtuvo la edad de los empleados del sector productivo. Las observaciones se ordenaron y organizaron en la siguiente tabla: Intervalo de clase Marca de clase Frecuencia absoluta Frecuencia relativa Frecuencia absoluta acumulada Frecuencia relativa acumulada 20‑23 22 1 0,005 24‑27 26 3 0,015 4 0,020 28‑31 30 9 0,045 13 0,065 32‑35 34 0,150 43 0,215 36‑39 38 60 0,300 103 0,515 40‑43 42 52 0,260 155 0,775 44‑47 46 35 0,175 190 0,950 48‑52 50 10 0,050 200 1,000 Total

9 Representación Gráfica de las distribuciones de frecuencias
Diagrama de Barras Gráfico de Sectores

10 Polígono de frecuencias: Consiste en una serie de segmentos que unen los puntos cuyas abscisas son los valores centrales de cada clase Histograma de frecuencias Se utiliza en datos cuantitativos en distribuciones de frecuencia. Son rectángulos verticales unidos entre sí, en donde sus lados son los límites reales inferior y superior de clase y cuya altura es igual ala frecuencia de clase

11 Medidas de Tendencia Central
Las medidas de tendencia central son puntos en una distribución, los valores medios o centrales de ésta nos ayudan a ubicarla dentro de la escala de medición. Las principales medidas de tendencia central son: MODA, MEDIANA y MEDIA.

12 La MODA o MODO es la categoría o puntuación que ocurre con mayor frecuencia. EJEMPLO: Hallar la moda en los siguientes datos.16, 18, 15, 20,16 SOLUCION: Moda = 16

13 La MEDIANA es el valor que divide a la distribución por la mitad
La MEDIANA es el valor que divide a la distribución por la mitad. Esto es, la mitad de los casos caen por debajo de la mediana y la otra mitad por encima de la mediana. La mediana refleja la posición intermedia de la distribución. Si la cantidad de observaciones es impar entonces la mediana es el valor que ocupa el lugar central. Si la cantidad de observaciones es par, entonces existen dos valores centrales y la mediana se calcula como un promedio de éstos EJEMPLO: Hallar la mediana en los siguientes datos.25,30,28,26,32 SOLUCION: Se ordenan en forma creciente o decreciente y se toma el valor central.25, 26, 28, 30,32 mediana = 28 EJEMPLO: Hallar la mediana en los siguientes datos:7, 10,15,13,10,12 SOLUCION: Al ordenar se tiene: 7, 10,10,12,13,15 pero como el número de datos es par se toma la media aritmética de los dos internos (10 +12= 22/2=11= Mediana)   EJEMPLO: La edad media mundial es de 23 años, lo que significa que la mitad de los habitantes del globo terrestre sobrepasa a esta mediana y el otro medio es más joven. La mediana varía de un lugar a otro, en los países en desarrollo la mediana de edad es de 21 años mientras que en los países industrializados es de 33.

14 La MEDIA es la medida de tendencia central mas utilizada y puede definirse como el promedio aritmético de una distribución. Es la suma de todos los valores dividida por el número de casos. EJEMPLO: Mediante los siguientes datos hallar la media aritmética.10,8,6,5,10,7 SOLUCION: = 48/6= 8= Media

15 Medidas de variabilidad
Las medidas de variabilidad indican la dispersión de los datos en la escala de medición. Son valores en una distribución y las medidas de la variabilidad son intervalos, designan distancias o un número de unidades en la escala de medición. Las medidas de variabilidad mas utilizadas son el RANGO, la DESVIACIÓN ESTÁNDAR y la VARIANZA.

16 El RANGO es la diferencia entre la puntuación mayor y la puntuación menor. Cuanto mayor es el rango , mayor será la dispersión de los datos de una distribución. La DESVIACIÓN ESTANDAR es e promedio de desviación de las puntuaciones con respecto a la media. Cuanto mayor es la dispersión de los datos alrededor de la media mayor es la desviación estándar. Se simboliza con “s”. El desvío estándar es una medida de dispersión muy útil sobre todo para comparar dos poblaciones en las cuales se esta estudiando la misma variable y se la expresa en la misma unidad de medida. Si las unidades de medida no son las mismas para poder realizar comparaciones debemos calcular un coeficiente adimensional. La VARIANZA es la desviación estándar elevada al cuadrado y se simboliza “s2”. Es un concepto estadístico sumamente importante ya que muchas de las pruebas cuantitativas se fundamentan en èl. Para fines descriptivos se utiliza preferentemente el desvío estándar. Ejemplo de utilización de varianza: para definir el tamaño de una muestra

17 EJEMPLO APLICATIVO Soja. Evolución y variabilidad de los precios.
Período analizado enero-96 a diciembre-05 Indicadores estadísticos de la serie Media 199 Mínimo 129 Máximo 308 Moda 166 desvío estándar 47.6 brindan información acerca del comportamiento y regularidades empíricas observadas en los precios. Puede encontrarse el valor promedio, mínimo y máximo registrado, así como el precio con mayor cantidad de ocurrencias (moda) y una medida de la dispersión de estos valores respecto a la media, la que ofrece una idea acerca de la variabilidad de la serie (desvío estándar). Nota: precios de disponible en pesos convertidos a dólar tipo comercial por tonelada, Bolsa de Cereales de Rosario FUENTE: Oficina de Riesgo Agropecuario en base a datos de la Bolsa de Cereales de Bs.As. y Dirección de Mercados Agroalimentarios de la SAGPyA


Descargar ppt "ANALISIS DE VARIABLES CUANTITATIVAS EN EL PROCESO DE INVESTIGACIÓN"

Presentaciones similares


Anuncios Google