CONCEPTOS PRELIMINARES

CONCEPTOS PRELIMINARES

INTRODUCCIÓN El objetivo de este primer tema es presentar y definir algunos términos de carácter muy básico que se utilizarán a lo largo de este curso de Estadística. No se pretende realizar una exposición exhaustiva ni profunda de estos conceptos, sino que nuestro objetivo es establecer una base de entendimiento común en el lenguaje a utilizar. De hecho, algunos de los conceptos que trataremos trascienden el ámbito de la disciplina del Análisis Estadístico y serán tratados más a fondo en otras asignaturas que el alumno cursará en la licenciatura. La exposición de estos conceptos se realizará respondiendo a una serie de cuestiones respecto a las cuales deberíamos tener clara respuesta siempre que queramos plantear cualquier tipo de análisis estadístico.

LA INVESTIGACIÓN CIENTÍFICA
El análisis de datos se encuentra siempre inmerso dentro de una investigación científica, por lo que conviene que tanto el concepto de investigación científica como los diferentes tipos de investigaciones científicas que se pueden desarrollar sean conocidos por el usuario de esta colección de apuntes. Se entiende por investigación científica el proceso de indagación mediante el cual se pretende dar respuesta a un problema siguiendo un camino trazado con rigurosidad, objetividad y sistematicidad. Esta manera de proceder se conoce como método científico.

Tipos de investigación científica
Investigación experimental versus investigación no experimental La investigación experimental es aquella estrategia que tiene por objeto establecer relaciones causales inequívocas. Para ello deben concurrir dos circunstancias: 1ª, el investigador provoca el fenómeno que pretende estudiar y 2ª, el investigador aísla el fenómeno para que ningún otro elemento afecte a la relación causal que está estudiando. Ambas circunstancias nos conducen a la principal crítica que recibe este tipo de investigaciones: su artificialidad. La investigación no experimental es aquella estrategia que estudia el fenómeno en situaciones naturales. Este tipo de investigaciones sortea la principal crítica de la investigación experimental, pero presenta el inconveniente de no poder establecer relaciones inequívocas de causa-efecto. Dentro de la investigación no experimental se suele distinguir entre la metodología observacional y la metodología de encuestas.

Investigación exploratoria versus investigación confirmatoria
La investigación confirmatoria es aquella en la que el problema de investigación se deriva de un marco teórico, o de un conjunto de investigaciones previas, que nos llevan a plantear la hipótesis de partida que vamos a contrastar. Se entiende por hipótesis de partida cualquier enunciado relacional en el que se establezca una regularidad entre fenómenos. La investigación exploratoria, por el contrario, es aquella en la que no se dispone de información de partida respecto a un objeto de estudio concreto, y lo que se pretende es recoger información de forma objetiva y sistemática sobre ese objeto de estudio.

Diseño de la investigación
El diseño de la investigación es el plan de actuación que establece el investigador para la recogida de datos. A continuación se presentarán dos clasificaciones de los diseños. Diseños transversales versus diseños longitudinales Esta clasificación se fundamenta en la dimensión temporal a la hora de recoger los datos. Un diseño transversal (también denominado diseño estático) es aquél en el que el fenómeno objeto de estudio se aborda en un momento temporal concreto. Un diseño longitudinal, en cambio, es aquél en el que el interés se centra en el estudio de la evolución del fenómeno a través del tiempo.

Diseños de grupos, diseños de medidas repetidas y diseños mixtos
Esta clasificación separa los diseños en función de si los datos que se recogen son independientes o si, por el contrario, están relacionados. En un diseño de grupos los datos con los que se trabaja son independientes, es decir, provienen de individuos distintos. En un diseño de medidas repetidas los datos con los que trabaja están relacionados, es decir, provienen de los mismos individuos. Un diseño mixto es una estructura híbrida que combina datos independientes y datos relacionados.

Variables El concepto de variable es fundamental tanto en el marco de la investigación científica como en el marco de la estadística. Se entiende por variable todo atributo o característica susceptible de adoptar diferentes valores. En otras palabras, una variable es todo aquello que varía dentro de una clase. Si todos los valores dentro de una clase coinciden, entonces, hablaremos de constante. A continuación presentaremos dos clasificaciones de variables.

Variable categórica versus variable cuantitativa
Esta clasificación tipifica las variables en función de su naturaleza. Una variable es categórica (también denominada cualitativa) si sus valores no varían en grado o cantidad, pero son cualitativamente diferentes. Cada uno de los valores que puede adoptar la variable se conoce como categoría y han de cumplir las condiciones de exhaustividad y exclusividad. Dentro de las variables categóricas se suele diferenciar entre variables categóricas naturales y variables categóricas artificiales. Las variables cuantitativas son aquellas que varían en grado o cantidad, de manera que existen en algún grado a través de una escala de menos a más. En función de los valores que pueden adoptar, las variables cuantitativas suelen clasificarse en variables continuas y variables discretas.

Variable independiente, variable dependiente y variable extraña
Esta clasificación tipifica las variables atendiendo a un criterio metodológico, esto es, en función del papel que juegan en la investigación. La variable independiente es aquella que manipula el experimentador con el objeto de comprobar qué efecto produce sobre aquel aspecto que le interesa modificar. La variable dependiente es el aspecto que interesa modificar, sobre el que se predicen cambios en función de la manipulación de la variable independiente. Las variables extrañas (también denominadas variables de posible confundido) son aquellas que pueden incidir sobre la variable dependiente provocando cambios en ésta, por lo que es imprescindible que se controlen.

EL ANÁLISIS ESTADÍSTICO
La investigación científica se vale del análisis estadístico para extraer conocimiento de los datos. Entendemos por dato cualquier información que se obtiene mediante la observación y la experiencia. El análisis estadístico es un procedimiento de trabajo que se relaciona con el método científico, y consiste en la recogida, organización, resumen, presentación y análisis de datos, así como en la elaboración de conclusiones y toma de decisiones relevantes a partir del análisis realizado. Si bien el análisis estadístico nos permitirá obtener información a partir de unos datos, las conclusiones conceptuales que se elaboren basándose en esta información estadística serán responsabilidad del investigador.

Tipos de análisis estadístico
Análisis exploratorio versus análisis confirmatorio Un análisis exploratorio nos permite detectar estructuras o patrones subyacentes en los datos. El investigador no tiene ninguna idea previa respecto al comportamiento de tales estructuras o patrones, y su propósito es extraer la máxima cantidad de información de los datos. Este tipo de análisis se vale de las técnicas propias de la estadística descriptiva. La estadística descriptiva es una rama de la Estadística que se ocupa de sintetizar los datos observados en la realidad con el objeto de detectar estructuras subyacentes y alcanzar así una mayor comprensión sobre los mismos.

El análisis confirmatorio es aquel en el que partimos de una hipótesis, o de una conjetura previamente establecida, respecto al comportamiento de los datos. En este caso, el análisis de datos nos permitirá tomar una decisión estadística, basada en el cálculo de probabilidades, respecto a si se confirma o no nuestra hipótesis. Este tipo de análisis utiliza las técnicas de la estadística inferencial. La estadística inferencial es una rama de la Estadística que utiliza el cálculo de probabilidades para llegar a conclusiones acerca de las características de determinados fenómenos en la realidad.

Análisis univariable versus análisis multivariable
La diferencia entre ambos tipos de análisis estriba en el número de variables que se analizan. En un análisis univariable se analiza una sola variable, mientras que en un análisis multivariable se analizan dos o más variables. Cuando se analizan dos variables se suele utilizar el término análisis bivariable.

Agentes estadísticos Población () Conjunto referencial de todos los individuos que cumplen unas determinadas características y a los cuales deseamos hacer extensivas las conclusiones de nuestro análisis. La información que nos permite caracterizar al conjunto de la población recibe el nombre de Parámetro (, ,  …). Muestra (n) Subconjunto de la población a partir del cual realizamos nuestro estudio. Los índices que caracterizan la información recogida en una muestra reciben el nombre de Estadísticos (po, , s, …). Individuo u Objeto Estadístico (xi) Cada uno de los elementos para los cuales obtenemos los datos.

Escalas de medida Medición, escala de medida y error de medición
Medir significa asignar distintos valores o números a objetos de acuerdo con unas reglas. Esta medida nos aporta información de las propiedades de un individuo respecto de una variable y nos permite establecer relaciones entre individuos. Las escalas de medida son aquellas que nos permiten llevar a cabo el proceso de medición definiendo las reglas de asignación de los valores a los individuos. El error de medición es la desviación de la medida respecto del valor real. Este error puede ser de dos tipos: error sistemático y error aleatorio (también denominado error estándar de medida). Un error es sistemático si afecta siempre de la misma manera a todas las mediciones que nos suministra el instrumento de medida. Se trata de un error evitable puesto que se conoce y se puede predecir. El error aleatorio, por el contrario, no afecta de la misma manera a todas las mediciones y, en consecuencia, no es predecible.

Tipos de escalas de medida
Escala nominal: Es la forma de medida más simple. Se limita a clasificar a los individuos en una serie de categorías previamente establecidas, por lo que sólo nos permitirá establecer relaciones de igualdad y desigualdad entre los individuos. Las categorías de una variable medida en una escala nominal han de cumplir los requisitos de exhaustividad y exclusividad. Escala ordinal: Con este tipo de escala no sólo podremos clasificar a los individuos sino que también podremos establecer relaciones de orden entre ellos. En consecuencia, nos ofrece un tipo de medida que nos suministra más información que la que se obtiene con las escalas nominales. Esta información extra es la posición que ocupa cada individuo respecto a una determinada variable. Escala de intervalo: Estas escalas reúnen todas las características de las escalas anteriores y, además, incorporan la presencia de una unidad de medida constante (es decir, entre dos puntos adyacentes de la escala la distancia es constante). En consecuencia, nos permitirán clasificar individuos, ordenarlos y establecer relaciones de distancia entre ellos.

Escala de razón: Estas escalas acumulan las propiedades de las otras tres escalas y, además, incorporan la presencia de un verdadero origen o cero absoluto. La presencia de este valor de origen quiere decir que en estas escalas existe un valor cero que indica ausencia del atributo medido. En este tipo de escalas tiene sentido la razón matemática pues, aunque se transforme la escala, la razón o proporcionalidad se mantiene. Escala absoluta: Es un tipo de escala de medida particular que podría incluirse dentro de las escalas de razón. Estas escalas se caracterizan porque en ellas se da una correspondencia perfecta entre el sistema de medición y la realidad. La importancia de la diferenciación entre los distintos tipos de escala radica en dos aspectos: 1) La escala que se utilice para medir una variable repercutirá en la cantidad de información que nos aporte cada dato para cada unos de los individuos. 2) La escala de medida condicionará el tipo de técnicas estadísticas que podamos utilizar para analizar las variables.

¿Cómo se organiza la información?
Una vez se ha recogido la información para un grupo de individuos es necesario organizarla a efectos de que pueda ser posteriormente analizada. Esta información se dispondrá en una estructura tabular que presentará una organización distinta dependiendo del tipo de diseño que se haya utilizado. Diseño de grupos independientes: Este tipo de diseño implica estructurar los datos de forma que cualquier comparación se realiza a partir de grupos de sujetos diferentes. Se obtiene una sola medida de la variable dependiente para cada individuo.

Diseño de Medidas Repetidas:
Este tipo de diseño implica estructurar los datos de forma que cualquier comparación se realiza a partir del mismo grupo de sujetos medidos en situaciones o momentos del tiempo diferentes. Se obtienen varias medidas para cada individuo.

Diseño Mixto: Este diseño resulta de la combinación de las dos estructuras anteriores. Los individuos están organizados en grupos y para cada individuo se obtienen varias medidas.

¿Cómo seleccionamos a los sujetos?
Habitualmente no es posible trabajar con todos los sujetos que componen la población objetivo, por lo que se suele trabajar con subconjuntos de ésta. Estos subconjuntos de la población se denominan muestras. Recordemos que si estamos trabajando con una muestra y queremos elaborar conclusiones respecto a la población deberemos recurrir a la estadística inferencial. Es imprescindible que la muestra sea representativa de la población, puesto que, en caso contrario, los resultados obtenidos con los datos de la muestra no se podrán extrapolar a la población. Para conseguir muestras representativas deberemos recurrir a la aleatorización en la selección de los individuos. Por lo que se refiere a la cantidad de individuos que debemos seleccionar debemos destacar que el número de individuos que compongan la muestra determinará el nivel de precisión del estudio.

PERSONALIDAD Y TIPOS DE PROFESION
Problemas resueltos PERSONALIDAD Y TIPOS DE PROFESION Un investigador se propone estudiar la dimensionalidad latente de la personalidad y realiza varias mediciones, mediante diversas pruebas psicométricas, a un grupo de personas. El conjunto de pruebas miden las siguientes características de personalidad: Neuroticismo (variable NEUR), Afabilidad (variable AFAB), Extraversión (variable EXTR), Apertura a la Experiencia (variable APER) y Precaución (variable PREU). Todas estas variables se miden en una escala de 0 a 100 puntos. La propuesta de este investigador es que estas cinco dimensiones de la personalidad son totalmente independientes entre ellas. Se dispone, además, de información sobre el tipo de profesión de cada persona (variable PROF). Esta variable puede adoptar dos categorías: individual (valor INDI), si la persona desarrolla su trabajo aisladamente, y colectiva (valor COLE), si la persona desarrolla su trabajo interactuando como mínimo con otra persona. Para cada individuo se tiene también información de su sexo (variable SEXO), con los valores varón (etiqueta V) y mujer (etiqueta M).

TABLA DE DATOS

A partir del enunciado y los datos anteriores (Tomados de Solanas, A
A partir del enunciado y los datos anteriores (Tomados de Solanas, A.; Salafranca (1998) “Análisis Estadístico Aplicado. Problemas y Soluciones mediante aplicaciones informáticas” Ed. U.B. pág. 55), plantearemos algunas cuestiones: Clasifique las variables Profesión y Edad en función de su naturaleza, e identifique la escala de medida utilizada. La variable profesión es una variable categórica artificial, puesto que permite clasificar a los sujetos en dos grupos mediante las categorías individual y colectivo, establecidas artificialmente. Con respecto a la escala de medida, se habría utilizado una escala nominal, ya que la variable sólo nos permite clasificar a los individuos. La edad es una variable cuantitativa continua y estaría medida en una escala de razón. Hay que señalar, sin embargo, que, aunque esta variable por su naturaleza es continua, el tratamiento que se ha realizado de ella en este caso ha sido discreto, puesto que se ha medido en años cumplidos.

Los 20 sujetos medidos ¿constituyen una población o una muestra?
A falta de una clara referencia a este hecho en el texto, únicamente podemos responder de forma especulativa. Si al realizar nuestra investigación no deseamos extender nuestras conclusiones más allá de los 20 sujetos, estos constituirán la población objetivo. En caso de que se quisiera plantear algún tipo de estudio inferencial con un referente de sujetos más amplio que los directamente medidos, diríamos que estamos trabajando con una muestra (recordemos que un subconjunto cualquiera de la población no garantiza la representatividad de éste).

El diseño escogido ¿plantea en algún momento una estructura de medidas repetidas?
En ningún caso, puesto que si bien tenemos varias mediciones de cada sujeto, estas se corresponden con diferentes variables, nunca se trataría de la misma variable registrada bajo condiciones distintas. ¿Cómo podríamos medir la variable edad de forma ordinal? Se podría realizar una trasformación de la escala estableciendo un criterio que nos permitiera únicamente ordenar a los sujetos. Por ejemplo, se podría organizar a los individuos en tres grupos: menores de 25 años, entre 25 y 45 años, y mayores de 45 años. Hay que señalar que, en este caso, la transformación realizada conllevaría una pérdida de información respecto a si se toma para cada individuo los años cumplidos.

Introduzca en la investigación alguna variable cuya escala de medida sea de tipo absoluto.
Por ejemplo, podríamos introducir el nivel de absentismo laboral de cada individuo. Esta variable podría medirse a partir del número de ausencias injustificadas para cada persona de su puesto de trabajo. ¿En qué tipo de investigación inscribiría el estudio presentado? Lo clasificaría como una investigación no experimental puesto que el investigador parece haberse limitado a recoger las variables sin ejercer ningún tipo de manipulación voluntaria sobre éstas. Dado que no hay manipulación de las variables hay que descartar la investigación experimental. Dentro de las investigaciones de tipo no experimental, el presente estudio podría clasificarse como observacional.

CONCEPTOS PRELIMINARES

Presentaciones similares

Presentación del tema: "CONCEPTOS PRELIMINARES"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

CONCEPTOS PRELIMINARES

Presentaciones similares

Presentación del tema: "CONCEPTOS PRELIMINARES"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback