¿Qué es la Estadística? Originalmente la palabra estadística ha estado asociada al procesamiento de datos, entendiéndose por esto la representación gráfica, la tabulación y el cálculo de medidas resumen, que permiten analizar e interpretar un conjunto de datos. La estadística es una disciplina que se preocupa de desarrollar técnicas y modelos que permitan estudiar la forma como la incertidumbre sobre un fenómeno es es alterada por la información disponible.
¿Qué es Población? P Conjunto formado por TODAS las unidades (personas, animales o cosas) que tienen algo en común. La población debe ser listada en lo que llamaremos Marco Muestral.
¿Qué es una muestra? Una muestra es un subconjunto de la población. Ella debe cumplir con ser REPRESENTATIVA. M P
¿Porqué una muestra? Es de menor costo que un censo. Ocupa menos tiempo que un censo. Tiene menos error que un censo. Técnicas de Muestreo Las más comunes son: Muestreo Aleatorio Simple. Muestreo Estratificado.
¿Qué es una variable? Característica que cambia de sujeto a sujeto. ¿Qué es un dato? Es una realización de una característica o variable, al ser evaluada en un sujeto. ¿Qué es Información? Llamaremos información al conjunto de datos.
Tipos de Variables
Tabulación La información que a continuación se muestra representa el nivel de instrucción de 20 personas: B,M,S,S,B,B,M,M,M,S,S,M,B,B,M,M,B,M,S,B
Supongamos que tenemos una muestra de 110 fumadores y se examina la marca del cigarrillo. Tenemos la siguiente tabla:
Tabulación caso contínuo Considere las notas de 20 alumnos: 6.2; 4.8; 3.8; 4.6; 4.4; 5.7; 6.4; 5.4; 6.3; 4.8; 4.9; 3.1; 3.8; 5.5; 5.1; 6.8; 4.7; 5.5; 7.0; 4.2 Formula de Sturger: En este ejemplo NI=1+[4.29]=5 R=Rango=Máximo - Mínimo= = 3.9
Tabla de Frecuencia
Diagrama de Tallo y Hoja 0 | | 4 | 6 | 8 | 10 | 0 Si a los datos anteriores agregamos un dato más digamos 100
Medidas Resúmenes Llamaremos medidas resúmenes a aquellas cantidades que resumen la información y en algún sentido sean representativos del conjunto de datos.
Medidas de Tendencia Central MODA (MO): Es la realización que tiene mayor frecuencia. Para datos agrupados en intervalos se adopta como moda la marca de clase del intervalo con mayor frecuencia. En caso de existir más de una moda hablaremos de multimodalidad. Ejemplo:
PERCENTIL- (P ): Llamaremos percentil % a aquel valor (de la característica X), tal que el % de la información es menor o igual a él. Necesariamente no es una medida de tendencia central. En el caso de datos agrupados en intervalo P lo calculamos por: 1) Multiplique n. 2) Mirar columna F i y determinar en que intervalo cae P . 3) Obtener de ese intervalo: cota inferior, f i, y F i-1.
La MEDIANA (Me) = P 50 En el ejemplo de las notas de los 20 alumnos: Mo=5.05, Me=4.66+(10-6)*0.78/6=5.18
Cuartiles
Medidas de Dispersión
Para datos agrupados la varianza es calculada como: En el ejemplo de las notas de 20 alumnos:
Cajón con Bigotes
Se realizó un experimento para comparar el efecto de dos dietas (A y B) sobre el aumento de peso en 20 sujetos que son distribuidos al azar en dos grupos. Los datos fueron: Dieta A: Dieta B:
Medidas de Forma En el ejemplo de las notas de los 20 alumnos: CA= leve asimetría hacia la Izquierda.