Variables numèriques Taules de freqüències:

Slides:



Advertisements
Presentaciones similares
Interpretació estadística dels indicadors de centre
Advertisements

ESTADÍSTICA ÍNDICE 1.Introducción.Introducción. 2.Población y muestra.Población y muestra. 3.Variables estadísticas:Variables estadísticas: Cualitativas.
Capítulo 1.4: Distribución de frecuencias unidimensionales Introducción Descripción numérica Representación gráfica.
Tema 2. Parámetros estadísticos. Indice 1. Parámetros estadísticos. Tipos: 1.1 Medidas de centralización(medias y moda) 1.2 Medidas de posición(mediana,
ESTADÍSTICA UNIDIMENSIONAL
ANÁLISIS E INTERPRETACIÓN DE DATOS
Clase 5: Medidas de Variación
ESTADÍSTICA UNIDIMENSIONAL
ENERGIA Energia és allò capaç de transformar la matèria.
PROPORCIONALITAT 1 Funciona amb “clics”.
d' a s s i s t è n c i a al g o v e r n l o c a l
MESURA DEL RADI DE LA TERRA (seguint Eratóstenes)
LA GRAVETAT SOTA SOSPITA
Equacions amb dues incògnites.
L’Univers Com es defineix l’Univers?
EL DINER, ELS BANCS I LA POLÍTICA MONETÀRIA
Variables qualitatives
Tema 2. DIVISIBILITAT.
MÚLTIPLES I DIVISORS ESCOLA EL Cim- 6è de primària.
LES MESURES.
NIVELLS D’0RGANITZACIÓ
Construeix la gràfica de valors
Elisabet - Abril – Rubén 6èB
Tema 4: Estadística i atzar
Les fraccions Sisè B curs
UNITAT 1: Els nombres reals (I)
PREPARACIÓ PROVES D’ACCÉS A GRAU MITJÀ 2017
ESTADÍSTIQUES I WEBQUEAST
Problemes prova individual
Creació d’un mapa personalitzat
ELS NOMBRES ENTERS.
En aquest tema veurem els apartats següents:
Introducció a l’Experimentació
Una forma fàcil d'obtenir algunes fórmules
1 Gasos: conceptes bàsics La velocitat de difusió dels gasos
Tema 8: Magnituds en cinemàtica
OLIMPIADA MATEMÀTICA 2011 FASE PROVINCIAL PROVA INDIVIDUAL
TRIGONOMETRIA Conceptes bàsics: Triangle (tres costats i tres angles)
Termes i expressions algebraiques
HORT = TREBALL EN EQUIP - 4t
CURS DE PREPARACIÓ DE PROVES D’ACCÉS A CICLES FORMATIUS CURS
PAU 2010.
Treballem l’estadística
Situacions Simuladores Preferencials (SSP)
Matemàtiques 3er E.S.O..
Classificarem la prova en 3 categories:
Problema 1: Trobar la recta que passa pel punts A(2, -3) i B(-1, 3)
DINÀMICA DELS FACTORS BIOLÒGICS: Grans grups d’edat
Repàs control matemàtiques
ESTADISTICA DESCRIPTIVA
Tema 5: Nombres naturals i enters
Distribucions importants en Inferència estadística
HORT = TREBALL EN EQUIP - 4t
(posició d’equilibri)
Repàs control matemàtiques
CONNEXIONS SENSE CABLES I DISPOSITIUS MÒBILS
Repàs control 4: estadística i atzar
ESTADÍSTICA 1.
XXIII OLIMPìADA MATEMÀTICA 2012
Introducció a l’experimentació
ESCOLA ANTONI TÀPIES- 5èB
Matemàtiques Geometria.
Els sistemes materials
Realitzat per: Xavi González i López.
TEMA 8 Aplicacions de les derivades
Jessica, Gerard, Laura P, Alex
Classificarem la prova en 3 categories:
LA NOVA SELECTIVITAT I L’ACCÉS A LA UNIVERSITAT
Organització i creixement
Interpretació estadística dels indicadors de centre
Transcripción de la presentación:

Variables numèriques Taules de freqüències: sense agrupar en intervals agrupant les dades en intervals Descriptius de posició: - de dispersió: la moda ■ el rang la mediana i els percentils ■ el rang inter-quartil la mitjana ■ la variància ■ la desviació típica Gràfiques: diagrama de caixa, histograma i polígon de freqüències, ogiva de freqüències acumulades La forma de les distribucions: asimetria i curtosi Un exemple de variable numèrica discreta: estudi complert Un exemple de variable numèrica contínua: estudi complert

Taules de freqüències per a variables numèriques Consisteixen en un resum dels valors que pren la variable qualitativa, amb el recompte del nombre d’aparicions per a cada valor, els seus percentatges i els percentatges acumulats. Distingirem dos casos: Si la variable pren pocs valors diferents: taula de freqüències amb tots els valors Si la variable pren molts valors diferents: dades agrupades en intervals. Els intervals poden ser d’igual o de distinta amplitud. Quan hi ha intervals, cal tenir present: l’amplitud, el punt mitjà, etc Si els intervals són de diferent amplitud, cal calcular les altures

hauríem d’obtenir les freq. Relatives. Vegeu l’exercici següent. notes notes Variables amb pocs valors diferents: no cal agrupar en ntervals Exemple: Variable notes matemàtiques a les PAU. Pag. 21 Si volguéssim fer nosaltres la taula, hauríem d’obtenir les freq. Relatives. Vegeu l’exercici següent. Obtenim un resum satisfactori de les dades

freq. relativa acumulada Variables amb pocs valors diferents: no cal agrupar en intervals Exercici 1: completeu la taula de freqüències xi notes ni freq. absoluta fi freq. relativa pi % Ni freq. acumulada Fi freq. relativa acumulada Pi % acumulat ,0 4 ,019 ,5 8 1,0 9 ,042 17 1,5 12 ,056 29 2,0 38 2,5 ,079 55 3,0 23 ,107 ,364 3,5 13 ,061 ,425 4,0 ,505 4,5 ,584 5,0 14 ,065 ,650 5,5 ,692 6,0 10 ,738 6,5 11 ,790 7,0 ,846 7,5 7 ,879 8,0 ,916 8,5 6 ,944 9,0 5 ,967 9,5 ,986 10,0 3 1,000 100,0 214 1 100

Variables amb molts valors diferents: agrupar en intervals Exemple: Variable edat població de Catalunya Pag. 22 Si poséssim totes les edats, el resum no seria satisfactori: taula massa llarga !! Agrupar en intervals implica perdre informació [0,5)

Punt mitjà o marca de classe El darrer interval no sabem on acaba Dades agrupades en intervals. Pag. 23 intervals (enganxats) amplitud punt mitjà o marca de classe Encara perdem més informació! Amplitud o longitud Intervals enganxats Freq. acumu-lades Punt mitjà o marca de classe Freq. absolutes El darrer interval no sabem on acaba % % acumulats El darrer punt mitjà és desconegut. L’hem determinat per coherència amb els altres

Quants intervals convé considerar i de quina amplitud? Si no tenim cap altre criteri: pag. 25

Exercici 2: Agrupeu les següents dades en intervals Calculeu el nombre d’intervals: Calculeu l’amplitud dels intervals: Completeu la taula següent:

Freqüències d’una variable numèrica edats Freqüències d’una variable numèrica Sense agrupar en intervals: Avantatges: no hem perdut informació; tots els càlculs dels descriptius seran exactes Inconvenients: poc resumit; les freqüències són molt baixes, hi ha molts valors diferents

Descriptius de posició: dades sense agrupar en intervals Els resultats són exactes, doncs tenim tota la informació Moda: Hi ha massa modes (la freqüència més alta és 2). La moda no és representativa, no en donem cap valor. Mediana: És el valor 56.5 atès que hi ha un % acumulat igual al 50%, cal fer la mitjana entre aquest valor i el següent. Md=56.5. Recordem que la mediana és el centil 50. Centils o percentils: El percentil o centil 40 és el valor 53, doncs li correspon el primer percentatge acumulat que supera el 40%: C40= 53 El percentil o centil 75, que és el tercer quartil, és el valor 65: C75= Q3= 65 que té el primer percentatge acumulat que supera el 75% El percentil o centil 25, que és el primer quartil, és un valor entre 43 i 45, atès que el valor 43 té un percentatge acumulat igual al 25%. L’SPSS fa la mitjana ponderada entre aquests dos valors: 0.75 x 43 + 0.25 x 45 = 43.5 C25= Q1= 43.5 Què signifiquen? Que el centil 40 sigui 53, vol dir que com a mínim el 40% de les dones d’aquest grup tenen 53 anys o menys.

La mitjana aritmètica És la suma de totes les observacions dividida pel nombre total d’observacions. Si les tenim agrupades en freqüències, cal multiplicar cada valor per la seva freqüència, sumar i dividir pel nombre total d’observacions.

Càlcul de la mitjana per a les dades amb freqüències Aquesta taula NO la fa l’SPSS El càlcul és exacte, tenim tota la informació.

Descriptius de dispersió: dades sense agrupar en intervals Els resultats són exactes, doncs tenim tota la informació Les mesures de la dispersió de les dades acompanyen les característiques de posició. Quan menor és la dispersió, més homogènies són les dades i més concentrades entorn de les característiques de posició central, i per tant, més representatives són aquestes. Són apropiades per a variables numèriques (les variables amb una escala ordinal prou fina es poden considerar numèriques) Rang, recorregut o amplitud: Distància entre el màxim i el mínim; és el recorregut del 100% de les dades R= Max – Min= 89-12 = 77 (edat de 40 dones) fàcil de calcular poc sensible i representativa: només hi intervenen 2 observacions Rang inter-quartil: Distància entre els quartils tercer i primer; és el recorregut del 50% de dades centrals RI= Q3 – Q1 = 65- 43.5 = 21.5 (edat de 40 dones) no tant fàcil de calcular: necessita els quartils més sensible i representativa: hi intervenen les posicions de totes les dades Variància i desviació típica (pag. Següent)

La variància pag 50

Interpretació i càlcul de la variància pag 51

La desviació típica pag 52 És l’arrel quadrada de la variància Té les mateixes unitats que la variable, mentre que la variància les té al quadrat Dues desviacions típiques més enllà de la mitjana cobreixen com a mínim el 75% de les observacions. Si la forma és normal, cobreixen el 95.5% de les observacions

Resum de descriptius de posició i de dispersió, amb l’SPSS l’Spss només calcula la variància i desviació típica mostrals Edats de 40 dones

El coeficient de variació pag 53 És una mesura de la dispersió en relació a la mitjana És un coeficient estàndard (sense unitats) Permet comparar les dispersions de dues variables no necessàriament mesurades en les mateixes unitats Si és superior al 100% vol dir que la desviació típica és superior a la mitjana Només és per a variables positives

Càlcul del CV Él càlcul no el fa l’SPSS directament, cal fer una petita operació Per aquest ordre, X2, X3 i X1 són les variables amb més dispersió relativa a la mitjana, i per tant, les que discriminen més entre els països

Gràfiques per a variables numèriques: diagrama de caixa

Gràfiques per a variables numèriques: histograma Correspon al següent agrupament amb intervals:

Per a les dades d’edat agrupades en 6 intervals: podem calcular aproximadament (!) els descriptius

Gràfiques per a variables numèriques: histograma Les àrees són proporcionals a les freqüències dels intervals. Pag. 30 Cas d’intervals d’igual amplitud: base= amplitud, altura = freqüència Exemple: Variable evf (esperança de vida femenina). Casos: països. Sense ponderar Ponderant per població Intervals enganxats Punts mitjans Amplitud 5

Gràfiques per a variables numèriques: histograma i polígon pg 31 El polígon es fa unint les bases superiors dels rectangles Àrea sota el polígon = àrea sota l’histograma

Gràfiques per a variables numèriques: ogiva de freqüències acumulades pg 31 ogiva de freq. acumulades ogiva de % acumulats Mateix aspecte, només canvia l’escala Trams amb més pendent: notes més freqüents

Variables numèriques: dades agrupades en intervals de diferent amplitud Les àrees de l’histograma han de ser sempre proporcionals a les freqüències dels intervals. Cal calcular: base= amplitud, altura = freqüència/amplitud Variable: notes, agrupades en intervals de diferent amplitud

Histograma, amb intervals de diferent amplitud Pag. 32 Gràfica errònia: l’àrea no és proporcional a la freqüència. Es magnifiquen els intervals grans Sembla que aprovin molt pocs! Gràfica correcta l’àrea és proporcional a la freqüència. Aprova un 41.6% dels estudiants

Descriptius: cas d’intervals de diferent amplitud Són aproximats perquè tenim dades agrupades en intervals (tant si els intervals són d’igual com de distinta amplitud). Tots els descriptius de posició (excepte la moda) i de dispersió es calculen de la mateixa manera que si els intervals fossin d’igual amplitud. La moda es calcula tenint en compte la màxima altura: L’interval modal és el que té màxima altura, és a dir, màxima freqüència per unitat d’amplitud. La moda (aproximada) és el punt mitjà d’aquest interval.