Introducció a l’anàlisi d’agrupaments (cluster)

Slides:



Advertisements
Presentaciones similares
Sistema de gestió APPCC
Advertisements

Impress 3... Posa-hi un fons!
II. La llum Lleis bàsiques L’òptica geomètrica: imatges i aberracions
ORIENTACIÓ I COORDENADES GEOGRÀFIQUES
MÚLTIPLES I DIVISORS.
CURS DE MONITORS 2010 ANNA TORT
Variables qualitatives
Propietats relacionades amb l'aspecte extern Altres propietats
Tema 2. DIVISIBILITAT.
APRENENTATGE MULTINIVELL
L’ÚS DE LES LLIBRETES A LES SESSIONS DE FILOSOFIA 3/18
El mercat ELS NENS I NENES DE P-4.
LA FASE DE SELECCIÓ (FS) A LA FIB
Construeix la gràfica de valors
UNITAT 1: Els nombres reals (I)
Proves anatòmiques i morfològiques
TREBALLEM EL SISTEMA SOLAR
Resolució de problemes algebraics
Experimentam amb la ciència
1 u n i t a t La funció comercial de l’empresa.
El nou pla docent de la UB: Adequació al sistema ECTS
Impress 2... Edita la teves presentacions!
SOCIOLINGÜÍSTICA COMUNICACIÓ Pàg
Les Restriccions d’accés
POLINOMIS.
UVic i Rosa Sensat Maig de 2013
PLA DE FORMACIÓ DEL CENTRE
TRIGONOMETRIA Conceptes bàsics: Triangle (tres costats i tres angles)
Treballem l’estadística
Fet per Adriana, Helena i Marta (6B)
Problema dels camins.
Necessita Catalunya un nou finançament?
RAMON MARGALEF: DE LA LLIBRETA MANUSCRITA A LA GENERACIÓ D’IDEES I LA PUBLICACIÓ CIENTÍFICA. Aquest estiu es celebra el “Ramon Margalef summer colloquia”
DINÀMICA GENERAL DE LA POBLACIÓ
Dissenys factorials dos o més factors creuats
ESCOLA CERVANTES (BARCELONA) CLASSE DE P-3 MARIA JOSÉ MATA
Problema 1: Trobar la recta que passa pel punts A(2, -3) i B(-1, 3)
Cicle de Born-Haber pel NaCl
TOTS ELS INDIVIDUS D’UNA MATEIXA ESPÈCIE SÓN IGUALS?
Reconstrucció filogenètica
Curs de Llenguatge Administratiu Valencià Juli Martínez Amorós
L'ÀTOM Repàs del que hem fet fins ara:
TEMA 5: VIVIM EN ECOSISTEMES
Projecte: el mercat 2a PART P -4.
3.POLINOMIS.
Repàs control 4: estadística i atzar
Ara resoldrem alguns problemes amb balances.
ERIC Manual d’ús.
II. EL PRECIO Quantitat de diners que el comprador d’un determinat producte o servei lliura al venedor a canvi de la seva adquisició. És la variable del.
XXIII OLIMPìADA MATEMÀTICA 2012
Agent Tutor Eloi Puertas Prats 13/04/2019 Agent Tutor.
La imatge corporativa Una eina fonamental en l’actualitat
Les fraccions Sisè B curs
INFORMÀTICA BÀSICA 1r ESO curs
Jessica, Gerard, Laura P, Alex
ENQUESTA DE SATISFACCIÓ INTERNA COM A EINA DE GESTIÓ COMPLEMENTÀRIA
LA NOVA SELECTIVITAT I L’ACCÉS A LA UNIVERSITAT
La literatura i les matemàtiques van de la mà.
LA MEDALLA D’OR.
Observa aquesta balança i mira quins canvis hi fem
L’HANBOL.
TEMA 7. COMPRES, VENDES I EXISTÈNCIES
Anàlisi Discriminant Discreta Mitjançant Suavització de les Correspondències Múltiples Factor 1 Factor 2.
Sistema de descàrrega d’aplicacions per a mòbils intel·ligents
CARTELL per a les TROBADES d’Escoles en Valencià
EL CONSUM DE DROGUES ENTRE LA POBLACIÓ HOMOSEXUAL USUÀRIA D’ESPAIS D’OCI NOCTURN DE CATALUNYA.     UNA APROXIMACIÓ QUANTITATIVA.
DA46: PROCÉS D’ADAPTACIÓ FINAL 01/01/2013 Subdirecció Màrqueting MUTUALISTES EN OPCIÓ ALTERNATIVA AL RETA.
Estils i Plantilles Ms Word.
Elaboració del Pla de formació ajuntament de viladecans
Enllaç químic El sistema periòdic David Mor Elbal.
Transcripción de la presentación:

Introducció a l’anàlisi d’agrupaments (cluster) Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull

Objectiu i característiques de l’anàlisi Donats m “objectes” (espècies, poblacions, individus, ...) trobar un esquema d’agrupament en classes, de manera que els “semblants” pertanyin a la mateixa classe Mètode completament numèric: Cada objecte caracteritzat per p variables Dissimilaritat (o semblança) entre objectes basada en aquestes variables Agrupament basat en aquestes dissimilaritats Nombre de classes no conegut prèviament

Esquema del mètode Dades Matriu de distàncies Bantu English Eskimo Korean 0,0 0,246 0,398 0,244 0,409 0,278 0,197

Tipus d’anàlisi d’agrupaments Mètodes jeràrquics: obtenció d’un arbre de classes o “dendrograma” Aglomeratius (els més freqüents): partir de m classes d’un sol objecte i anar creant classes cada vegada més àmplies, ajuntant-les segons màxima semblança Divisius: partir d’una gran classe que conté tots m objectes i anar dividint en subclasses Mètodes de particionament: objectes es poden moure d’un grup a l’altre fins a complir algun criteri d’optimalitat

Dades de grups sanguinis per diverses (m=4) poblacions Freqüències relatives dels al·lels possibles per a s = 5 sistemes de grups sanguinis: AB0, CDE, DI, FY i MNS En sengles mostres de m = 4 poblacions: Bantús, Anglesos, Esquimals i Coreans. etc...

Adequada per aquestes dades: distància de Prevosti

Distància de Prevosti, sistemes AB0+CDE+DI+FY+MNS English Bantu Eskimo Korean 0,0 0,24588 0,39786 0,24418 0,40946 0,27834 0,19672

Procés de formació del dendrograma. I Pas 1: les poblacions més semblants són els coreans i els esquimals: formem una primera classe, (Esk,Kor) a un grau de dissimilaritat de 0,19672 Pas 2: Què ajuntem ara? Tres possibles continuacions: Agregar Ban a (Esk, Kor) Agregar Eng a (Esk, Kor) Agregar (Ban, Eng) Això pot dependre del criteri per a avaluar la distància entre classes i / o poblacions soles, p.e. mínim, màxim o mitjana (UPGMA: Unweighted Pair-Group Method using Arithmetic averages)

Matriu de distàncies segons el criteri adoptat English Bantu (Eskimo, Korean) 0,0 0,24588 0,39786 0,40946 0,40366 0,24418 0,27834 0,26126

Procés de formació del dendrograma. II Si hem adoptat el criteri del mínim, la més petita distància (0,24418) és entre Ban i (Esk, Kor), hem d’unir-les (a una distància de 0,24418) i les classes resultants seran Eng, (Ban, Esk, Kor) Tant si el criteri és el màxim com si és la mitjana, la distància més petita és 0,24588, entre Ban i Eng. Les classes resultants serien (Ban, Eng), (Esk, Kor)

Matriu de distàncies després del pas 2 segons criteri del mínim English (Bantu, Eskimo, Korean) 0,0 0,24588

Matriu de distàncies després del pas 2 segons criteri del màxim (Bantu, English) (Eskimo, Korean) 0,0 0,40946

Matriu de distàncies després del pas 2 segons criteri de la mitjana (Bantu, English) (Eskimo, Korean) 0,0 0,33246

Resolució final del dendrograma Pas 3: sigui quin sigui el criteri adoptat, ara solament falta constituir la darrera classe, que conté totes les poblacions Però diferent dendrograma segons el criteri: Mínim: darrera classe global, ajuntant Eng i (Ban, Esk, Kor) a una distància 0,24588 Màxim: darrera classe global, ajuntant (Eng, Bant) amb (Esk, Kor) a distància 0,40946 Mitjana: darrera classe global, ajuntant (Eng, Bant) amb (Esk, Kor) a distància 0,33246

Dendrograma final segons el criteri del mínim

Dendrograma final segons el criteri del màxim

Dendrograma final segons el criteri de la mitjana