La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Anàlisi Discriminant Discreta Mitjançant Suavització de les Correspondències Múltiples Factor 1 Factor 2.

Presentaciones similares


Presentación del tema: "Anàlisi Discriminant Discreta Mitjançant Suavització de les Correspondències Múltiples Factor 1 Factor 2."— Transcripción de la presentación:

1 Anàlisi Discriminant Discreta Mitjançant Suavització de les Correspondències Múltiples
Factor 1 Factor 2

2

3

4 Individus meta-variables Individus essencials
-1 , N N X’ X R*n Rn R*p Rp Individus meta-variables Individus essencials Variables essencials Variables meta-individus

5 Y’X, (X’X)-1, (Y’Y)-1 ( )

6 Anàlisi Triplet Y’X (X’X)-1 (Y’Y)-1 (Y,X) I Discriminant
Discriminant (Canònica Simple) Y’X (X’X)-1 (Y’Y)-1 Correspondències (Canònica Múltiple) (Y,X) I

7 X11 X22 X33 a a a3

8 Teorema de Lancaster (1957): Suposem que X1 resulte d’una transformació tipificada d’una variable normal tipificada Z1 i X2 de forma semblant de Z2 , aleshores corr(X1,X2)  corr (Z1,Z2) = Generalització del Teorema de Lancaster : Siguin Zi , i=1,...,p normals tipificades amb R com a matriu de correlacions i siguin Xi ,i=1,...,p transformades de les Zi respectivament i també tipificades. Si a és el vector propi corresponent al major valor propi de R Var (w’X)  Var(a’Z)  w Rp amb w’w = 1

9 (1, 0, ... , 0) Esquema de la demostració del Teorema de Lancaster

10 Esquema de la demostració de la generalització del Teorema de lancaster

11 Càlcul d’ a = 1r vector propi
de la matriu de covariàncies dels centroïds Correspondències múltiples ponderades amb a Convergeix? no Selecció del nombre d’eixos Classificació per LDA prèvia suavització mitjançant EM ( MDA)

12 ec=0.48, 99%, 3 var., 9 cat. ec=0.27, 75%, 3 var., 8 cat. ec=0.23, 80%, 2 var., 5 cat. ec=0.16, 68%, 3 var., 8 cat.

13 Conjunt de dades LDA Canònic MDA ADDSUC millor alternativa 1 0.492
0.464 0.461 0.467 2 0.473 0.430 0.369 0.406 3 0.449 0.421 0.312 0.337 4 0.456 0.483 0.387 500 dades d’aprenentatge i 500 de test. 50 x 50 simulacions

14 Sèpals Logística-X.N. 0.223 ADDSUC  Pètals Longitud amplària

15   MDA Logística-X.N. ADDSUC Màrqueting 0.392 0.385 0.363 AFIPE 0.387
Màrqueting, J.Friedman, S.Francisco (California), 1987 3 classes 13 var. 75 cat dades d’apr dades de test Nivell d’Ingressos  Gènere Ocupació Estat Civil Tipus de casa Edat Propietat de la casa Nivell Educatiu MDA Logística-X.N. ADDSUC Màrqueting 0.392 0.385 0.363 AFIPE 0.387 0.388 0.318 AFIPE, Sisnica, León (Nicaragua), 1994 8 classes 6 var. 18 cat. 550 dades d’apr. 594 dades de test Patrò d’evolució de ERA  Freqüència Tipus Municipi Profesional Perfil T.Comunitat

16 ADDSUC sembla superar tots els altres possibles mètodes bassats en correspondències i/o suavització especialment quan hi ha permutació de l’ordre “natural” (dades simulades) ADDSUC sembla superar a la logística-xarxes neurals si els punts de tall es fan als punts de vall (dades Iris de Fisher) L’anàlisi de correspondències ponderada-iterada proposada aconsegueix la millor reconstrucció de la mixtura de partida possible (Generalització del teorema de Lancaster) La supossició de una mixtura categorizada com a model base sembla acceptable en moltes situacions pràctiques raó per la qual ADDSUC aconsegueix bons resultats amb exemples amb dades reals (Màrqueting,AFIPE)

17 Incorporar les variables contínues al procés iteratiu ( cas mixt)
Ampliació del model base per classe de normal a mixtura ( suavització mitjançant EM, MDA) Sustitució de l’EM pel Kernel adaptable multidimesional quan el model base no sigui ni normal ni mixtura de normals. Anàlisi canònica generalitzada posterior agrupant els eixos (polinomis de l’Hermite, FDA, covariàncies diferents)


Descargar ppt "Anàlisi Discriminant Discreta Mitjançant Suavització de les Correspondències Múltiples Factor 1 Factor 2."

Presentaciones similares


Anuncios Google