La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Anàlisi de dissenys d’un factor

Presentaciones similares


Presentación del tema: "Anàlisi de dissenys d’un factor"— Transcripción de la presentación:

1 Anàlisi de dissenys d’un factor
Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull

2 Anàlisi de dissenys d’un factor Contingut
Planteig. Model lineal per un factor (fix) Inferència al cas normal Taula ANOVA i prova F Intervals de confiança Verificació de la validesa del model Comparacions múltiples Model amb un factor aleatori Determinació de la mida mostral Anàlisi de dissenys d’un factor

3 Planteig: típica situació estudiada
Estudi de si un únic factor amb k nivells influeix en determinada variable de resposta Varietat de tomaquera (A,B,C,D) influeix en la producció? Més precisament: la mitjana (poblacional) de la variable de resposta és diferent segons el nivell del factor? Anàlisi de dissenys d’un factor

4 Disseny paral·lel totalment aleatoritzat
Cada unitat experimental s’assigna, a l’atzar, a exactament una condició experimental o tractament (a cada nivell del factor) Com a conseqüència, el “factor” individu està jeràrquicament dins cada grup de tractament Diversos noms : disseny d’un sol factor: “una via” (one-way layout) disseny paral·lel per a un sol factor Anàlisi de dissenys d’un factor

5 Avantatges i inconvenients
Simplicitat Optimització del temps de durada de l’experiment Menor perill de pèrdua de casos Inconvenients Major nombre d’unitats experimentals (que a altres dissenys) Comparació entre subjectes, no dins dels subjectes Mobilització de molts recursos en poc temps Anàlisi de dissenys d’un factor

6 Model lineal definició i notació
Anàlisi de dissenys d’un factor

7 Model lineal definició, notació i primers resultats
Suma i mitjana per cada nivell: Suma i mitjana global Estimadors puntuals dels paràmetres del model Recalcar que són estimadors no esbiaixats Anàlisi de dissenys d’un factor

8 Model lineal Prova d’igualtat de mitjanes
Contrast plantejat Suma de quadrats total Descomposició de la s.q. Anàlisi de dissenys d’un factor

9 Prova d’igualtat de mitjanes dades d’exemple
Anàlisi de dissenys d’un factor

10 Anàlisi de dissenys d’un factor
Prova d’igualtat de mitjanes 1er nivell -5, 4at nivell +5: idèntica var. Anàlisi de dissenys d’un factor

11 Anàlisi de dissenys d’un factor
Prova d’igualtat de mitjanes 1er i 4at nivell més var. idèntiques mitjan. Anàlisi de dissenys d’un factor

12 Prova d’igualtat de mitjanes Quadrats mitjans
Si H0 és certa, MSE i MSA estimen el mateix, s2 Anàlisi de dissenys d’un factor

13 Prova d’igualtat de mitjanes Estadístic F
Si H0 és certa, F tendirà a ser proper a 1 Si H1 és certa, F tendirà a ser major que 1 Per tant, un test molt raonable consisteix en rebutjar H0 si F és prou gran Anàlisi de dissenys d’un factor

14 Distribució de l’estadístic F sota H0 i errors normals
Suposem errors normals i homoscedàstics Sota H0: Com a conseqüència: Anàlisi de dissenys d’un factor

15 Taula d’anàlisi de la variància (ANOVA)
Anàlisi de dissenys d’un factor

16 Criteri de decisió ANOVA
F és el valor calculat sobre les dades. Si H0 és certa, F és un valor més de la v.a. Valor crític F(a -1, N - a) d’acord amb . Si F F(a -1, N - a) rebutjarem H0 o, equivalentment, si el p-valor és prou petit: Anàlisi de dissenys d’un factor

17 Taula ANOVA de l’exemple
V. crític F0,05(4,20)=2,87, estadístic F=14,76 Com 14,76 > 2,87, rebutgem H0. O també, com p-valor = 9,11x10-6 < 0,05 reb. H0. Anàlisi de dissenys d’un factor

18 Interval de confiança per i
Com que Si substituïm 2 pel seu estimador MSE: tenim un I.C. per i: Pel nivell 30% de cotó un I.C. al 95% és: Anàlisi de dissenys d’un factor

19 Validesa del model (lineal)+homoescedàstic+normal
Anàlisi gràfica: residus sense estructura? d. de dispersió de residus: homoescedasticitat? gràfics de probabilitat i histogrames: normalitat? d. de caixa: observacions extremes (outliers)? Proves de significació: homoescedasticitat: de Bartlett, de Cochran, de Hartley. normalitat: de Kolmogorov-Smirnov-Lilliefors, 2. mètode Anàlisi de dissenys d’un factor

20 Anàlisi de dissenys d’un factor
Prova de Bartlett Estadístic: on: Si H0 és certa Rebutjarem H0 si Anàlisi de dissenys d’un factor

21 Anàlisi de dissenys d’un factor
Comparacions múltiples: quins nivells tenen mitjanes realment diferents? Suposem que l’ANOVA ha estat significatiu. Dues qüestions problemàtiques: Simples proves t de nivell  per totes les parelles fan que és sumin les probabilitats d’error I, el nivell de significació real és superior al nominal : com controlar aquesta probabilitat d’error? Cal comparacions planificades prèviament: si solament comparem les més diferents, distorsionem el nivell de significació. Anàlisi de dissenys d’un factor

22 Comparacions múltiples: LSD “Least significant difference”
Equivalent de l’estadístic t quan tenim informació de a grups: Rebutjarem H0: i = k si Millor estima de 2 i més g.d.ll (més potent que t senzilla) però nivell simultani real superior a  (en múltiples comparacions). Anàlisi de dissenys d’un factor

23 Comparacions múltiples: LSD en dades de resistència segons cotó
a = 5, n = 5, N - a = 20, t0,05(20) = 2,086, MSE = 8,06. En ser balancejat, sempre Comparem totes les diferències amb aquest valor. P.e. 30% menys 25%: 21,6 - 17,6= 4 > 3,75 diferents. Solament igualtat per 15% amb 35% i 20% amb 25%. Anàlisi de dissenys d’un factor

24 Comparacions múltiples: Prova de Duncan “rangs múltiples”
Procediment: Ordenem promitjos de més petit a més gran: Estima comú de l’error estàndard dels Taula: r(p,f ), p=2,3,..., a; f = g.d.ll. “rang mínim significatiu” Anàlisi de dissenys d’un factor

25 Comparacions múltiples: Prova de Duncan “rangs múltiples”
Es comprova si és cert que: Si es rebutja per evitar contradiccions, si aquesta comparació no és significativa, per definició totes les “interiors”, per i’, k’ amb i<i’<k’<k, tampoc no ho són.. Anàlisi de dissenys d’un factor

26 Comparacions múltiples: Prova de Duncan “rangs múltiples
Propietats: Com més mitjanes hi ha al grup, més gran és Rp i més difícil és trobar la diferència significativa. Per dues consecutives és equivalent a LSD. r(p,f) garanteix “nivell de protecció”: totes les comparacions dins un grup de p consecutives, tenen una significació simultània 1-(1-)p-1. Nivell de significació real bastant més gran que  (alt risc d’error I) però també alta potència. Anàlisi de dissenys d’un factor

27 Comparacions múltiples: Duncan en resistència segons cotó
Les mitjanes mostrals, ordenades, serien: L’estimació comú de l’error estàndard és: A la taula de Duncan, per N-a=20 g.d.ll: Anàlisi de dissenys d’un factor

28 Comparacions múltiples: Duncan en resistència segons cotó
Significació de les diferències: Sols no significatives 3 amb 2 i 5 amb 1. Anàlisi de dissenys d’un factor

29 Comparacions múltiples: Duncan en resistència segons cotó
Quin nivell de significació tenim en realitat en fer totes les comparacions dins del grup de la (4) fins la (1)? Com que està format per p = 4 mitjanes, tenim que el veritable nivell de significació, la probabilitat de trobar alguna falsa diferència, és: Anàlisi de dissenys d’un factor

30 Comparacions múltiples prova de Newman-Keuls
Newman-Keuls  Duncan, basada en q(p,f) percentil  superior del “rang studentitzat” per un grup de p mitjanes: Les diferències de mitjanes es comparen amb com es fa amb Rp. Anàlisi de dissenys d’un factor

31 Comparacions múltiples prova HSD de Tukey (o Tukey-Cramér)
“Honestly Significant Difference” Estima comú de l’error estàndard de les Únic valor crític (taula de Newman-Keuls) amb el qual comparem totes les diferències Anàlisi de dissenys d’un factor

32 Comparacions múltiples prova HSD de Tukey (o Tukey-Cramér)
“Honestly Significant Difference” Prova per totes les parelles de mitjanes (no per establir grups homogenis com les proves de Duncan i de Newman-Keuls) Únic valor crític (taula de Newman-Keuls) amb el qual comparem totes les diferències Anàlisi de dissenys d’un factor

33 Prova HSD pel cas de resistència de teixits segons % de cotó
Determinació del valor crític: Qualsevol diferència, per a ser significativa, ha de superar aquest valor (5.37) Anàlisi de dissenys d’un factor

34 Comparacions múltiples prova de Scheffé
Utilitza el valor crític i rebutja H0: i = k si És un test amb nivell de significació simultani  . Els intervals de confiança de la forma són també I.C. simultanis per les diferències i - k amb nivell de confiança, com a mínim, 1 - . Anàlisi de dissenys d’un factor

35 Comparacions múltiples prova de Dunnet
Comparació dels altres tractaments contra un tractament control (diguem que és l’a): Rebutjarem H0(i) si on d(a-1, f) és un valor crític trobat per Dunnet que garanteix un nivell de significació simultani a pels a-1 contrastos. Anàlisi de dissenys d’un factor

36 Comparacions múltiples comparació entre mètodes: quin triar?
Diversitat d’opinions entre experts. Criteris: Menor a major probabilitat d’error I: Scheffé, Tukey, Newman-Keuls, Duncan. Potència: sembla que el mateix ordre. Poques comparacions prèviament planificades: possiblement preferible més potència encara que nivell de significació alt. Moltes: contrari. També valorar les conseqüències d’error I i II. Utilitzarem Dunnet per control contra els altres. Anàlisi de dissenys d’un factor

37 Dissenys amb factors aleatoris Nadons a l’atzar de 5 mares a l’atzar
Anàlisi de dissenys d’un factor

38 Model d’efectes aleatoris Concepte i definició
Els a nivells del factor estudiat són una mostra aleatòria dels molts possibles. Ara el model és Yij=  + Ai + eij, on  és, com abans, una mitjana general, Ai és una variable aleatòria, no una constant, eij és l’error no explicat pel model. Suposem E(Ai)=0, E(eij)=0, var(Ai)=A2, var(eij) =2, Ai i eij totes independents. Per tant, var(Yij)= A2 + 2. Anàlisi de dissenys d’un factor

39 Model d’efectes aleatoris Proves de significació
Ara el contrast amb més sentit és: La descomposició de la suma de quadrats continua sent vàlida, SST = SSA + SSE, però els quadrats mitjans tenen un altre sentit: Anàlisi de dissenys d’un factor

40 Model d’efectes aleatoris Proves de significació
L’estadístic F = MSA / MSE continua sent adequat: Si H0 és certa, F serà proper a 1, si H0 és falsa, F tendirà a ser gran. Sota condicions de normalitat si H0 és certa F~F(a-1, N-a) i la taula ANOVA, el p-valor, etc. són vàlids. La interpretació dels resultats és, però, diferent. Anàlisi de dissenys d’un factor

41 Taula ANOVA (segons SPSS) Pes de nadons, 5 mares agafades a l’atzar
Sembla que la variació en el pes dels nadons atribuïble al factor “mare” no és significativa: Anàlisi de dissenys d’un factor

42 Correlació intraclàssica i components de la variància
En un model com l’anterior hi pot haver correlació “intraclàssica”: Component de la variància associada al factor (no) significativa correlació intraclàssica (no) significativa. Anàlisi de dissenys d’un factor

43 Model d’efectes aleatoris Estimació puntual
Estimadors puntuals dels components de la variància: Possibles valors absurds (negatius) de Anàlisi de dissenys d’un factor

44 Model d’efectes aleatoris Intervals de confiança de nivell 1-
Del fet que obtenim l’interval Un interval per és difícil d’obtenir. En canvi per la proporció tenim Anàlisi de dissenys d’un factor

45 Anàlisi de dissenys d’un factor
Determinació de la mida mostral en funció de la potència desitjada del test Fixar probabilitat d’error II màxima, pII, per H1 d'interès, descrita per paràmetre : Utilitzar corba característica d’operació pII=g(). Gràfiques per cada m1 (= g.d.ll. numerador) que contenen c.c.o. per diversos nivells de significació i g.d.ll. denominador, m2 = N-a = a(n-1). Anàlisi de dissenys d’un factor

46 Dificultat de determinar H1 d'interès
Un criteri senzill és fixar una diferència “com a mínim D entre algun parell de mitjanes” per a rebutjar H0 amb la seguretat especificada. Aleshores: Això dóna una valor n major del necessari, és com si féssim ai = D, ai’ = 0 per i’ i. Anàlisi de dissenys d’un factor

47 Resistència segons % de cotó És suficient n = 4
Si n’hi ha alguna, l’experimentador vol detectar amb probabilitat 0,90 com a mínim, una diferència de resistència mitjana D = 10. D’experiència prèvia estima 29. Sempre hi ha 4 g.d.ll. al numerador. Si n = 4,  = 2,11 i 5(n-1) = 15 g.d.ll. al denominador. Si  = 0,05 la c.c.o. per  indica pII < 0,1. Anàlisi de dissenys d’un factor

48 Anàlisi de dissenys d’un factor
Corbes característiques d’operació ANOVA 1 factor fix, 4 g.d.ll. numerador Anàlisi de dissenys d’un factor


Descargar ppt "Anàlisi de dissenys d’un factor"

Presentaciones similares


Anuncios Google