Anàlisi de dissenys d’un factor

Slides:



Advertisements
Presentaciones similares
REACCIONS DE TRANSFERÈNCIA DE PROTONS
Advertisements

PROPORCIONALITAT 1 Funciona amb “clics”.
Experimentem amb l’elasticitat escola arc iris roger soto, laura torcal, pere ros, lluc rodó, júlia aicart i jan sanfulgencio.
Variables numèriques Taules de freqüències:
d' a s s i s t è n c i a al g o v e r n l o c a l
MESURA DEL RADI DE LA TERRA (seguint Eratóstenes)
No te la juguis: posa’t el cinturó !
LA GRAVETAT SOTA SOSPITA
BAUHAUS, una escola d’art
Variables qualitatives
No tractar el càncer de pròstata, ¿és correcte?
IV. Dades i distribucions
Llicenciatura de Biologia
Tema 2. DIVISIBILITAT.
MÚLTIPLES I DIVISORS ESCOLA EL Cim- 6è de primària.
Fronts de reacció-dispersió per poblacions Neolítiques
NIVELLS D’0RGANITZACIÓ
Les fraccions Sisè B curs
ESTADÍSTIQUES I WEBQUEAST
Visió general del disseny d’experiments
Creació d’un mapa personalitzat
ELS NOMBRES ENTERS.
En aquest tema veurem els apartats següents:
CONSULTA OBERTA LA CONSULTA OBERTA COM A REPTE PERSONAL I PROFESSIONAL. AJUDAT A VALORAR ELS ADOLESCENTS D’UNA ALTRA MANERA, FINS ARA, AL MENYS PER MI.
Tema 5 (1ª part) Cinètica química.
Tema 10 Cinètica química.
TREBALLS D’ATENCIÓ AL PÚBLIC
Experimentam amb la ciència
Introducció a l’Experimentació
1 Gasos: conceptes bàsics La velocitat de difusió dels gasos
TEMA 5 : FUNCIÓ DE NUTRICIÓ
H. EBBINGHAUS. ELS PRIMERS ESTUDIS SISTEMÀTICS SOBRE MEMÒRIA
Menú => Gestió d’expedients => Adaptació per extinció de pla d’estudis.
QUÈ FA QUE UNA PILOTA BOTI MÉS QUE UNA ALTRA?
ANTECEDENTS I OBJECTIUS
Termes i expressions algebraiques
DE LA DURADA AL RITME.
HORT = TREBALL EN EQUIP - 4t
Treballem l’estadística
UD1- L’activitat científica
Situacions Simuladores Preferencials (SSP)
Resultats DIAGNOSI SOCIO CULTURAL DE L’ENTORN FAMILIAR DELS I DE LES
Matemàtiques 3er E.S.O..
Dissenys factorials dos o més factors creuats
L’orientació acadèmica i professional dels alumnes d’ESO:
Mescla Eutèctica Estudi analític del comportament del punt de fusió d’una mescla homogènia d’aigua i sal.
Presentació BATXILLERAT
Sòlids Líquids Gasos Plasma
Tema 5: Nombres naturals i enters
Distribucions importants en Inferència estadística
HORT = TREBALL EN EQUIP - 4t
Repàs control 4: estadística i atzar
SALUT MENTAL.
XXIII OLIMPìADA MATEMÀTICA 2012
Problemes que es poden resoldre amb equacions
Introducció a l’experimentació
ESCOLA ANTONI TÀPIES- 5èB
Estrès laboral i L'estrès laboral és una resposta de l’organisme davant de qualsevol demanda o exigència a la qual està sotmès i que l’individu interpreta.
Jessica, Gerard, Laura P, Alex
ENQUESTA DE SATISFACCIÓ INTERNA COM A EINA DE GESTIÓ COMPLEMENTÀRIA
Organització i creixement
(Fes clic per entrar en el quadre i poder escriure) NOM DELS PERSONATGE (Per canviar la lletra i la mida ho pots fer des de FORMATO-FUENTE) Escriviu els.
Explorant la matèria.
Introducció a l’anàlisi d’agrupaments (cluster)
Anàlisi de la qualitat de vida de les persones majors a Mallorca
La inserció laboral dels graduats de grau de la UPF
Funcions de demanda agregada
Què fas a la universitat?
Què fas a la universitat?
Interpretació estadística dels indicadors de centre
Transcripción de la presentación:

Anàlisi de dissenys d’un factor Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull

Anàlisi de dissenys d’un factor Contingut Planteig. Model lineal per un factor (fix) Inferència al cas normal Taula ANOVA i prova F Intervals de confiança Verificació de la validesa del model Comparacions múltiples Model amb un factor aleatori Determinació de la mida mostral Anàlisi de dissenys d’un factor

Planteig: típica situació estudiada Estudi de si un únic factor amb k nivells influeix en determinada variable de resposta Varietat de tomaquera (A,B,C,D) influeix en la producció? Més precisament: la mitjana (poblacional) de la variable de resposta és diferent segons el nivell del factor? Anàlisi de dissenys d’un factor

Disseny paral·lel totalment aleatoritzat Cada unitat experimental s’assigna, a l’atzar, a exactament una condició experimental o tractament (a cada nivell del factor) Com a conseqüència, el “factor” individu està jeràrquicament dins cada grup de tractament Diversos noms : disseny d’un sol factor: “una via” (one-way layout) disseny paral·lel per a un sol factor Anàlisi de dissenys d’un factor

Avantatges i inconvenients Simplicitat Optimització del temps de durada de l’experiment Menor perill de pèrdua de casos Inconvenients Major nombre d’unitats experimentals (que a altres dissenys) Comparació entre subjectes, no dins dels subjectes Mobilització de molts recursos en poc temps Anàlisi de dissenys d’un factor

Model lineal definició i notació Anàlisi de dissenys d’un factor

Model lineal definició, notació i primers resultats Suma i mitjana per cada nivell: Suma i mitjana global Estimadors puntuals dels paràmetres del model Recalcar que són estimadors no esbiaixats Anàlisi de dissenys d’un factor

Model lineal Prova d’igualtat de mitjanes Contrast plantejat Suma de quadrats total Descomposició de la s.q. Anàlisi de dissenys d’un factor

Prova d’igualtat de mitjanes dades d’exemple Anàlisi de dissenys d’un factor

Anàlisi de dissenys d’un factor Prova d’igualtat de mitjanes 1er nivell -5, 4at nivell +5: idèntica var. Anàlisi de dissenys d’un factor

Anàlisi de dissenys d’un factor Prova d’igualtat de mitjanes 1er i 4at nivell més var. idèntiques mitjan. Anàlisi de dissenys d’un factor

Prova d’igualtat de mitjanes Quadrats mitjans Si H0 és certa, MSE i MSA estimen el mateix, s2 Anàlisi de dissenys d’un factor

Prova d’igualtat de mitjanes Estadístic F Si H0 és certa, F tendirà a ser proper a 1 Si H1 és certa, F tendirà a ser major que 1 Per tant, un test molt raonable consisteix en rebutjar H0 si F és prou gran Anàlisi de dissenys d’un factor

Distribució de l’estadístic F sota H0 i errors normals Suposem errors normals i homoscedàstics Sota H0: Com a conseqüència: Anàlisi de dissenys d’un factor

Taula d’anàlisi de la variància (ANOVA) Anàlisi de dissenys d’un factor

Criteri de decisió ANOVA F és el valor calculat sobre les dades. Si H0 és certa, F és un valor més de la v.a. Valor crític F(a -1, N - a) d’acord amb . Si F F(a -1, N - a) rebutjarem H0 o, equivalentment, si el p-valor és prou petit: Anàlisi de dissenys d’un factor

Taula ANOVA de l’exemple V. crític F0,05(4,20)=2,87, estadístic F=14,76 Com 14,76 > 2,87, rebutgem H0. O també, com p-valor = 9,11x10-6 < 0,05 reb. H0. Anàlisi de dissenys d’un factor

Interval de confiança per i Com que Si substituïm 2 pel seu estimador MSE: tenim un I.C. per i: Pel nivell 30% de cotó un I.C. al 95% és: Anàlisi de dissenys d’un factor

Validesa del model (lineal)+homoescedàstic+normal Anàlisi gràfica: residus sense estructura? d. de dispersió de residus: homoescedasticitat? gràfics de probabilitat i histogrames: normalitat? d. de caixa: observacions extremes (outliers)? Proves de significació: homoescedasticitat: de Bartlett, de Cochran, de Hartley. normalitat: de Kolmogorov-Smirnov-Lilliefors, 2. mètode Anàlisi de dissenys d’un factor

Anàlisi de dissenys d’un factor Prova de Bartlett Estadístic: on: Si H0 és certa Rebutjarem H0 si Anàlisi de dissenys d’un factor

Anàlisi de dissenys d’un factor Comparacions múltiples: quins nivells tenen mitjanes realment diferents? Suposem que l’ANOVA ha estat significatiu. Dues qüestions problemàtiques: Simples proves t de nivell  per totes les parelles fan que és sumin les probabilitats d’error I, el nivell de significació real és superior al nominal : com controlar aquesta probabilitat d’error? Cal comparacions planificades prèviament: si solament comparem les més diferents, distorsionem el nivell de significació. Anàlisi de dissenys d’un factor

Comparacions múltiples: LSD “Least significant difference” Equivalent de l’estadístic t quan tenim informació de a grups: Rebutjarem H0: i = k si Millor estima de 2 i més g.d.ll (més potent que t senzilla) però nivell simultani real superior a  (en múltiples comparacions). Anàlisi de dissenys d’un factor

Comparacions múltiples: LSD en dades de resistència segons cotó a = 5, n = 5, N - a = 20, t0,05(20) = 2,086, MSE = 8,06. En ser balancejat, sempre Comparem totes les diferències amb aquest valor. P.e. 30% menys 25%: 21,6 - 17,6= 4 > 3,75 diferents. Solament igualtat per 15% amb 35% i 20% amb 25%. Anàlisi de dissenys d’un factor

Comparacions múltiples: Prova de Duncan “rangs múltiples” Procediment: Ordenem promitjos de més petit a més gran: Estima comú de l’error estàndard dels Taula: r(p,f ), p=2,3,..., a; f = g.d.ll. “rang mínim significatiu” Anàlisi de dissenys d’un factor

Comparacions múltiples: Prova de Duncan “rangs múltiples” Es comprova si és cert que: Si es rebutja per evitar contradiccions, si aquesta comparació no és significativa, per definició totes les “interiors”, per i’, k’ amb i<i’<k’<k, tampoc no ho són.. Anàlisi de dissenys d’un factor

Comparacions múltiples: Prova de Duncan “rangs múltiples Propietats: Com més mitjanes hi ha al grup, més gran és Rp i més difícil és trobar la diferència significativa. Per dues consecutives és equivalent a LSD. r(p,f) garanteix “nivell de protecció”: totes les comparacions dins un grup de p consecutives, tenen una significació simultània 1-(1-)p-1. Nivell de significació real bastant més gran que  (alt risc d’error I) però també alta potència. Anàlisi de dissenys d’un factor

Comparacions múltiples: Duncan en resistència segons cotó Les mitjanes mostrals, ordenades, serien: L’estimació comú de l’error estàndard és: A la taula de Duncan, per N-a=20 g.d.ll: Anàlisi de dissenys d’un factor

Comparacions múltiples: Duncan en resistència segons cotó Significació de les diferències: Sols no significatives 3 amb 2 i 5 amb 1. Anàlisi de dissenys d’un factor

Comparacions múltiples: Duncan en resistència segons cotó Quin nivell de significació tenim en realitat en fer totes les comparacions dins del grup de la (4) fins la (1)? Com que està format per p = 4 mitjanes, tenim que el veritable nivell de significació, la probabilitat de trobar alguna falsa diferència, és: Anàlisi de dissenys d’un factor

Comparacions múltiples prova de Newman-Keuls Newman-Keuls  Duncan, basada en q(p,f) percentil  superior del “rang studentitzat” per un grup de p mitjanes: Les diferències de mitjanes es comparen amb com es fa amb Rp. Anàlisi de dissenys d’un factor

Comparacions múltiples prova HSD de Tukey (o Tukey-Cramér) “Honestly Significant Difference” Estima comú de l’error estàndard de les Únic valor crític (taula de Newman-Keuls) amb el qual comparem totes les diferències Anàlisi de dissenys d’un factor

Comparacions múltiples prova HSD de Tukey (o Tukey-Cramér) “Honestly Significant Difference” Prova per totes les parelles de mitjanes (no per establir grups homogenis com les proves de Duncan i de Newman-Keuls) Únic valor crític (taula de Newman-Keuls) amb el qual comparem totes les diferències Anàlisi de dissenys d’un factor

Prova HSD pel cas de resistència de teixits segons % de cotó Determinació del valor crític: Qualsevol diferència, per a ser significativa, ha de superar aquest valor (5.37) Anàlisi de dissenys d’un factor

Comparacions múltiples prova de Scheffé Utilitza el valor crític i rebutja H0: i = k si És un test amb nivell de significació simultani  . Els intervals de confiança de la forma són també I.C. simultanis per les diferències i - k amb nivell de confiança, com a mínim, 1 - . Anàlisi de dissenys d’un factor

Comparacions múltiples prova de Dunnet Comparació dels altres tractaments contra un tractament control (diguem que és l’a): Rebutjarem H0(i) si on d(a-1, f) és un valor crític trobat per Dunnet que garanteix un nivell de significació simultani a pels a-1 contrastos. Anàlisi de dissenys d’un factor

Comparacions múltiples comparació entre mètodes: quin triar? Diversitat d’opinions entre experts. Criteris: Menor a major probabilitat d’error I: Scheffé, Tukey, Newman-Keuls, Duncan. Potència: sembla que el mateix ordre. Poques comparacions prèviament planificades: possiblement preferible més potència encara que nivell de significació alt. Moltes: contrari. També valorar les conseqüències d’error I i II. Utilitzarem Dunnet per control contra els altres. Anàlisi de dissenys d’un factor

Dissenys amb factors aleatoris Nadons a l’atzar de 5 mares a l’atzar Anàlisi de dissenys d’un factor

Model d’efectes aleatoris Concepte i definició Els a nivells del factor estudiat són una mostra aleatòria dels molts possibles. Ara el model és Yij=  + Ai + eij, on  és, com abans, una mitjana general, Ai és una variable aleatòria, no una constant, eij és l’error no explicat pel model. Suposem E(Ai)=0, E(eij)=0, var(Ai)=A2, var(eij) =2, Ai i eij totes independents. Per tant, var(Yij)= A2 + 2. Anàlisi de dissenys d’un factor

Model d’efectes aleatoris Proves de significació Ara el contrast amb més sentit és: La descomposició de la suma de quadrats continua sent vàlida, SST = SSA + SSE, però els quadrats mitjans tenen un altre sentit: Anàlisi de dissenys d’un factor

Model d’efectes aleatoris Proves de significació L’estadístic F = MSA / MSE continua sent adequat: Si H0 és certa, F serà proper a 1, si H0 és falsa, F tendirà a ser gran. Sota condicions de normalitat si H0 és certa F~F(a-1, N-a) i la taula ANOVA, el p-valor, etc. són vàlids. La interpretació dels resultats és, però, diferent. Anàlisi de dissenys d’un factor

Taula ANOVA (segons SPSS) Pes de nadons, 5 mares agafades a l’atzar Sembla que la variació en el pes dels nadons atribuïble al factor “mare” no és significativa: Anàlisi de dissenys d’un factor

Correlació intraclàssica i components de la variància En un model com l’anterior hi pot haver correlació “intraclàssica”: Component de la variància associada al factor (no) significativa correlació intraclàssica (no) significativa. Anàlisi de dissenys d’un factor

Model d’efectes aleatoris Estimació puntual Estimadors puntuals dels components de la variància: Possibles valors absurds (negatius) de Anàlisi de dissenys d’un factor

Model d’efectes aleatoris Intervals de confiança de nivell 1- Del fet que obtenim l’interval Un interval per és difícil d’obtenir. En canvi per la proporció tenim Anàlisi de dissenys d’un factor

Anàlisi de dissenys d’un factor Determinació de la mida mostral en funció de la potència desitjada del test Fixar probabilitat d’error II màxima, pII, per H1 d'interès, descrita per paràmetre : Utilitzar corba característica d’operació pII=g(). Gràfiques per cada m1 (= g.d.ll. numerador) que contenen c.c.o. per diversos nivells de significació i g.d.ll. denominador, m2 = N-a = a(n-1). Anàlisi de dissenys d’un factor

Dificultat de determinar H1 d'interès Un criteri senzill és fixar una diferència “com a mínim D entre algun parell de mitjanes” per a rebutjar H0 amb la seguretat especificada. Aleshores: Això dóna una valor n major del necessari, és com si féssim ai = D, ai’ = 0 per i’ i. Anàlisi de dissenys d’un factor

Resistència segons % de cotó És suficient n = 4 Si n’hi ha alguna, l’experimentador vol detectar amb probabilitat 0,90 com a mínim, una diferència de resistència mitjana D = 10. D’experiència prèvia estima 29. Sempre hi ha 4 g.d.ll. al numerador. Si n = 4,  = 2,11 i 5(n-1) = 15 g.d.ll. al denominador. Si  = 0,05 la c.c.o. per  indica pII < 0,1. Anàlisi de dissenys d’un factor

Anàlisi de dissenys d’un factor Corbes característiques d’operació ANOVA 1 factor fix, 4 g.d.ll. numerador Anàlisi de dissenys d’un factor