La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Análisis de supervivencia Tema 5 Itziar Aretxaga.

Presentaciones similares


Presentación del tema: "Análisis de supervivencia Tema 5 Itziar Aretxaga."— Transcripción de la presentación:

1 Análisis de supervivencia Tema 5 Itziar Aretxaga

2 Transformadas de Fourier

3 ♦ Coeficiente generalizado de rangos de Kendall o test BHK (Brown, Hollander & Korwar) Recomendaciones: funciona para variables ordinales o continuas derivadas de cualquier distribución, pero en condiciones de muchas ligaduras, deja de ser efectivo. El test es no paramétrico. Método: con m detecciones y n cotas (límites superiores o inferiores), donde y b ij de define de forma análoga con las y La significancia de que x,y sean independientes viene dada por z=S/σ S que está distribuida de forma normal Correlaciones con límites superiores e inferiores (Isobe et al 1986, ApJ, 306, 490)

4 En Estadística se denomina cota derecha el valor de una variable de la que sólo se sabe que se encuentra entre [A,+∞] ≡ límite inferior cota izquierda el valor de una variable de la que sólo se sabe que se encuentra entre [−∞,C] ≡ límite superior En Astrofísica nos encontramos casi siempre con cotas izquierdas, mientras que las técnicas de análisis de supervivencia se han desarrollado para cotas derechas. Sin embargo, es posible transformar unas en otras mediante una constante M: C i =M−A i Ejemplo: {30,24 −,11,19 − } con M=30 se convierten en {0,6 +,19,11 + } ♦ Algoritmo EM de expectación y maximización (Nelson & Hahn 1972) Sea {x i,y i } i=1,…,n+m tal que fijado x, la distribución de y sea gaussiana. El test es paramétrico, y análogo a un ajuste por mínimos cuadrados. Definimos los residuos del ajuste lineal dado por los coeficientes a k, b k y la desviación estándar del ajuste σ k como La probabilidad de que un punto se detecte en un intervalo Δz es La probabilidad de que un dato se acote (a la derecha) viene dado por la función de supervivencia Métodos de regresión con valores censados (Isobe et al 1986, ApJ, 306, 490)

5 La función de probabilidad de tener m observaciones detectadas y n acotadas viene dada por tomando logaritmos Los parámetros vienen de la maximización donde la variancia El método implica: 1. estimar a 1, b 1, σ 1 de una regresión por mínimos cuadrados sin utilizar los valores censados. 2. estimar los valores acotados 3. calcular a 2, b 2, σ 2 4. estimar e iterar hasta que converja Métodos de regresión con valores censados z = y/ k (codificado en IRAF) (Isobe et al 1986, ApJ, 306, 790) cte

6 (Isobe et al 1986, ApJ, 306, 790)

7 Para mejorar la convergencia en el caso de muchas cotas (Aitkin 1981) se redefine Los errores en los parámetros vienen dados por la diagonal de la matriz de covariancia V=I -1 donde Métodos de regresión con valores censados (Isobe et al 1986, ApJ, 306, 790)

8 ♦ Algoritmo EM con el estimador de Kaplan-Meier El estimador de Kaplan-Meier provee de una estimación no paramétrica de la función de supervivencia. Se define la muestra de riesgo R(z i ) como el conjunto de datos que, con toda seguridad, no se ha detectado antes de z i. Ejemplo: y(1) < y(2) < y(3) + < y(4) R[y(1)]={ y(1), y(2), y(3) +, y(4)}, R[y(2)]={y(2),y(3) +,y(4)}, R[y(4)]={y(4)} no existe la muestra de riesgo de valores censados El estimador de Kaplan-Meier se define formalmente como donde los z i han sido indexados de forma creciente: z 1 ≤…≤z n+m n i es el tamaño de la muestra de riesgo R(z i ) d i es el número de detecciones con valor z i es una función escalón decreciente que sólo salta en las detecciones. x i n i d i 1-d i /n i S(x i ) 0 8 1 0.8750 1 3 6 1 0.8333 0.8750 Ejemplo: {0,6 +,19,11 +,3,19,6,2 + } 6 5 1 0.8000 0.7292 19 2 2 0.0000 0.5833 >19 0 Métodos de regresión con valores censados (Feigelson & Nelson 1985, ApJ, 293, 192)

9 Para realizar un ajuste con este método se debe obtener una estimación de los coeficientes a k, b k sin tomar en cuenta los valores censados, y de forma iterativa encontrar el valor más probable de los coeficientes con donde los pesos y se ordenan de forma creciente. Los coeficientes en el paso k serán Buckley & James (1979) recomiendan usar como estimador de la desviación estándar σ k la fórmula empírica Donde D denota que sólo se utilizan valores detectados. El error de la pendiente es y puede estimar la significancia del Métodos de regresión con valores censados ajuste

10 Para el caso general de querer obtener el ajuste de una función no-lineal φ(x,a), definimos de igual manera los residuos y podemos plantear la maximización de la probabilidad que en general, puede no tener una solución analítica. Lo que siempre se puede intentar es la minimización con un algoritmo adaptable, tal como amoeba. Métodos de ajuste con valores censados: caso general (Aretxaga, Hughes & Dunlop MNRAS, 2003, in prep) Ejemplo:

11 Suposiciones: tests no paramétricos formulados para cotas derechas Sean los valores de una distribución, donde i recorre las distribuciones i=1,2; y j recorre el número de puntos j=1,2,...,N i ; y A ij denota las cotas Método: se formula la hipótesis nula de que las dos distribuciones son iguales. Sean y 1 < y 2 <...< y r con r≤N 1 +N 2 los valores detectados en ambas distribuciones de forma conjunta, ordenados de forma creciente. Se definen las variables: La estadística de rangos lineales con cotas se calcula mediante donde w j son pesos asociados a diferentes estadísticas: Comparación de distribuciones con cotas (Feigelson & Nelson 1985, ApJ, 293, 192)

12 Para n grande, L n es aproximadamente gaussiana, con media 0 y variancia de forma que a un nivel h se puede decir que las dos distribuciones difieren si donde z h/2 es el intervalo para el cual el área de la distribución normal entre [−z h/2,z h/2 ] es igual a 1−h, y la significancia de este resultado viene dada por el área de la distribución normal con valores mayores que Ejemplo: {30,24 −,11,19 −,27,11,24,28 − } y {3,23,17 −,8 −,10,5 − } se convierten en cotas derechas con una traslación con M=30. Utilizando las definiciones del análisis de supervivencia tenemos N 1 =8, N 2 =6, n=14, r=7 logrank da L n =2.5 σ n =1.1 que es significante con una probabilidad p=0.032 Gehan da L n = 23 σ n =11 que es significativo con una probabilidad p=0.056 Latta (1981) introduce unos nuevos pesos que dan lugar al test Peto- Prentice, que supuestamente es menos sensible a diferencias de acotado Comparación de distribuciones con cotas (Feigelson & Nelson 1985, ApJ, 293, 192)


Descargar ppt "Análisis de supervivencia Tema 5 Itziar Aretxaga."

Presentaciones similares


Anuncios Google