La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

PCA para clasificación de películas con matrices sparse. Ejemplo con base de datos netflix Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012.

Presentaciones similares


Presentación del tema: "PCA para clasificación de películas con matrices sparse. Ejemplo con base de datos netflix Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012."— Transcripción de la presentación:

1 PCA para clasificación de películas con matrices sparse. Ejemplo con base de datos netflix Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012

2 Referencias Journal of Statistical Software: número especial sobre Psicometría y R – Ejemplo de PCA con FactoMineR: – methods/principal-components-analysis.html methods/principal-components-analysis.html

3 Referencias El concurso Netflix: – pic.php?id=1537 pic.php?id=1537 La necesidad de utilizar matrices sparse (poco densas) para poder trabajar con netflix y SVD / PCA – data-svd-and-r-2/ data-svd-and-r-2/

4 Referencias Muy buenos ejemplos y explicación (técnica) de SVD: – hms_In_R/Dimensionality_Reduction/Singular_Val ue_Decomposition hms_In_R/Dimensionality_Reduction/Singular_Val ue_Decomposition Descripción detallada de algoritmos de recomendación (incluyendo SVD / PCA) – hms_In_R/Dimensionality_Reduction/Singular_Val ue_Decomposition hms_In_R/Dimensionality_Reduction/Singular_Val ue_Decomposition

5 Referencias Ejemplo específico de factorización para clasificación de películas: – uter.pdf uter.pdf

6 Ejemplo Movielens Películas más populares Distribución de autovalores y varianza acumulada (eje Y) en el espacio de componentes

7 Ejemplo Movielens Películas más populares (174)

8 Ejemplo Movielens Películas con mayor varianza (164) Distribución de autovalores y varianza acumulada (eje Y) en el espacio de componentes

9 Ejemplo Movielens Películas con mayor varianza (164) Primeros 2 factores/componentes

10 Ejemplo Movielens Películas con mayor varianza (164)

11 Conclusiones Trabajo todavía sin finalizar (con el dataset netflix), pero prometedor El uso de librerías para matrices sparse es esencial (maravillosa librería Matrix) Múltiples posibilidades de librerías PCA, con muchas alternativas para probar: – Número de componentes – Tipo de extracción – Rotación

12 ¡Muchas gracias por vuestra atención! Y sobre todo, gracias a los organizadores de estas reuniones Datos de contacto:


Descargar ppt "PCA para clasificación de películas con matrices sparse. Ejemplo con base de datos netflix Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012."

Presentaciones similares


Anuncios Google