La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

PCA para clasificación de películas con matrices sparse. Ejemplo con base de datos netflix Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012.

Presentaciones similares


Presentación del tema: "PCA para clasificación de películas con matrices sparse. Ejemplo con base de datos netflix Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012."— Transcripción de la presentación:

1 PCA para clasificación de películas con matrices sparse. Ejemplo con base de datos netflix Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012

2 Referencias Journal of Statistical Software: número especial sobre Psicometría y R – http://www.jstatsoft.org/v20/i01 http://www.jstatsoft.org/v20/i01 Ejemplo de PCA con FactoMineR: – http://factominer.free.fr/classical- methods/principal-components-analysis.html http://factominer.free.fr/classical- methods/principal-components-analysis.html

3 Referencias El concurso Netflix: – http://www.netflixprize.com//community/viewto pic.php?id=1537 http://www.netflixprize.com//community/viewto pic.php?id=1537 La necesidad de utilizar matrices sparse (poco densas) para poder trabajar con netflix y SVD / PCA – http://www.r-bloggers.com/the-netflix-prize-big- data-svd-and-r-2/ http://www.r-bloggers.com/the-netflix-prize-big- data-svd-and-r-2/

4 Referencias Muy buenos ejemplos y explicación (técnica) de SVD: – http://en.wikibooks.org/wiki/Data_Mining_Algorit hms_In_R/Dimensionality_Reduction/Singular_Val ue_Decomposition http://en.wikibooks.org/wiki/Data_Mining_Algorit hms_In_R/Dimensionality_Reduction/Singular_Val ue_Decomposition Descripción detallada de algoritmos de recomendación (incluyendo SVD / PCA) – http://en.wikibooks.org/wiki/Data_Mining_Algorit hms_In_R/Dimensionality_Reduction/Singular_Val ue_Decomposition http://en.wikibooks.org/wiki/Data_Mining_Algorit hms_In_R/Dimensionality_Reduction/Singular_Val ue_Decomposition

5 Referencias Ejemplo específico de factorización para clasificación de películas: – http://research.yahoo4.akadns.net/files/ieeecomp uter.pdf http://research.yahoo4.akadns.net/files/ieeecomp uter.pdf

6 Ejemplo Movielens Películas más populares Distribución de autovalores y varianza acumulada (eje Y) en el espacio de componentes

7 Ejemplo Movielens Películas más populares (174)

8 Ejemplo Movielens Películas con mayor varianza (164) Distribución de autovalores y varianza acumulada (eje Y) en el espacio de componentes

9 Ejemplo Movielens Películas con mayor varianza (164) Primeros 2 factores/componentes

10 Ejemplo Movielens Películas con mayor varianza (164)

11 Conclusiones Trabajo todavía sin finalizar (con el dataset netflix), pero prometedor El uso de librerías para matrices sparse es esencial (maravillosa librería Matrix) Múltiples posibilidades de librerías PCA, con muchas alternativas para probar: – Número de componentes – Tipo de extracción – Rotación

12 ¡Muchas gracias por vuestra atención! Y sobre todo, gracias a los organizadores de estas reuniones Datos de contacto: E-mail: Pedro.concejero@tid.esPedro.concejero@tid.es Twitter: @ConcejeroPedro


Descargar ppt "PCA para clasificación de películas con matrices sparse. Ejemplo con base de datos netflix Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012."

Presentaciones similares


Anuncios Google