Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012

Slides:



Advertisements
Presentaciones similares
MAPA DE CONTAMINACIÓN POR RADÓN NOS DOMICILIOS GALEGOS
Advertisements

BLOGS.
II TRAYECTO FORMATIVO 3º ENCUENTRO WEBQUESTAgrupamiento8.
Idea y uso de los Blogs en Internet
División de Estadística
Labor del IAEG en la inclusión de indicadores complementarios en el Manual sobre indicadores ODM División de Estadística de las Naciones Unidas San José,
CONTROL DE REQUERIMIENTOS
Rediseño del Procedimiento de recuperación de contraseña Contraseña Única Septiembre 2012.
Solución de problemas con programación
Campaña de promoción de IPv6 en Chile Margarita Valdés Cortes NIC Chile CNNN Julio, 2008.
Sp 1 Unit 2 Class schedule (objects, subjects, and colors)
Realizar el ejercicio del archivo: ejercicio E-R.
MODELADO DE ANALISIS Y DISEÑO
BIBLIOTECA VIRTUAL DE LA UNSA
REPOSITORIOS EN BOLIVIA
La Economía de la Carretera Panamericana
CÓMO REALIZAR UN PROYECTO
ALFABETIZACIÓN DIGITAL ¿Qué es? ¿Por qué es necesaria? Brecha digital
Versión 2004 Enrique Bañuelos Gómez
Construcción de un RAD (Role Activity Diagram)
Curso on-line «Publicitando FIADASEC» Abril, Mayo y Junio de 2013.
SOFTWARE LIBRE.
SISTEMAS DE INFORMACION
Guía metodológica para la gestión de proyectos de software en PyMEs que no son fábricas de software por medio de metodologías ágiles Autora: Tatiana Alejandra.
“ “ Definición Pioneros en Referencia Virtual.
Software Libre “Libre no significa gratis...” Jaime Ramírez Charla ICC 22 de octubre 2008.
Discrepancias entre el dolor de rodilla y los signos de artrosis en esa localización Bedson J, Croft PR. The Discordance Between Clinical and Radiographic.
Representación del Conocimiento Sesion 2. Contenido Representación del Conocimiento. Parte de una representación. Manipulación del Conocimiento. Referencias.
 Sistemas Expertos  ¿Qué es un sistema experto?  Los Sistemas Expertos, rama de la Inteligencia Artificial, son sistemas informáticos que simulan el.
¿Están relacionados el consumo de refrescos y el síndrome metabólico? Dhingra R, Sullivan L, Jacques PF, Wang TJ, Fox CS, Meigs JB et al. Soft Drink Consumption.
DISEÑO DEL CRECIMIENTO MATERIAL
Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,
Gestión de Licencias Federació de Triatló de la CV.
UNIVERSIDAD TECNOLOGICA DE LA REGION NORTE DE GUERRERO
"Mejor educación, mejor sociedad” Capacitación asistida con Chamilo LMS Ing. Michela Mosquera Gerente General.
METABOLOMICS PCA – Principal Component Analysis. Modelos y Datos  Todos los estudios arrojan datos  En cada estudio se miden variables.
Herramientas adicionales en STATA para el análisis de datos espaciales
MARLENE ROJAS ROJAS.   Es un servicio en Internet que te permite subir a la web y compartir con todo el mundo tus presentaciones de Power Point o programas.
Proyecto CYTED Informe de Tareas Grupo de Investigación Estadística Desarrollo sostenible de Ciencia y Tecnología.
PRESENTADO POR: JENNIFFER E. CAÑI YAJA. SUBTEMA : SEGURIDAD DE LA RED.
Psicometría Teoría de los tests.
Técnicas multivariantes:
Eduardo Brioso Moniz Álvaro Castilla Nieto Mario Colchero Pérez
Aplicando las Pautas ¡¡Comprendiéndolas!!. El espíritu “El poder de la Web está en su universalidad. Que todo el mundo pueda acceder, a pesar de la discapacidad,
ETAPAS DE LA PLANEACIÓN
Soporte de Usuarios del CrossGrid: HelpHesk Curso Grids y e-Ciencia, Junio 2004 Santander, España Farida Fassi IFIC.
Diplomado: “Introducción a los Ambientes Virtuales de Aprendizaje” .
Es uno de los programas estadísticos más conocidos teniendo en cuenta su capacidad para trabajar con grandes bases de datos y un sencillo interface para.
ANÁLISIS DE LAS ENCUESTAS DE SATISFACCIÓN DE USUARIOS PARA LAS BIBLIOTECAS DE ÁREA DE LA BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA. Ma. Guadalupe Romero.
Sistemas de Información Agosto – Diciembre 2007 Sesión # 7
Algunos estudios en Matemática Educativa. La investigación en Matemática Educativa (Didáctica de la matemática) aborda cuestiones tales como:  ¿Cuál.
Sistema Organizador de Invitaciones, Eventos y Memos basado en una aplicación Cliente – Servidor SOIEM TESIS DE GRADO FIEC – ESPOL 2007 Christian Vulgarin.
Identifying the Classical Music Composition of an Unknown Performance with Wavelet Dispersion Vector and Neural Nets V. CONTENT DESCRIPTION WITH WAVELETS.
DOKEOS ANGELA PATRICIA MORENO CAÑON COD INTRODUCCION A LA INGENIERIA.
Software de Comunicaciones Título Miembro del grupo 1 Miembro del grupo 2 Miembro del grupo 3 Miembro del grupo 4 Departamento de Ingeniería.
Introducción a ataques de tipo inyección: Inyección SQL
Consejo Superior Geográfico IDEE 1 Prueba de las Especificaciones INSPIRE Antonio F. Rodríguez Reunión GTIDEE Tenerife.
Introducción En nuestro país que siempre ha estado inmerso en las grandes colas que toca hacer para cualquier tramite es muy interesante ver como se pueden.
Kernel Para PDA Con Soporte a Procesos De Tiempo Real Francisco Javier Zuluaga Ramírez Asesor: Dr. Pedro Mejía Álvarez.
FASE DE DESCRIPCIÓN DEL PROBLEMA En esta fase se debe: [Explicitar, acordar y documentar objetivos y contenidos del producto (qué y por qué). [Caracterizar.
INTRODUCCIÓN A LOS SERVICIOS BIBLIOTECARIOS Facultad de Farmacia UCM Curso
SISTEMAS DE BASES DE DATOS MASIVOS (U. N.) / GESTIÓN Y EL PROCESAMIENTO DE GRANDES VOLÚMENES DE DATOS (U. de A.) Francisco Moreno & Freddy Duitama 2015-II.
INTRODUCCIÓN A LOS SERVICIOS BIBLIOTECARIOS Facultad de Farmacia UCM Curso
I N F O R M A T I C A. Hardware En computación, término inglés que hace referencia a cualquier componente físico tecnológico, que trabaja o interactúa.
Profesor: Jesús Chaparro Bachilleres: Perez, emibeliz Prada, Rainer Villahermosa, José Abril 2014.
Fecha de descarga: 6/23/2016 Copyright © McGraw-Hill Education. Todos los derechos reservados. Desarrollo de estudios independientes de cultivos de un.
¡Conoce R! Fecha: Jueves 27 de febrero Lugar: Facultad de Ciencias - UNED. C/ Senda del Rey, 9. Hora: 6:30pm - 8:30pm Acceso: Libre Cómo llegar: Autobuses.
Aplicaciones con R-shiny 30-enero-2013 Pedro Concejero Web concejero.com Mail
Título: Diseño de un Blog para elevar la calidad del proceso de enseñanza- aprendizaje del Inglés como Lengua Extranjera. Autora: MSc Yordanka Brunet Valle.
Transcripción de la presentación:

Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012 PCA para clasificación de películas con matrices sparse. Ejemplo con base de datos netflix Pedro Concejero Grupo de usuarios R Madrid 31 octubre 2012

Referencias Journal of Statistical Software: número especial sobre Psicometría y R http://www.jstatsoft.org/v20/i01 Ejemplo de PCA con FactoMineR: http://factominer.free.fr/classical-methods/principal-components-analysis.html

Referencias El concurso Netflix: http://www.netflixprize.com//community/viewtopic.php?id=1537 La necesidad de utilizar matrices “sparse” (poco densas) para poder trabajar con netflix y SVD / PCA http://www.r-bloggers.com/the-netflix-prize-big-data-svd-and-r-2/

Referencias Muy buenos ejemplos y explicación (técnica) de SVD: http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Dimensionality_Reduction/Singular_Value_Decomposition Descripción detallada de algoritmos de recomendación (incluyendo SVD / PCA)

Referencias Ejemplo específico de factorización para clasificación de películas: http://research.yahoo4.akadns.net/files/ieeecomputer.pdf

Ejemplo “Movielens” Películas más populares Distribución de autovalores y varianza acumulada (eje Y) en el espacio de componentes

Ejemplo “Movielens” Películas más populares (174)

Ejemplo “Movielens” Películas con mayor varianza (164) Distribución de autovalores y varianza acumulada (eje Y) en el espacio de componentes

Ejemplo “Movielens” Películas con mayor varianza (164) Primeros 2 factores/componentes

Ejemplo “Movielens” Películas con mayor varianza (164)

Conclusiones Trabajo todavía sin finalizar (con el dataset netflix), pero prometedor El uso de librerías para matrices “sparse” es esencial (maravillosa librería Matrix) Múltiples posibilidades de librerías PCA, con muchas alternativas para probar: Número de componentes Tipo de extracción Rotación

¡Muchas gracias por vuestra atención ¡Muchas gracias por vuestra atención! Y sobre todo, gracias a los organizadores de estas reuniones Datos de contacto: E-mail: Pedro.concejero@tid.es Twitter: @ConcejeroPedro