Taller de Base de Datos Búsqueda de Agrupaciones (Clustering) Técnica de modelamiento descriptivo(objetivo es construir un modelo para comprender los datos)

Slides:



Advertisements
Presentaciones similares
+ Contact Center & BPO Capacitación Consultoría Investigación en Psicología del Consumidor.
Advertisements

Support.ebsco.com EBSCOAdmin: Creando Grupos de Usuarios Tutorial.
La empresa Publicitaria
Fabian Andrés Muñoz Robayo
Maestría en Explotación de Datos y Descubrimiento del Conocimiento
...construir un sitio web......orientado al usuario Instrucciones para...
Presentado por: Pierrick LABBÉ Consultor SEO COMO TENER ÉXITO CON SU SITIO WEB.
Arquitectura de la información en sitios web y Usabilidad
MERCADEO ELECTRÓNICO – Posicionamiento SEM y SEO SEM: Search Engine Marketing SEO: Search Engine Optimization.
¿? ¿Te gustaría que los amigos de tus clientes sean también tus clientes?
Dra. Rocío C. Romero Zaliz
En informática, la World Wide Web o simplemente la Web, cuya traducción podría ser Red Global Mundial, es un sistema de documentos de hipertexto y/o hipermedios.
Online Marketing = Marketing Digital -El MO o MD nos permite llegar a mas gente, mas rápido y de manera mas económica. -Medio de comunicación interactivo.
SEGMENTACIÓN Y POSICIONAMIENTO
DIRECCIÓN DE GESTIÓN DIVISIÓN DE RECURSOS FISICOS SEDE BOGOTÁ OCTUBRE DE 2010 SITIO WEB DIVISIÓN DE RECURSOS FÍSICOS APLICATIVO SOLICITUDES DE SERVICIO.
Marketing del Turismo: Segmentación y Posicionamiento
Concursos, Comercialización e investigación en Twitter • Twitter Concursos Ejecute concursos legales para Twitter en múltiples mercados. • Marketing de.
Fases para el desarrollo de un proyecto Web
Segmentación de mercados
DEFINICION DE MERCADO.
Google Earth Alejandro Queipo. ¿Qué es Google Earth? Google Earth es un programa informático similar a un sistema de información geográfica realizado.
Búsqueda de Aproximaciones: Algoritmos
Taller de Base de Datos Profesor: Claudio Gutiérrez Soto página: Fono: Minería.
PERSONAS conoce a tu cliente ideal. Qué son las “Personas” Llamamos “Personas” a los perfiles de Cliente Ideal, que son representaciones mucho más completas.
Medir el valor total de sus Campañas de la Red de Display Seguimiento de conversión post- impresión en la Red de Display de Google.
Analítica Web.
Tarea que tiene por objeto asignar presupuestos a fines concretos, de tiempo y espacio en Medios, de la manera más rentable posible.
Su opción de orientación. Red de Display de Google Red de Display de Google Opciones de orientación.
Para ubicar el material de apoyo para SU CURSO Paso a paso.
 Equipo 2  Integrantes: ◦ Corona Romero Pedro ◦ González Zavala Abel ◦ Nuñez Rodriguez Sergio Efrain.
Business Intelligence y Data Mining
CAPTURA, ESTERILIZACIÓN y SUELTA PROYECTO MUNICIPAL TRABAJADO POR ALUMNOS DE 4º DIV, ÁMBITO PRÁCTICO Departamento de Dibujo IES Élaios.
Una página web Canal en Youtube Búsquedas en internet Lado usuario ¿Qué es un buscador de Internet? Herramienta para desvelar una inquietud,
Google Analytics Conociendo mejor a tus visitantes Raúl Fuentes Jorge R. Pérez Oficina de Comunicación Social.
Cuatro P de Mercadotecnia Elementos esenciales de la mercadotecnia Plaza Precio Promoción Producto El objetivo es conocer los elementos esenciales de la.
Variables de Segmentación para los mercados de consumo
Ideas de Sra. Schumacher COMO NOS VENDEN TODO. MARKET SEGMENTATION  Negocios quieren conectar con nosotros para que compremos mas  Que buscan en nosotros….
VIDA EN OTRO PLANETA ….
MARKETING DIGITAL Conceptos y Herramientas para lograr que una Organización gane presencia en Internet.
Yusley Contreras COD: Lizeth Fuente Rico COD:
SEGMENTACION ¿Qué es la segmentación de mercado?
Marketing Online Presentación de Servicios. Publicidad en Google Hacer publicidad en el Buscador de Google y su gran Red Publicitaria, se ha convertido.
¿Qué es yahoo marketing? En yahoo marketing contamos con planes de publicidad! y en los principales buscadores de México asociados a Yahoo!. Conozca nuestros.
Ayudantía #1 “Segmentación” Felipe Venegas Moya felipevenegasmoya.ublog.cl.
PUBLICIDAD EN INTERNET FÓRMULAS PUBLICITARIAS ON-LINE Portales corporativos. Publicidad en sedes web. Enlaces patrocinados.
SEGMENTACION DE MERCADOS
La Teoría del Estado Estacionario.
Christian Monrreal Gonzalez Daryl Silverman Aguilar Gone
Marca: Movistar Equipo: Tortugas Ninja. Juan Carlos Peraza.
TALLER Nº 5 Construyendo un Curso Virtual Adrián Villegas Dianta.
¿Por qué geolocalizar los negocios? Utilizando foursquare en la estrategia.
Recomendaciones.  Estrategia de aprendizaje.  Auxilia a la organización de elementos en la memoria.  Relaciona elementos.  Es una representación personal.
Marketing. Programas de Afiliación Son arreglos en los cuales un web site de comercio le paga a un web site de afiliación una comisión por generar tráfico.
¿COMO PLANIFICAR UNA CAMPAÑA DE EMARKETING RENTABLE? SEO, SEM, AFILIADOS Y MARKETING.
Si un extraterrestre te quiere mandar una carta ¿Qué dirección le darías? Sr. Juan Camaney Calle 34 Col Cielito Lindo....
Técnicas para el análisis de datos digitales
Taller de Business Intelligence Conceptos Introductorios a BI
¿Como hacer una búsqueda?. Inicio Ingrese a
Sesion 6 Comercio y Marketing Electrónico
La primeras opciones que te muestra Twitter Analytics es seleccionar el tipo de campaña según tus objetivos. Twitter Ads.
GRAN TELESCOPIO CANARIAS. Fue construido del 2002 al 2008 e inaugurado el 24 de julio de 2009 tiene 10´4 m de diámetro.
1 x = 9 12 x = x = x = x = x = x =
INDICE:  1- Presentación de la galaxia.  2-Tiempo de vida.  3-Distancia.  4-Comparación con la Vía Láctea.  5-Próximos descubrimientos.  6-webgrafía.
DEMOS MoviPedido Aplicación Móvil Aplicación Web.
TALLER # 5.  QUE ES UNA PAGINA WEB? Una página web es el nombre de un documento o información electrónica adaptada para la World Wide Web y que puede.
Web Intelligence El objetivo de esta guía, es proporcionar un esbozo del amplio mundo que es aprender a utilizar Web Intelligence. Esta guía no está diseñada.
EL FACEBOOK ¿ BUENO O MALO?. ¿QUE ES EL ? REDES SOCIALES UNIVERSIDAD DE HARVARD ES UNA EMPRESA QUE CONSISTE EN UN SITIO WEB DE REDES SOCIALES. ORIGINALMENTE.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
SEGURIDAD DE SITIOS WEB.
LUGAR DENTRO DE ESTE DOCUMENTO.
Transcripción de la presentación:

Taller de Base de Datos Búsqueda de Agrupaciones (Clustering) Técnica de modelamiento descriptivo(objetivo es construir un modelo para comprender los datos) Problema: Dado un conjunto de objetos encontrar grupos (clusters) tratando que: Objetos en un mismo grupo sean cercanos Objetos en grupos diferentes sean lejanos.

Taller de Base de Datos Aplicaciones Segmentación de clientes en grupos homogéneos basados en gustos (compran lo mismo) o inf. Demográfica (edad, ingreso, ubicación, etc.) Aplicaciones: -Sistemas de Recomendaciones: movielens.umn.edu, etc. -Optimización de campañas de marketing: Wedel and Kamakura 1998, Market Segmentation: Conceptual and Methodological Foundations. -Personalización de sitios Web Mobasher. A Web personalization engine based on user transaction clustering. (WITS’99) -Diseño de servicios de reparticción: Detección de grupos homogéneos que viven en lugares cercanos.

Taller de Base de Datos Aplicaciones Sistema SKYCAT (Fayyad et. Al. 96) fue usado para agrupar 2x10 9 objetos en estrellas, galaxias, quásares, etc. Cada objeto era un punto en un espacio de 7 dimensiones representando radiaciones de distintas frecuencias. Sloan Sky Survey: proyecto de agrupación de todo el universo visible. Agrupación de documentos con tópicos similares Zamir Etzioni. Web Document Clustering: A Feasibility Demostration (1998). Agrupación de documentos con visitas similares en MSNBC (sección Living).

Distancia Para agrupar objetos necesitamos una noción de distancia, ( o más formalmente métrica) D(x,y) para cada par de puntos x e y. Axiomas usuales: D(x,x)=0. D(x,y)=D(y,x) (simetría) D(x,y)<=D(x,z)+D(z,y) (desigualdad triangular) Ejemplo común distancia euclidiana (L 2 norm) entre Taller de Base de Datos

Qué Noción de Distancia Usar? Definir distancia en un determinado contexto es un problema complejo: No siempre tenemos la analogía especial. Atributos categóricos, espacios inconmesurables. También hay que tomar en cuenta el costo de calcularla. Taller de Base de Datos

Qué noción de distancia Usar? (Ejemplo) Consideremos páginas Web como puntos en un espacio de 10 8 dimensiones, una por palabra. Antes de pensar si tiene sentido usar distancia euclidiana en este contexto, veamos cuánto cuesta calcular la distancia entre x e y. Toma aprox: operacuibes donde: n x es la cantidad de palabras que están en x pero no en y. N x,y es la cantidad de palabras que están en ambas. Esto puede ser prohibitivo si tenemos que computar una matriz de distancia de millones de objetos. Taller de Base de Datos

Qué noción de distancia Usar? (Ejemplo) Otro problema: las diferencias en cada coordenada pueden deberse a diferencias en el tamaño de las páginas, y no al tópico. Mejor considerar los pesos relativos de cada palabra en los documentos, así sólo interesa el ángulo entre los dos vectores: Distancia Coseno (Distancia de Ochini): Donde x.y es el producto punto entre x e y. Si los vectores están normalizados se puede calcular más eficientemente que la distancia euclidiana. ¿Por qué? Taller de Base de Datos

Otro Ejemplo Qué tan lejos están dos secuencias de caracteres (ej.., secuencias de ADN): abcde y bcdxye? Podríamos modelar cada secuencia como un vector en un espacio euclidiano y definir alguna noción de distancia. Mejor Usar: Donde LCS es la subsecuencia común más larga Taller de Base de Datos

Distancia de Minkowski Clase de funciones de distancia: Para q=2 es la distancia euclidiana,. Para q=1 es la llamada distancia de Manhattan (city block). Taller de Base de Datos

Espacios Conmesurables vs. Inconmesurables Espacios conmesurables: coordenadas representan medidas homogeneas. Espacio de gustos: cada coord. Representa una nota a un item. Espacio de compras: cada coord. Representa si se compró o no un item. Espacios inconmesurables Espacio de variables demográficas (edad, sexo, dirección etc) Necesitamos estandarizar variables y tal vez determinar cuáles tienen más peso. Taller de Base de Datos

Problema de dimensionalidad Muchas dimensiones generan comportamientos contra intuitivos de distancias. Dado un cubo unitario en k-dimensiones Para k=2, si tenemos un conjunto de puntos en el cuadrado, es esperable que muy pocos puntos tendrán distancia mayor que 1. Para k grande, es muy probable que todos los puntos estén muy separados. Difícil saber si hemos obtenido una buena agrupación También es muy probable que dos vectores en un espacio de muchas dimensiones sean casi ortogonales. Basta que lo sean proyectando en uno de los posibles planos formados por dos coordenadas. Taller de Base de Datos

Reducción de Dimensionalidad En el peor caso, k puntos no pueden ser representados en un espacio de menos de n=k-1 dimensiones. Cómo lo haremos si queremos un n<<k: Multidimensional Scaling: Ubicar k puntos en el espacio de n dimensional aleatóreamente. La energía de cada par de puntos es el cuadrado entre la distancia en el nuevo espacio y l distancia original (analogía sistema de resortes). Visitar cada punto y moverlo minimizando la energía de sus resortes. Con esto encontramos un mínimo local de la energía total. Taller de Base de Datos