Búsqueda de Frases Clave en una Red Social de Microblogging usando Técnicas de Emparejamiento Semántico UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE.

Búsqueda de Frases Clave en una Red Social de Microblogging usando Técnicas de Emparejamiento Semántico UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA INDUSTRIAL Y DE SISTEMAS Escuela Académica Profesional de Ingeniería de Sistemas Taller de Tesis en Ingeniería de Sistemas 2 Profesor: Mg. Samuel Oporto Díaz Alumno: Erwin Salas Coz Código: E Correo electrónico : Lima-Perú 2009 UNIVERSIDAD NACIONAL DE INGENIERIA

Introducción La popularización de las redes sociales en internet ha hecho que las empresas que tienen como plaza (medio de publicidad en el argot del márketing) el internet estén interesados en su potencialidad para realizar campañas de publicidad más acorde al perfil del consumidor de tal forma que sea más relevante y pueda más efectivamente satisfacer las necesidades del cliente. Estas redes sociales se las puede clasificar como los blogs, microblogging y los servicios de red social. Como ejemplos tenemos a Blogger, Twitter y Facebook respectivamente. Tomaremos con atención a los de la clase microblogging los cuales funcionan de la siguiente manera: Disponemos de una página web o cliente1 el cual brinda el servicio de microblogging. Si el usuario no tiene una cuenta se la crea, sino accede a su cuenta. El usuario escribe en un texto de no más de 140 caracteres (motivo de su éxito) en cual escribe acerca de su que hacer, opiniones, ideas, pensamientos, temas relacionados a actividades sociales que desea compartir con otros.

Entre las actividades realizadas al hacer una campaña de publicidad en internet tenemos:
Definir los objetivos de la campaña en internet. Identificar la fase en la que se encuentra el cliente potencial en la internet. Identificar keywords y keyphrase relevantes al negocio. Anunciar en motores de búsqueda (search engine). Anunciar en en redes sociales con banners, textos e imágenes. Monitorear el desempeño de cada medio de publicidad. Realizar los cambios necesarios para cumplir con los objetivos planteados.

Muchos problemas de bioinformática se puede representar como hallar las ocurrencias de un string en otro. Repetición Repetición Repetición S1 S2 EL PROBLEMA SE ACRECIENTA AÚN MÁS CUANDO SE BUSCA REPTICIÓN APROXIMADA!

CAMINO PISTA LISTA CAMINOS PISTAS CARRETERA CAMINO
ENTRE PALABRAS SIMILARES EXITE UN ALTO NIVEL DE MISMO SIGNIFICADO SEMANTICO CARRETERA CAMINO

Evaluar Navegador Buscador TWITTER Procesos Indexar “iPhone en Perú”
Rankear Evaluar Elegir Mostar “iPhone en Perú” ¿De qué manera decir, este es mejor que el otro? Search

Planteamiento del problema
El buscador semántico ¿cómo definir el nivel de similitud ontológico mediante técnicas de emparejamiento semántico?.

OBJETIVOS Objetivo de la Investigacion Objetivo superior
Definir un criterio de similitud ontológica mediante tecnicas terminologicas aplicable a un buscador web. Objetivo principal Identificar cuál algoritmo es el que logra la mejor distancia de Hamming y Levenshtein además de la mejor eficiencia O() en el tiempo y espacio de ejecución para las secuencias mitocondriales asi como desarroollar una medidad de similitud entre ontolog´ıas basada en la distancia entre cadenas orientadas a un buscador web.

Objetivos espec´ıficos
Los objetivos espec´ıficos son los siguientes: 1. Investigar sobre algoritmos m´as comunmente usados en la web sem´antica. 2. Desarrollar y explicar los algoritmos de Needleman-Wunsch y Weiner. 3. Mostrar ejemplos de los algoritmos. 4. Recopilar las actualizaciones de acuerdo a un tema en Twiiter. 5. Desarrollar una medida de similitud de las preguntas al buscador y resultados basado en el algoritmo de Needleman-Wunsch.

6. Investigar la bibliografia correpondiente para la implementación de los algoritmos.
7. Desarrollar los algoritmos a comparar en C++ para su evaluación y análisis. 8. Ejecutar los algoritmos usando las base de datos recopilada. 9. Recopilar la información estad´ıstica de cada producto obtenido de los algoritmos. 10. Medir las distancias de Hamming y Levenshtein de los alineamientos obtenidos. 11. Comparar los resultados obtenidos entre los dos algoritmos. 12. Identificar cual es el que tiene el mejor desempeño según los plantemientos fijados. 13. Medir el nivel de acertación de las búsquedas realizadas en base al buscador semántico, es decir la revisión de los resultados.

Justificación Cada vez es más imperante tener métodos para obtener información de mayor relevancia (o entrando a otros campos producir conocimiento) u ordenada de las cada vez más grandes cantidades de información vertida en la internet por los usuarios. El conocimiento por parte de las empresas consultoras de márketing de las opiones de las personas en las redes sociales es de vital importancia para el ´éxito de las campañas que realizan, siendo la inversión en márketing online cada vez más importante en el mundo de la publicidad.

Base de Datos Fuente de Datos
La fuente de datos será recopilado mediante las APIs de Twitter usando los comandos proporcionados por la misma. Estos datos están disponibles de los últimos 7 d´ıas que por lo tanto para tener una mayor cantidad de datos ha de realizarse un almacenamiento semanal. Para su obtención se hará un parser al codigo obtenido por la API de Twitter. La dirección URL en donde se ecuentran los formatos, sintaxis y detalles de la API de Twitter es http : ==apiwiki:twitter:com. Estructura de los datos Los datos al ser texto serán almacenados en una base de datos en campos de tipo text.

Descripción de los datos
Los datos son b´asicamente texto ASCII y son de a lo m´as 140 caracteres lo cual facilita en cierta medida el trabajo del buscador. Son obtenidos mediante el comando search en formato JSON, RSS y Atom.

METODO DE SOLUCION

Preprocesamiento Obtención de los tweets de la API: Para proceder con esto usaremos el siguiente comando proporcionado por la API de Twitter http : ==search:twitter:com=search:format Definimos el comando y caracter´ısticas más resaltantes de la API search de Twitter. URL: http : ==search:twitter:com=search:format Formats: json, atom HTTP Method: GET Requiere autenticación : false L´ımite de llamadas a la API a la vez : 1 call per request Los resultados son obtenidos en este formato en JSON:

Explicación, dise ño e implementación de los algoritmos de Needleman-Wunsch y Weiner

Weiner

Evaluación afinada de similitud
Fórmula Matemática de afinamiento Sim (s1; s2) = Comm(s1; s2) - Diff (s1; s2) +Winkler (s1; s2) Sim (s1; s2) = Comm(s1; s2) - Diff (s1; s2)

Conclusiones 8.1. Conclusiones
1. El método de solución ha sido desarrollado parcialemente, debido que para completar la última fase del modelo solución es necesario realizar experimentos y obtener un parámetro Q adecuado en base a estad´ısticas. 2. El uso de las fórmulas desarrolladas en Giorgos [3] fueron útiles para modificarlos de acuerdo a las caracter´ısticas propias del trabajo, como eliminar la función de mejoramiento que tiene otros fines para palabras muy largas, en este caso no pasan de los 140 caracteres. 3. El desarrollo del método solución esta planteado adecuadamente para poder ser codificada y evaluada.

8.2. Contribuciones Aplicación de algoritmos bioinformáticos al marketing on line para encontrar palabras clave en la red social exitosa Twitter con millones de usuarios activos y miles de aportos por segundo, además por usar métodos matemáticos rigurosos para evaluar. 8.3. Trabajos Futuros Puede complementarse con retroalimentación para determinar si se obtiene una palabra clave, es decir por los resultados obtenidos en cada ejecución del modelo solución se puede afinarse aún más. Otro trabajo que puede realizarse es desarrollarlo on line, para el uso de los usarios interesados en saber las frases claves que resaltan en Twitter, actualemente se dispone de los denominados ’trendingtopic’ pero son sólo palabras mas no frases.

GRACIAS

Búsqueda de Frases Clave en una Red Social de Microblogging usando Técnicas de Emparejamiento Semántico UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE.

Presentaciones similares

Presentación del tema: "Búsqueda de Frases Clave en una Red Social de Microblogging usando Técnicas de Emparejamiento Semántico UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE."— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

Búsqueda de Frases Clave en una Red Social de Microblogging usando Técnicas de Emparejamiento Semántico UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE.

Presentaciones similares

Presentación del tema: "Búsqueda de Frases Clave en una Red Social de Microblogging usando Técnicas de Emparejamiento Semántico UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE."— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback