SISTEMA PARA LA CATEGORIZACIÓN AUTOMÁTICA DE CORREO ELECTRÓNICO Camilo Rodríguez, Departamento de Ingeniería de Sistemas, Universidad Nacional de Colombia.

Slides:



Advertisements
Presentaciones similares
Inteligencia artificial y sus aplicaciones
Advertisements

CI-2413 Examen. Pregunta 1 Respuesta 1 - a n La meta principal de todo sitio es maximizar el número de visitas al sitio. Esto debe ser considerado en.
Organizadores Gráficos
Contenido Sistemas de Información Desarrollo de software
También conocido como Diseño Lógico Rodrigo Salvatierra Alberú.
COMPETENCIAS Y METODOLOGÍA
Proyecto de Innovación Educativa 2013
ARQUITECTURA DE LA INFORMACIÓN Trabajo Final Yohanna Ayala Marleny Tubiñez Cira Orta Germán Orta Juan Vicente Mijares Yennis Marbey Puente.
SERVICIOS DE INTERNET Introducción comenzar.
Gestionar y organizar los elementos del correo electrónico
República Bolivariana de Venezuela Ministerio del Poder Popular para la Defensa Universidad Nacional Experimental Politécnica de la Fuerza Armada Nacional.
Data Mining Integrantes: Rojas Correa, Trinidad Romanskyy, Bohdan
Taller de Herramientas de Google Docs
INTERNET CNCI OBJETIVO: Aprender conceptos basicos de INTERNET asi como navegar a través de internet.
Sistema de Costos por Órdenes
Elaboración de materiales de apoyo
Lic. Marco González Hernández
Fases para el desarrollo de un proyecto Web
DESARROLLO DE APLICACIONES
Base de Datos ProQuest.
INTELIGENCIA DE NEGOCIOS
Programación Matemática para distribución eficiente de censistas en censos nacionales: el Censo 2010 de la Provincia de Buenos Aires como caso de estudio.
TRINO ANDRADE G UNIVERSIDAD ECOTEC. PRESENTACIÓN DE OUTLOOK EXPRESS Microsoft Outlook Express es una herramienta necesaria que le permite administrar.
CONCEPTOS DE NUEVOS SISTEMAS 1. Un sistema de manejo de información 1. Un sistema de manejo de información Desde la perspectiva del usuario final todas.
Marcos para la clasificación pedagógica de objetos para el aprendizaje: un caso de estudio Miguel A. Sicilia, Elena García y Salvador Sánchez Universidad.
¡BATALLA DE CANALES! PRESENTA: El estudio fue realizado a través del módulo BUZZMONITOR YOUTUBE ANALYTICS.
Sesión 6 Plataforma Virtual Moodle Plataforma Virtual e-ducativa
GLOSARIO TIC La siguiente presentación recoge algunos términos que se deben conocer en el manejo de la educación virtual…
World Wide Web M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
GOOGLE     Es el buscador más utilizado es la fuente prioritaria de sus ingresos y utilización, tienen desarrolladas.
Para la comunidad académica: Impresión de listas para asentar calificaciones. Consulta de calificaciones. Captura de calificaciones. Consulta de cursos.
Un Repaso  Entrenamiento adecuado no ocurre sin mucho trabajo  Requiere que todo sea muy bien planeado  Hay.
2 Conjunto de Páginas o Web sites sirven como punto de entrada único Información de una institución -Actúa como punto de entrada -Concentra servicios.
Sesión 6 Plataformas Virtuales Educativas Plataforma Virtual Moodle
TUTORIAL REALIZADO POR ANGELA INOSTROZA CORTÉS UNIVERSIDAD DE SANTIAGO DE CHILE DEPARTAMENTO DE EDUCACIÓN NUEVAS TECNOLOGÍAS Y AMBIENTES DE APRENDIZAJE.
Presenta: Lic. Gloria Concepción Tenorio Sepúlveda. Asesor Tutor: Mtro. Fernando Gustavo Lozano Martínez. Asesor Titular: Dra. María Soledad Ramírez Montoya.
Grafo de similitud de documentos del Repositorio Universitario del IIEc Carlos Francisco Méndez Cruz Grupo de Ingeniería Lingüística (IINGEN)
MARKETING DIGITAL Conceptos y Herramientas para lograr que una Organización gane presencia en Internet.
MEMORIA Y APRENDIZAJE.
INTERNET.
“Introducción a las Ciencias de la Informática”
ENTORNO VIRTUAL DE APRENDIZAJE “EVA”
CONTENIDO UNIDAD I CORREOS ELECTRONICOS Concepto Ventajas Desventajas Tipos de Correos Electronicos Hotmail Crear cuenta Agregar Contactos Redactar Mensajes.
Universidad Tecnológica del Centro Profesor: José F. Sánchez. Carreras: Ingeniería en Redes y Comunicaciones. Período: Abril – Julio.
INTERNET UNA HERRAMIENTA PARA LA INVESTIGACIÓN
Elaborado por Gpe. Esmeralda Gutiérrez Rosas. Con la introducción de los sistemas informáticos en la educación y mayor accesibilidad a la información,
Tu , un sitio web R e d d e P r o f e s o r e s I n n o v a d o r e s Módulo: “Tu , un sitio web”
 Un motor de búsqueda, también conocido como buscador es un sistema informático que busca archivos almacenados en servidores web gracias a su «spider»
 El trabajo del alumno se inicia visitando la WebQuest y accediendo a los recursos que se le presentan.  Una vez que han accedido a estos recursos esta.
OUTLOOK MELISSA MORALES FRANCO. CALENDARIO  Tiene casillas para cada día del mes.  Nos permite anotar citas, alarmas, sean actuales o futuros para tener.
Integrantes: Ma. Daniela Maldonado José Luis Llerena.
Correo electrónico. Definición Es un medio de comunicación de la internet que permite enviar mensajes a otras personas a través de las redes de cómputo.
Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.
TRUCOS DE BUSQUEDA DE RESULTADOS DE CÁLCULOS MATEMÁTICOS Wolfram Alpha Es un buscador de respuestas desarrollado por la compañía Wolfram Research. Es.
Como usar Google Finance Jorge Cerdas. Ingrese a la página web de google finance
Búsqueda de Información en Internet
Básicamente incide bastante ya que debemos tener claro que es lo que deseamos comunicar y así desenvolver una buena organización para llevar buenas ideas.
Todos alguna vez hemos buscado nuestro nombre en Google o otros buscadores. Como resultado obtenemos información sobre nosotros que en algún momento hemos.
Habilidades Digitales para Todos Luis Arturo Rodríguez Marcelo Tapia Bulmaro Verdugo.
Elaboración de artículos científicos
Motor de búsqueda Un motor de búsqueda es una aplicación de software diseñado para encontrar los recursos digitales como páginas web, textos, noticias.
A la cabeza de internet. HISTORIA La historia de Google empezó en 1995, cuando Sergey Brin y Larry Page, dos estudiantes de la Universidad de Stanford,
Alexis J. Romero José A. De Vincenzo DESARROLLO DE UN SOFTWARE EDUCATIVO DE APOYO A LA LÓGICA CUANTIFICACIONAL, CONJUNTO, RELACIONES Y FUNCIONES DE LA.
la publicidad en las paginas web han sido de gran impacto en nuestros tiempos modernos ya que ella han logrado atraer a publico en general, ha demás.
ESTADÍSTICA DESCRIPTIVA
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Entorno de Recomendación para el Desarrollo de Objetos de Aprendizaje Manuel E. Prieto Universidad de Castilla-La Mancha, España Victor H. Menéndez Universidad.
Gestión de la información y el conocimiento II Bibliometría Ángela Valderrama Muñoz Ingeniera de Sistemas (UdeA) Especialista en Alta Gerencia(UdeA) Magister.
Vicerrectoría de Docencia Educación y Tecnologías de la Información y la Comunicación CURSO INTEGRACIÓN DE TECNOLOGÍAS DE LA INFORMACIÓN Y LA COMUNICACIÓN.
“portafolio digital”.
Transcripción de la presentación:

SISTEMA PARA LA CATEGORIZACIÓN AUTOMÁTICA DE CORREO ELECTRÓNICO Camilo Rodríguez, Departamento de Ingeniería de Sistemas, Universidad Nacional de Colombia Abstract Introducción El presente trabajo propone un sistema categorizador de correo electrónico bajo aprendizaje no supervizado y que permite una visualización de los mensajes a manera de red semántica o grafo. En los últimos años el volumen de correo electrónico que reciben los usuarios a diario ha crecido vertiginosamente. Prueba de ello es que compañías prestadoras de servicio gratuito de correo tales como yahoo, google y hotmail han aumentado la capacidad de almacenamiento por usuario. Esta gran cantidad de información hace cada vez más difícil la tarea de administración del correo por parte del usuario. En los últimos años se han desarrollado diversas técnicas para la categorización de correo de manera automática con buenos resultados. Sin embargo la mayoría de estas técnicas se basan en aprendizaje supervisado y los trabajos que han utilizado aprendizaje no supervisado se han enfocado en una estructura jerárquica de fólderes. Por esta razón nuevos enfoques utilizados para la organización de información utilizados con éxito en problemas de categorización automática de textos (organización de documentos, búsqueda de información en Internet) tales como redes semánticas y mapas conceptuales pueden ser utilizados para crear sistemas de categorización automática de correo de tal manera que le permitan al usuario visualizar, analizar y extraer información de manera más fácil que los sistemas tradicionales. El presente trabajo plantea un sistema categorizador de correos electrónicos que organiza de manera automática los mensajes a partir del contenido de estos y que permite una visualización de la información de los mensajes de correos a manera de red semántica o grafo. El sistema de visualización propuesto es similar al utilizado por el buscador kartoo. Métodos El sistema categorizador se resume en cuatro fases: Extracción y selección de características, agrupamiento, relación entre mensajes y visualización. Para la extracción y selección de características se tuvo en cuenta diferente tipo de información contenido en los mensajes de correo, como por ejemplo, fecha, remitente, asunto y cuerpo del mensaje. Para la extracción de características del asunto y del cuerpo del mensaje se utlizó tf-idf. Para la parte de categorización y visualización se compararon tanto técnicas que permiten y agrupamiento y visualización, por ejemplo los mapas autoorganizados, como técnicas tradicionales como agrupamiento jerárquico y agrupamiento particional. Resultados Las pruebas experimentales realizadas para agrupamiento jerárquico incluyó el algoritmo de distancia promedio. Se realizó experimentación incluyendo el asunto solamente, fecha y asunto, fecha, asunto y cuerpo del mensaje. Para esta prueba se utilizó distancia coseno. A diferencia de la distancia euclidiana, la distancia coseno permitió un mejor agrupamiento cuando se incluyó información del cuerpo del mensaje. Sin embargo no se obtuvieron buenos resultados cuando se incluyo información de la fecha. Resultados Las pruebas experimentales realizadas para agrupamiento jerárquico incluyo el algoritmo de distancia promedio. Se realizó experimentación incluyendo asunto solamente, fecha y asunto, y fecha, asunto y cuerpo del mensaje. Para esta prueba se utilizó distancia euclidiana. Esta distancia presentó buenos resultados para las pruebas que incluyeron información de la fecha y el asunto del mensaje, mas no presentó buen desempeño incluyendo información del cuerpo del mensaje. Resultados Las pruebas experimentales realizadas para agrupamiento mediante mapas autoorganizados, se utilizó tanto el asunto como el cuerpo del mensaje. También se etiquetó cada grupo encontrado con las palabras mas frecuentes encontradas en cada categoría. Al igual que el agrupamiento jerárquico con distancia euclidiana, la inclusión de información del cuerpo del mensaje empeoró el desempeño del sistema. Posiblemente, debido a que los mapas autoorganizados utilizan este tipo de distancia, en lugar de distancia coseno. Conclusiones Los resultados de este trabajo indican que debido a la gran diversidad de información contenida en los mensajes de correo es difícil establecer una medida de similaridad adecuada para realizar el agrupamiento. La distancia coseno funciona bien cuando se incluye información del asunto y del cuerpo del mensaje, mas no con información de la fecha. La distancia euclidiana funciona bien con los campos fecha y asunto, pero no cuando se incluye información del cuerpo del mensaje. Por otro lado aunque los mapas autoorganizados permiten una buena visualización del agrupamiento, se deben incluir modificaciones en el algoritmo o en la representación de los datos para lograr un buen desempeño del sistema categorizador. El trabajo futuro es mejorar el desempeño del agrupamiento, ya sea evaluando otras téncnicas bajo aprendizaje no supervizado o incluyendo otras características de los mensajes. También utilizando otras medidas de similaridad. A partir de esto se entraría a abordar la creación de relaciones entre mensajes y el sistema de visualización. Arquitectura del Sistema propuesto