Sesionador Web dirigido al estudio de sitios web culturales: Diseño e Implementación del paquete RWeb Sessionizer Ec. Esther Hochsztain Ing. Andrómaca.

Slides:



Advertisements
Presentaciones similares
Aplicación Web Programación Docente
Advertisements

XLVI Asamblea/Conferencia Anual
MERCADOS ELECTRÓNICOS
¿ PREGUNTAS DE NUESTRO TEMARIO ?. 1.- ¿ ES NECESARIO ESTAR CERTIFICADO EN ALGUNA NORMA O MODELO ?
EL MOODLE Herramienta para la construcción de entornos virtuales de aprendizaje Nociones Básicas.
CREACION DE ESPACIOS VIRTUALES PARA TRABAJO EN EQUIPO
Expositores: Rubiños, Oscar Mejia Alexis Cunivertti Capcha, Kattia.
Primer semestre PLAN DE ESTUDIOS 2011
¿QUÉ ES UNA PLATAFORMA EDUCATIVA?
- Jaramillo Sánchez Diego Sebastián
SILVIA BEATRIZ GAVILANES NARANJO KELLY VERÓNICA CARVAJAL CUJI
DESARROLLO E IMPLEMENTACIÓN DE UNA TIENDA VIRTUAL UTILIZANDO OSCOMMERCE, CASO PRÁCTICO TIENDA VIRTUAL PARA MATERIAL ELÉCTRICO Y TELEFÓNICO DE MEDIA Y BAJA.
María Salomé Dávila Silva Julio 2013
Christian Eduardo Gómez Herrera
LA WEBQUEST COMO ESTRATEGIA DE APRENDIZAJE
APRENDIZAJE COLABORATIVO EN BASIC SUPPORT FOR COOPERATIVE WORK
Facultad de Ciencia Política y Relaciones Internacionales Dirección de Concursos Proyecto: Informatización de la Gestión de Concursos Sistema CONDOR.
INTERFAZ DE ACCES DISEÑO DE BASE DE DATOS
BLENDED-LEARNING UTILIZANDO LABORATORIOS VIRTUALES Y REMOTOS
De la investigación científica El punto de partida  La elección o asignación del tema.  La identificación o determinación del problema.
INTELIGENCIA DE NEGOCIOS
UNIVERSIDAD DE LA FF. AA. ESPE CARRERA DE INGENIERIA DE SISTEMAS PROYECTO DE TESIS : “Análisis, diseño, construcción e implementación de una Guía Interactiva.
Segundo semestre PLAN DE ESTUDIOS 2011
ROMERO G ARCIA FANY KARINA Y BARRIOS CRUZ REBECCA SARAHI GRUPO:303 EQUIPO:5.
PRESENTADO POR Carlos Martínez Castellanos Cta Francis Ponce López Cta ASIGNATURA Tecnología Educativa 1 SECCION: 14:01 Tema:
Neo-Shop e – c o m m e r c e s y s t e m Solución Integral De Comercio Electrónico.
DATA WAREHOUSE Equipo 9.
“Diseño de base de Datos Alquicira Jiménez Carolina 303
INTRODUCCIÓN El Impacto Social De Las Nuevas Tecnologías Beneficios Económicos Sociales Cultura Aprendizaje Pedagogía Aprendizaje Significativo Sentido.
Nuestra empresa fija sus objetivos en la GESTION, DESARROLLO y SERVICIO a instituciones. CLOUD COMPUTING Fascilitar la gestión a nuestros clientes y usuarios.
Evaluar el comportamiento del servidor del sitio Evaluación Heurística Tipos de evaluación a un sitio “En la economía tradicional el Cliente primero paga.
Sistema de Control de Ingreso de Vehículos
Unidad VI Documentación
Página 1 20/03/2005 Materia: Tecnología de la Información Curso: Profesora Ariana Rosenthal Tecnología de la Información Profesora Ariana Rosenthal Administración.
BASE DE DATOS EN LA WEB.
Introducción a Pentaho BI Suite 3.5
Google Analytics ¿Qué es? ¿Cómo se configura? Algunas funcionalidades Observaciones.
Entornos de Desarrollo
LOGO e-Learning Desktop Integración de RIA’s a objetos de Aprendizaje Alvaro Rodríguez, Darvin Orozco, Rocael Hernández Universidad Galileo {alvrodriguez,
Empresas en General ( ALFA-SCC ) SISTEMA DE CUENTAS POR COBRAR
MARKETING DIGITAL Conceptos y Herramientas para lograr que una Organización gane presencia en Internet.
TEMA: DESARROLLO DE UN SISTEMA INFORMÁTICO PARA EL CONTROL DE USO Y EL MANTENIMIENTO DE VEHÍCULOS DE UNA INSTITUCIÓN PÚBLICA AUTOR: EDISON GUAMAN   DIRECTOR:
Aspectos Tecnológicos Plataforma e-Muni Luis M. Guzmán S. Jefe de Tecnología MuNet e-Gobierno.
Búsqueda de información
LA IDEA DE NEGOCIO Se basa en un servicio ofrecido a las empresas o persona que tiene un negocio, y quieren vender su producto por internet, nosotros.
1- Lograr que la educación a distancia con apoyo en tecnologías teleinformáticas tenga una planeación más sistemática y juiciosa, de mayor interactividad.
TALLER #5 GERMAN BECDACH MUÑOZ. PREGUNTAS  Qué es una pagina web? Una página web es el nombre de un documento o información electrónica adaptada para.
TECNOLOGÍA DE LA INFORMACIÓN
TRABAJO TERCERA UNIDAD EQUIPO 5  Este Navegador le permite visualizar múltiples páginas web en una sola ventana del navegador.  Incluye opciones para.
BLOGS Y BLOGGER. BLOGS Un blog es un sitio web en el que uno o varios autores publican cronológicamente textos o artículos, apareciendo primero el más.
Ciclo de vida de un sistema
Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.
Internet y Navegadores
Internet y Navegadores Unidad 5. Fecha: 1 de agosto de 2011 Periodo# : 2 Objetivo: identificar el contenido de una dirección web Tema: Elementos de una.
TRANSFERENCIA TECNOLOGICA
Grupo nº 7: Capital Intelectual
SISTEMAS DE GESTIÓN DE CURSOS DE DISTRIBUCIÓN LIBRE
Ingeniería en Informática F UNDAMENTOS DE C OMPUTACIÓN B ACHILLERATO EN I NGENIERÍA I NFORMÁTICA L IC. C ARLOS H. G UTIÉRREZ L EÓN.
la publicidad en las paginas web han sido de gran impacto en nuestros tiempos modernos ya que ella han logrado atraer a publico en general, ha demás.
El Sistema Integral de Gestión y Evaluación (SIGEVA) es una aplicación desarrollada por el Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET)
OBJETIVO Utilizar correctamente las herramientas que provee el Internet; buscar información útil para su ambiente profesional ; comunicarse con personas.
SOLUCIONES EMPRESARIALES
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Aplicativo web Meteorológico del Campus Universitario Uniminuto Corporación Universitaria Minuto de Dios Facultad de Ingeniería – Programa de Ingeniería.
Planificación de Sistemas de Información
Introducción Base de datos Ing. Linda K. Masias M. Base de datos (MySQL)
1.ª Parte: Dónde y cómo buscar información.  Cuando se busca información sobre un tema, es necesario emplear una «estrategia de búsqueda» para optimizar.
GESTIÓN Y ADMINISTRACIÓN WEB. INTRODUCCIÓN A INTERNET Internet constituye una vía de comunicación y una fuente de recursos de información a escala mundial.
DHTIC Juan Esteban Hernández Pérez Estrategias de Búsqueda.
DOCENTE: CLAUDIA ESTHER DOMÍNGUEZ BRIGIDO CBTIS 242 CUETZALAN DEL PROGRESO, PUE.
Transcripción de la presentación:

Sesionador Web dirigido al estudio de sitios web culturales: Diseño e Implementación del paquete RWeb Sessionizer Ec. Esther Hochsztain Ing. Andrómaca Tasistro Cra. Carolina Asuaga Facultad de Ciencias Económicas y Administración Universidad de la República, Uruguay Octavo Congreso Latinoamericano de Sociedades de Estadística. Octubre de 2008

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 2 Plan de la presentación Introducción Antecedentes y elección del caso de estudio Generación de sesiones Identificación de crawlers Paquete RWebSessionizer Aplicación al caso Conclusiones Trabajos futuros

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 3 Plan de la presentación Introducción Introducción Antecedentes y elección del caso de estudio Generación de sesiones Identificación de crawlers Paquete RWebSessionizer Aplicación al caso Conclusiones Trabajos futuros

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 4 Introducción Evaluar qué tan efectivo es su sitio web resulta imprescindible para las organizaciones. Usualmente se analiza solamente los datos referidos al número de páginas consultadas y la cantidad de visitantes en el sitio web, así como en qué partes del sitio web el usuario clickea, cuándo elige incluir un producto en el carro de compras, comprar un ítem, u otras acciones de compra, eventos de registro, vista de productos, acciones de pago, etc. Sin embargo, lo anterior brinda una visión muy básica y se necesitan aplicaciones más avanzadas para estudiar características adicionales.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 5 Introducción: Conceptos Básicos Un sesionador web (Web Sessioner) resulta de fundamental importancia en Web Usage Mining, que consiste en la aplicación de técnicas de Data Mining para la identificación de patrones de uso de un sitio web. Existen muy pocas implementaciones de sesionadores web, debido a que es un área muy reciente y a la complejidad de su propuesta.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 6 Introducción: Conceptos Básicos Una sesión de usuario está formada por un conjunto de objetos consultados por un mismo usuario durante una misma visita a un sitio web. Existen diversos métodos para la identificación de usuarios, en esta propuesta se usa la pareja dirección IP y el agente desde donde se realiza la solicitud. Este procedimiento presenta como ventaja que siempre está disponible y no se necesita tecnología adicional. Una vez identificado el usuario deben distinguirse las diferentes sesiones de usuario. Esto se realiza agrupando las peticiones de sesiones utilizando heurísticas orientadas al tiempo o a la navegación. Es fundamental contar con un buen método de identificación de crawlers, ya que pueden distorsionar todo el estudio que se haga del uso de un sitio web.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 7 Introducción: Metodología Se presenta el paquete RWeb Sessionizer donde se implementa en R la metodología propuesta inicialmente por R. Cooley, y que ha tenido varios refinamientos posteriores.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 8 Plan de la presentación Introducción Antecedentes y Elección del caso de estudio Generación de sesiones Identificación de crawlers Paquete RWebSessionizer Aplicación al caso Conclusiones Trabajos futuros

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 9 Antecedentes: Áreas de Investigación 1) Cultura e Internet 2) Web Log Mining

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 10 1)Cultura e Internet Tecnología y Cultura, Antecedentes: Imprenta de Gutenberg, radio, cine, televisión Tecnología y Cultura, Internet: El sitio web de una organización cultural proporciona una herramienta fundamental para cumplir con dos de sus objetivos básicos: difundir y democratizar la cultura.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 11 1) Elección del caso de estudio: Teatro Solís Principal referente de la cultura montevideana. Propicia una fuerte demanda social.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 12 1) Elección caso de estudio: Teatro Solís El sitio web del Teatro Solís: proporciona información sobre los horarios y tarifas de las distintas actividades, permite que el público visite virtualmente las instalaciones del teatro, posibilita el acceso a su valiosa colección documental; presenta un programa para docentes en el marco de los distintos programas escolares.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 13 2) Web Log Mining Conocer la forma en que los usuarios de una organización utilizan la web es clave para comprender si se está brindando el servicio que se requiere, si los productos o servicios son fácilmente encontrados y, en definitiva, hasta qué punto se cumple con el objetivo que la organización pretende lograr por medio de su presencia en la web. Uno de los métodos habituales para conseguir este conocimiento es el análisis de logfiles, un sendero útil pero no exento de problemas.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 14 2) Web Log Mining La estructura de un logfile es extremadamente simple. Cada vez que alguien descarga un elemento de la web, como por ejemplo una página o una imagen, el servidor escribe una línea en el archivo histórico o logfile. Los enfoques de las investigaciones actuales realizadas en Web Usage Mining son muy variados, pero la mayoría se centran en las sesiones.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 15 Plan de la presentación Introducción Antecedentes y elección del caso de estudio Generación de sesiones Identificación de crawlers Paquete RWebSessionizer Aplicación al caso Conclusiones Trabajos futuros

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 16 Generación de sesiones Las principales formas de identificar sesiones se basan en los siguientes aspectos:  IP + Agente Identificadores de sesiones embebidos Registro Cookie Agente de Software

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 17 Plan de la presentación Introducción Antecedentes y elección del caso de estudio Generación de sesiones Identificación de crawlers Paquete RWebSessionizer Aplicación al caso Conclusiones Trabajos futuros

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 18 Identificación de crawlers Un crawler es un programa que realiza búsquedas en la web, por tanto deben distinguirse los usuarios "humanos" de los usuarios crawlers. Los crawlers trabajan de una forma metódica y automatizada, creando así una base de datos donde va guardando los resultados de sus búsquedas consecutivas, para posteriormente poder analizar dicha información y realizar tareas como la indexación y búsquedas más eficientes en la web (técnicas usadas por ejemplo por motores de búsqueda como Google, Yahoo, etc.). El comportamiento de un crawler es cíclico, realiza búsquedas en profundidad, accediendo internamente a los links que se le dan y así sucesivamente dentro de los links que va encontrando a su paso.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 19 Plan de la presentación Introducción Antecedentes y elección del caso de estudio Generación de sesiones Identificación de crawlers Paquete RWebSessionizer Paquete RWebSessionizer Aplicación al caso Conclusiones Trabajos futuros

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 20 Paquete RWebSessionizer El sessionizer implementado posee las siguientes características: timeout parametrizable, elimina software robots (crawlers), asigna un identificador a cada sesión, genera datos de resumen del proceso de sesionalización.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 21 Paquete RWebSessionizer DATOS PREPROCESAMIENTO IDENTIFICACIÓN DE CRAWLERS DETERMINACIÓN DE SESIONES INGRESO DE TIMEOUT DETERMINACIÓN DE MEDIDAS DE RESUMEN

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 22 Plan de la presentación Introducción Antecedentes y elección del caso de estudio Generación de sesiones Identificación de crawlers Paquete RWebSessionizer Aplicación al caso Conclusiones Trabajos futuros

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 23 Aplicación al caso de estudio: Teatro Solís Cantidad de días: 3 Cantidad de líneas : Timeout: 10 minutos Cantidad de sesiones (eliminados crawlers): 5248 El promedio de bytes por sesión es: 8722 Duración promedio de la sesión: 4,4 minutos

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 24 Aplicación al caso de estudio: Teatro Solís

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 25 Plan de la presentación Introducción Antecedentes y elección del caso de estudio Generación de sesiones Identificación de crawlers Paquete RWebSessionizer Aplicación al caso Conclusiones Trabajos futuros

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 26 Conclusiones Contar con este paquete es un primer paso para comprobar si el sitio web del Teatro Solís está cumpliendo con los objetivos previstos. Con los resultados preliminares se pudo apreciar que la página principal está cumpliendo el objetivo de brindar los datos necesarios para la mayoría de los usuarios.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 27 Conclusiones El Teatro Solís es patrimonio de todos los Uruguayos. Una correcta gestión de su sitio web, en el que además de promover y difundir los diversos espectáculos artísticos, se propicie la cohesión social, así como la generación y reafirmación de valores simbólicos compartidos, es un tema no menor tanto en los objetivos del Teatro como en el beneficio de la sociedad toda.

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 28 Plan de la presentación Introducción Antecedentes y elección del caso de estudio Generación de sesiones Identificación de crawlers Paquete RWebSessionizer Aplicación al caso Conclusiones Trabajos futuros

Sesionador Web dirigido al estudio de sitios web culturales. Diseño e Implementación del paquete RWeb Sessionizer Hochsztain, Tasistro, Asuaga 29 Trabajos futuros Incorporar el módulo de análisis de sesiones, en base a datos de resumen y una galería de gráficos. Establecer un método de consulta interactivo. Establecer una interfaz de usuario gráfica, que facilite el uso del paquete.

Sesionador Web dirigido al estudio de sitios web culturales: Diseño e Implementación del paquete RWeb Sessionizer Ec. Esther Hochsztain Ing. Andrómaca Tasistro Cra. Carolina Asuaga Facultad de Ciencias Económicas y Administración Universidad de la República, Uruguay Octavo Congreso Latinoamericano de Sociedades de Estadística. Octubre de 2008