Control de Acceso y Estadísticas a las Páginas de un Servicio Web en el Ámbito Docente Universitario Departamento de Informática Universidad de Extremadura Jesús M. Álvarez Llorente
Se presenta... un sencillo método de control que nos permite conocer la actividad de nuestro sitio web (sin obras)
¿Por qué? Tenemos un sitio web con todos los servicios (la página de nuestra asignatura) ¿Se utiliza? ¿Cómo? ¿Quién? ¿Cuándo? ¿Dónde?
Primera idea Existen servicios gratuitos de contadores y estadísticas: NetStat CiberStats No proporcionan toda la información Son más lentos
Mejor idea Controlar las visitas nosotros mismos. ¿Cómo? Registrando el instante y procedencia de cada visita a cada página. Se ha aplicado a un conjunto de páginas relacionadas con la docencia universitaria en la carrera de Informática
Objetivos 1. Conocer quién visita y cuándo. 2. Espiar la actividad de los visitantes. 3. Analizar la repercusión de eventos en la web.
El método Guardar para cada página una tabla con las visitas: Dirección IP Fecha/Hora /05/ :35: /05/ :30: /06/ :02:19
El método En el contenido html se incluye una referencia (p.e. como imagen), similar a las utilizadas en NetStat, CiberStats. (Visible o Invisible) El código de la página La imagen
El método (resumiendo) Por cada página una referencia: Y se va generando una tabla de datos de visitas: IP Hora /01/ :55:41 IP Hora /01/ :55: /02/ :15:14 IP Hora /01/ :10: /02/ :18: /03/ :55: /07/ :00: /07/ :33: /08/ :07:40
Los resultados 1. Contadores de acceso. Pero, además, podemos dividir los accesos por franjas temporales (hoy, 24H, últimos 10 días, etc.). Basta con contar el número de registros de cada tabla en distintos rangos de fechas.
Los resultados 2. Control de visitas a una página. Podemos saber cuándo y desde dónde se han conectado las visitas a una página. Basta con listar el contenido de la tabla correspondiente a una página.
Los resultados 3. Control de procedencias. Mantenemos una lista del conjunto de direcciones de procedencia. Proporciona información interesante sobre la procedencia con un rendimiento aceptable.
Los resultados 4. Control de accesos de visitantes. Podemos resumir el conjunto de visitas realizadas desde una misma dirección (qué visitó, cuántas veces, en cuántos días, etc.). Buscamos en las distintas tablas de accesos las entradas correspondientes a la misma dirección.
Los resultados 5. Rastreo de actividad de visitantes. Podemos seguir el rastro de los pasos que siguió el visitante durante un acceso. Buscamos en las distintas tablas de accesos las entradas correspondientes a la misma dirección durante el mismo día y lo mostramos como un grafo.
Los resultados 6. Evolución de visitas. Podemos estudiar la velocidad a la que se incrementa el número de visitas a lo largo del tiempo en distintas páginas. Examinamos algunas tablas de accesos, contando el total de visitas día a día en un rango de fechas.
Conclusiones 1. El sistema es simple y eficaz. 2. El sistema es fácilmente ampliable: Nuevas páginas. Nuevos informes. Con sólo registrar 2 datos de cada visita podemos obtener mucha información.
3. Se cumplen los objetivos: Conclusiones Conocer quién visita y cuándo. Espiar la actividad de los visitantes. Analizar la repercusión de eventos.
1. Perfeccionamiento del sistema: Trabajo actual y futuro Construcción de nuevos informes. Obtención automática de gráficos. Función de derivación en avance. Optimización de algoritmos y estructuras.
2. Portabilidad del sistema: Trabajo actual y futuro Ámbito y uso personal. Requiere conocimientos técnicos avanzados (C, UNIX).
Obstáculo insalvable Infinita reticencia de los administradores web para permitir a los usuarios instalar cgis. Trabajo actual y futuro
[Bri91]Brian W. Kernighan, Dennis M. Ritchie. El Lenguaje de Programación C. Prentice-Hall Hispanoamericana, [Byr99]Byron S. Gottfried. Programación en C (2ª edición). McGraw-Hill, [Phi96]Daniel Philippe Chalat. HTML y la Programación de Servidores Web. Gestión 2000, [Ste98]E. Stephen Mack, Janan Platt. HTML 4.0. Anaya Multimedia, [Tit96]Ed. Tittel (et al.). Fundamentos de Programación con HTML & CGI. Anaya Multimedia, [Gal00]Germán Galeano, Pablo Díaz, José Carlos Sánchez. Manual Imprescindible de HTML 4. Anaya Multimedia, [Coh96]Isaac Cohen. CGI/Pearl y JavaScript: Creación de Páginas HTML interactivas. Gestión 2000, [Bra00]Jerry Bradenbaugh. Aplicaciones JavaScript. Anaya Multimedia, [Chr90]Kaare Christian. Diccionario de C y UNIX. Anaya Multimedia, [Rob96]William Robert Stanek. HTML, CGI, SGML, VRML, JAVA: Web Publishing: Unleashed. Sams.Net, Referencias
SUGERENCIAS Y PREGUNTAS