INDIZACION. SOLANO FLORES ANABEL. PROFESORA: CATALINA NAUMIS PEÑA.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

El ciclo de vida de un proyecto
ORGANIZACIÓN de la PRODUCCIÓN
Estimación de parámetros poblacionales
EL DIRECTIVO FRENTE A LOS PROBLEMAS
Convertidores A/D y D/A
GESTIÓN DE LOS COSTOS DEL PROYECTO
Diferenciación e Integración Numérica
TECNOLOGIA DEL CONCRETO
Bioestadística Diplomado en Sanidad
ADMINISTRACIÓN DEL CAMBIO.
Evaluando Competencias Profesionales a Través de Rúbricas
MÉTODOS DE ANÁLISIS FINANCIEROS
KRIGING.
Planeación Financiera
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MULTICOLINEALIDAD
TEMA: ACUMULACIÓN DE COSTOS
PROCESAMIENTO DE DATOS DE VIENTO 1º Parte.
Medidas de Dispersión Estadística E.S.O.
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
Facultad: Turismo Y Hotelería
PREGUNTAS ORIENTADORAS DEL PROBLEMA
Clases 4 Pruebas de Hipótesis
PLAN DE VENTAS ALFONSO ENRIQUE HERRERA GRANADOS
Modelo de regresión simple: Y =  1 +  2 X + u 1 Hemos visto que los coeficientes de regresión b 1 y b 2 son variables aleatorias. Estos, respectivamente,
Descomposición Factorial Unidad 5
UNIVERSIDAD NACIONAL INTERCULTURAL DE LA AMAZONIA
Método de recuperación de Theis
CÁLCULO ELÉCTRICO DE LÍNEAS
INDICADORES DE GESTIÓN
ESTADISTICA TEMA y 223.
Gerenciamiento Técnico de Proyectos
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Métodos de calibración: regresión y correlación
Previsión de Ventas. Métodos no paramétricos Previsión de Ventas. Tema 2. 1 Antonio Montañés Bernal Curso
Inferencia Estadística
Usuarios de los Estados Financieros
ANÁLISIS DE LA INFORMACIÓN Descripción de los datos
Tema 4 Existencias Diapositivas empleadas por Manuel García-Ayuso Covarsí en las sesiones destinadas a la discusión de los contenidos teóricos del Tema.
ANALIS DE METODOS Y MEDIOS
Construcción de Software
Capítulo 1. Conceptos básicos de la Estadística
Cuestionarios para La Investigación.
Evaluación de la Indización
Villahermosa, Tab. 21 septiembre MATERIA: Investigacion de operaciones TEMA: Lineas de espera ALUMNOS: Maria isabel vega chanona HORA: 11:00 am a.
Administración Estratégica para la Competitividad Calidad en el Servicio Dra. Icela Lozano Encinas Dra. Icela Lozano Encinas.
DIAGRAMA DE FLECHAS O RUTA CRITICA
1.Función y ecuación polinomial
INGENIERÍA DEL SOFTWARE GESTIÓN DE PROYECTOS
Medición y Métricas del Software
PROYECTO TECNOLÓGICO Mateo Guerra Alzate Cristian Herrera 9-D I
Aproximaciones y Errores
Sistemas de evaluación del sistema educacional chileno
IDENTIFICACIÓN DEL CICLO DE VIDA DEL SOFTWARE. POLITÉCNICO COLOMBIANO JAIME ISAZA CADAVID.
Estadística II Regresión Lineal.
CIFRAS SIGNIFICATIVAS
2.1 DEFINICIONES CARACTERÍSTICAS Y SUPOSICIONES.
RIESGO, RENDIMIENTO Y VALOR
Universidad Abierta y a Distancia de México UnADM
MUESTREO : Generalidades
INSTRUMENTOS ESTRUCTURADOS.
METODO DE GRADACIÓN DIANA PAOLA SALGUERO JUAN SEBASTIAN LASTRA CAMACHO
DEFINICIÓN DE NORMALIDAD MEDIDAS DE DESCRIPCIÓN DE DATOS
Presupuesto De Producción
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Principios lógicos Los “principios lógicos” constituyen las verdades primeras, “evidentes” por sí mismas, a partir de las cuales se construye todo el edificio.
PERIODO EVALUADO DESDE HASTA SECCIÓN “A” DATOS DE IDENTIFICACIÓN DATOS DEL EVALUADO APELLIDOS Y NOMBRES: CEDULA DE IDENTIDAD: CODIGO DE NOMINA: TITULO.
Transcripción de la presentación:

INDIZACION. SOLANO FLORES ANABEL. PROFESORA: CATALINA NAUMIS PEÑA. TEMA: OTROS INDICADORES DE CALIDAD.

OTROS INDICADORES DE CALIDAD. Cuando se produce una necesidad informativa, mediante una estrategia de búsqueda más o menos complicada, interrogamos al conjunto de documentos, con el fin de obtener una respuesta que satisfaga la demanda. Para saber en qué medida la respuesta es satisfactoria, es necesario evaluar los resultados. Desde este punto de vista, la evaluación es la etapa final de la creación de un sistema. La evaluación de los Sistemas de recuperación de información se ha desarrollado paralelamente a su evolución por razones de carácter científico. Complemento del ratio de precisión También se le denomina " factor de ruido ". Consiste en los documentos no relevantes recuperados partido por los recuperados. COMPLEMENTO DEL RATIO DE PRECISIÓN= DOCUMENTOS RELEVANTES RECUPERADOS ENTRE DOCUMENTOS RECUPERADOS

OTROS INDICADORES DE CALIDAD  Complemento del ratio de exhaustividad Su ecuación se calcula dividiendo los documentos relevantes no recuperados entre el total de los documentos relevantes. El primero en formularlo fue Swets 1963 que lo denominó probabilidad condicional de una pérdida. En 1964 Fairthorne lo denominó ratio del esnobismo. ("snobbery ratio")  DOCUMENTOS NO RELEVANTES DOCUMENTOS RECUPERADOS  El índice de irrelevancia Este índice se obtiene de dividir los documentos recuperados no relevantes a la pregunta entre el total de los documentos contenidos en la colección. Como muchas de las medidas anteriores fue formulada en primer lugar por Swets en 1963, que se refirió a él como probabilidad condicional de bajada falsa ( conditional probability of false drop ). Cleverdom, Mills and Keen [Cleverdon 66] la llamaron posteriormente fallout . También ha sido denominada " desechado " ( discard ).

OTROS INDICADORES DE CALIDAD. DOCUMENTOS NO RELEVANTES NO RECUPERADOS DOCUMENTOS NO RELEVANTES Según Kowalski [Kowalski 97] con esta medida podemos establecer con qué efectividad está actuando un sistema de recuperación. Esta medida es el inverso de la exhaustividad y nunca nos encontraremos con un resultado de 0/0, a menos que todos los documentos sean relevantes para la búsqueda. Complemento del índice de relevancia. Swets en 1963, lo denominó " probabilidad condicional de una correcta respuesta negativa " (condictional probability of a correct rejection). Goffman and Newill la llamaron "especificidad". Se calcula dividiendo los documentos no relevantes no recuperados entre el total de los documentos no relevantes:  

OTROS INDICADORES DE CALIDAD. DOCUMENTOS RELEVANTES TOTAL DE DOCUMENTOS Generalidad: La generalidad sirve para calcular la densidad de documentos relevantes [Korfage 97]. Se calcula dividiendo los documentos relevantes entre el total de los documentos de la base. DOCUMENTOS RECUPERADOS NÚMERO DE DOCUMENTOS La precisión, la exhaustividad, el índice de irrelevancia y la generalidad se relacionan mediante la siguiente ecuación: P =P/ (1-P) IR G/ (1-G)

OTROS INDICADORES DE CALIDAD. Donde P/(1-P) es el ratio de los documentos relevantes recuperados partido el de los no relevantes recuperados. G/(1-G) es el ratio de los documentos relevantes en la colección partido los documentos no relevantes en la colección. P/ir es la ejecución de la recuperación en los documentos relevantes entre la ejecución de la recuperación en los documentos no relevantes. Es deseable tener el primero de los dos alto. Medidas relacionadas con el usuario. ·         Ratio de cobertura : es la proporción de documentos relevantes conocidos por el usuario que son actualmente recuperados. ·         Ratio de novedad : proporción de documentos relevantes recuperados que previamente son conocidos por el usuario ·         Exhaustividad relativa : ratio de documentos relevantes recuperados, examinados por el usuario, partido por el número de documentos que el usuario quiere examinar.

OTROS INDICADORES DE CALIDAD. La tasa de fallo refleja el porcentaje de documentos recuperados no relevantes sobre el total de documentos no relevantes de la base de datos. Otra medida relacionada es el factor de generalidad, (grado de documentos relevantes contenidos en una colección). Una colección con un alto grado de generalidad es una colección donde los documentos relevantes son mayoría frente a los que no lo son. Todas estas medidas están estrechamente vinculadas, de manera que la precisión puede definirse en función de las tres restantes, y se expresa de la siguiente forma: P= (E x G) (E x G) + 1 (F- G) P =precisión; E =exhaustividad; G = generalidad y F = fallo Modelo de Swets Bajo esta serie de premisas se desarrolla este modelo, suficientemente explicado por Rijsbergen y Salton. Define la terna de medidas E-P-F -exhaustividad, precisión, tasa de fallo-, en términos probabilísticos. Así, la exhaustividad será una estimación de la probabilidad condicionada de que un documento recuperado sea relevante; la precisión será unaestimación de la probabilidad condicionada de que un documento relevante sea recuperado y la tasa de fallo será una estimación de la probabilidad condicionada de que un documento recuperado no sea relevante.

OTROS INDICADORES DE CALIDAD. Este modelo convierte las representaciones E-P en otras, construidas en función de disponer de un determinado número de documentos relevantes o no. Las operaciones de búsqueda producen como resultado unas funciones lineales que guardan una cierta distancia con la distribución de las probabilidades anteriormente citadas y es precisamente el valor de esa distancia -multiplicado por la raíz cuadrada de dos- el valor de la Medida E de Swets. El principal inconveniente de esta medida reside en que “a diferencia de la exhaustividad y de la precisión, estas medidas -la distancia y la pendiente- no resultan fácilmente descifrables por los usuarios y difícilmente harán uso de ellas. Modelo de Robertson Este modelo es una aproximación logística a la estimación de los valores de exhaustividad y precisión, ”Robertson, en colaboración con Teather, desarrolla un modelo que estima las probabilidades correspondientes a E-P. Este procedimiento resulta inusual ya que al calcular una estimación de ambas probabilidades para una pregunta simple, considera dos cosas: la cantidad de datos empleados para alcanzar esas estimaciones y los promedios de las estimaciones de todas las demás preguntas”22. El objetivo de este método es obtener un valor delta candidato a convertirse en una medida simple de la efectividad de un SRI.

OTROS INDICADORES DE CALIDAD. Longitud esperada de búsqueda Algunas medidas adicionales de valor único emplean también las diferencias entre los rangos de los documentos relevantes recuperados y, o bien los rangos ideales –aquellos casos donde los documentos relevantes son recuperados antes que los no relevantes-, obien los rangos aleatorios -donde los documentos relevantes son aleatoriamente incluidos en la salida entre los no relevantes-. Una de estas medidas es la longitud esperada de búsqueda. Esta medida no proporciona directamente un valor simple, más concretamente proporciona una serie de valores que muestran qué puede esperar el usuario del sistema bajo distintos requerimientos de exhaustividad. No obstante, esta serie de valores pueden sintetizarse en un valor simple. Rocchio, quien define la exhaustividad normalizada y una precisión normalizada para sistemas que presentan los documentos alineados y donde no afecte el tamaño de la muestra analizada. Define un “sistema ideal donde los documentos relevantes se recuperan antes que los documentos no relevantes y se puede representar en un gráfico la evolución de la exhaustividad de esta operación de recuperación de información.

OTROS INDICADORES DE CALIDAD.

OTROS INDICADORES DE CALIDAD. Ambas medidas asignan valores distintos de peso a los documentos recuperados en la secuencia, la precisión los asigna a los iniciales y la exhaustividad asigna un valor uniforme a todos los documentos relevantes En tercer lugar, estas medidas pueden entenderse como una aproximación de la precisión y exhaustividad promedio -estudiadas anteriormente- y, por último, los problemas que surgían en la determinación de la longitud esperada de búsqueda -por la posición de los documentos relevantes-, son inexistentes en este caso. Satisfacción y Frustración El esfuerzo que implica la determinación de las medidas anteriores, propicia que se establezcan otra nueva serie: satisfacción, frustración y total. La primera sólo considera los documentos relevantes, la segunda sólo contempla a los no relevantes y la tercera combina ponderadamente las medidas anteriores. Cuando se hace uso de los pesos, a los documentos relevantes se les suele asignar los valores más cercanos al umbral superior de la escala, y a los documentos no relevantes se les asigna valores cercanos al cero. Para calcular la medida de la satisfacción, el peso de los documentos no relevantes se simplifica a cero, aunque hay que considerar sus posiciones en la secuencia.

OTROS INDICADORES DE CALIDAD. De forma similar, para calcular la ratio de frustración, los documentos relevantes tendrán peso cero. La elección de un esquema de peso en la definición de la medida total viene determinada por el nivel de satisfacción que alcance el usuario cuando reciba los documentos relevantes pronto y sutolerancia a la presencia de documentos no relevantes.

OTROS INDICADORES DE CALIDAD. Se comparan dos SRI, cada uno de los cuales recupera los mismos 10 documentos. Estos documentos serán juzgados siguiendo una escala de 5 puntos, donde 0 y 1 representan documentos no relevantes; y 2, 3 y 4 representan documentos relevantes. El sistema A recupera los documentos en el orden {3, 4, 2, 0, 2, 3, 3, 3, 4, 1, 0} y el sistema B recupera los documentos en el orden {0, 4, 2, 3, 2, 0, 1, 3, 3, 4}”30. Si se entiende que la medidatotal va a ser el resultado de restarle el valor de frustración al valor de satisfacción, aunque a primera vista los valores de satisfacción del sistema A están más cerca que los del sistema B del sistema ideal.

OTROS INDICADORES DE CALIDAD.

OTROS INDICADORES DE CALIDAD

OBRAS CONSULTADAS. Raquel Gómez Díaz. La evaluación en recuperación de la información [on line]. "Hipertext.net", núm. 1, 2003. <http://www.hipertext.net> [Consulta: 25/05/2006]. ISSN 1695-5498 Martínez Méndez, Francisco Javier. REFLEXIONES SOBRE LA EVALUACIÓN DE LOS SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN: NECESIDAD,UTILIDAD Y VIABILIDAD. ANALES DE DOCUMENTACION, Nº 7, 2004, PÁGS. 153-170 Martínez Méndez, Francisco Javier. RECUPERACIÓN DE INFORMACIÓN, MODELOS, SISTEMAS Y EVALUACIÓN. Murcia: Kiosko, 2004. Moya Anegón, Félix de. Los sistemas integrados de gestión bibliotecaria : estructuras de datos y recuperación de información. Madrid : ANABAD, c1995.