La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

INDIZACION. SOLANO FLORES ANABEL. PROFESORA: CATALINA NAUMIS PEÑA. TEMA: OTROS INDICADORES DE CALIDAD.

Presentaciones similares


Presentación del tema: "INDIZACION. SOLANO FLORES ANABEL. PROFESORA: CATALINA NAUMIS PEÑA. TEMA: OTROS INDICADORES DE CALIDAD."— Transcripción de la presentación:

1 INDIZACION. SOLANO FLORES ANABEL. PROFESORA: CATALINA NAUMIS PEÑA. TEMA: OTROS INDICADORES DE CALIDAD.

2 OTROS INDICADORES DE CALIDAD. Cuando se produce una necesidad informativa, mediante una estrategia de búsqueda más o menos complicada, interrogamos al conjunto de documentos, con el fin de obtener una respuesta que satisfaga la demanda. Para saber en qué medida la respuesta es satisfactoria, es necesario evaluar los resultados. Desde este punto de vista, la evaluación es la etapa final de la creación de un sistema. La evaluación de los Sistemas de recuperación de información se ha desarrollado paralelamente a su evolución por razones de carácter científico. Complemento del ratio de precisión También se le denomina " factor de ruido ". Consiste en los documentos no relevantes recuperados partido por los recuperados. COMPLEMENTO DEL RATIO DE PRECISIÓN = DOCUMENTOS RELEVANTES RECUPERADOS ENTRE DOCUMENTOS RECUPERADOS

3 OTROS INDICADORES DE CALIDAD Complemento del ratio de exhaustividad Su ecuación se calcula dividiendo los documentos relevantes no recuperados entre el total de los documentos relevantes. El primero en formularlo fue Swets 1963 que lo denominó probabilidad condicional de una pérdida. En 1964 Fairthorne lo denominó ratio del esnobismo. ("snobbery ratio") DOCUMENTOS NO RELEVANTES DOCUMENTOS RECUPERADOS El índice de irrelevancia Este índice se obtiene de dividir los documentos recuperados no relevantes a la pregunta entre el total de los documentos contenidos en la colección. Como muchas de las medidas anteriores fue formulada en primer lugar por Swets en 1963, que se refirió a él como probabilidad condicional de bajada falsa ( conditional probability of false drop ). Cleverdom, Mills and Keen [Cleverdon 66] la llamaron posteriormente fallout. También ha sido denominada " desechado " ( discard ).

4 OTROS INDICADORES DE CALIDAD. DOCUMENTOS NO RELEVANTES NO RECUPERADOS DOCUMENTOS NO RELEVANTES Según Kowalski [Kowalski 97] con esta medida podemos establecer con qué efectividad está actuando un sistema de recuperación. Esta medida es el inverso de la exhaustividad y nunca nos encontraremos con un resultado de 0/0, a menos que todos los documentos sean relevantes para la búsqueda. Complemento del índice de relevancia. Swets en 1963, lo denominó " probabilidad condicional de una correcta respuesta negativa " (condictional probability of a correct rejection). Goffman and Newill la llamaron "especificidad". Se calcula dividiendo los documentos no relevantes no recuperados entre el total de los documentos no relevantes:

5 OTROS INDICADORES DE CALIDAD. DOCUMENTOS RELEVANTES TOTAL DE DOCUMENTOS Generalidad: La generalidad sirve para calcular la densidad de documentos relevantes [Korfage 97]. Se calcula dividiendo los documentos relevantes entre el total de los documentos de la base. DOCUMENTOS RECUPERADOS NÚMERO DE DOCUMENTOS La precisión, la exhaustividad, el índice de irrelevancia y la generalidad se relacionan mediante la siguiente ecuación: P =P/ (1-P) IR G/ (1-G)

6 OTROS INDICADORES DE CALIDAD. Donde P/(1-P) es el ratio de los documentos relevantes recuperados partido el de los no relevantes recuperados. G/(1-G) es el ratio de los documentos relevantes en la colección partido los documentos no relevantes en la colección. P/ir es la ejecución de la recuperación en los documentos relevantes entre la ejecución de la recuperación en los documentos no relevantes. Es deseable tener el primero de los dos alto. Medidas relacionadas con el usuario. Ratio de cobertura : es la proporción de documentos relevantes conocidos por el usuario que son actualmente recuperados. Ratio de novedad : proporción de documentos relevantes recuperados que previamente son conocidos por el usuario Exhaustividad relativa : ratio de documentos relevantes recuperados, examinados por el usuario, partido por el número de documentos que el usuario quiere examinar.

7 OTROS INDICADORES DE CALIDAD. La tasa de fallo refleja el porcentaje de documentos recuperados no relevantes sobre el total de documentos no relevantes de la base de datos. Otra medida relacionada es el factor de generalidad, (grado de documentos relevantes contenidos en una colección). Una colección con un alto grado de generalidad es una colección donde los documentos relevantes son mayoría frente a los que no lo son. Todas estas medidas están estrechamente vinculadas, de manera que la precisión puede definirse en función de las tres restantes, y se expresa de la siguiente forma: P= (E x G) (E x G) + 1 (F- G) P =precisión; E =exhaustividad; G = generalidad y F = fallo Modelo de Swets Bajo esta serie de premisas se desarrolla este modelo, suficientemente explicado por Rijsbergen y Salton. Define la terna de medidas E-P-F -exhaustividad, precisión, tasa de fallo-, en términos probabilísticos. Así, la exhaustividad será una estimación de la probabilidad condicionada de que un documento recuperado sea relevante; la precisión será unaestimación de la probabilidad condicionada de que un documento relevante sea recuperado y la tasa de fallo será una estimación de la probabilidad condicionada de que un documento recuperado no sea relevante.

8 OTROS INDICADORES DE CALIDAD. Este modelo convierte las representaciones E-P en otras, construidas en función de disponer de un determinado número de documentos relevantes o no. Las operaciones de búsqueda producen como resultado unas funciones lineales que guardan una cierta distancia con la distribución de las probabilidades anteriormente citadas y es precisamente el valor de esa distancia -multiplicado por la raíz cuadrada de dos- el valor de la Medida E de Swets. El principal inconveniente de esta medida reside en que a diferencia de la exhaustividad y de la precisión, estas medidas -la distancia y la pendiente- no resultan fácilmente descifrables por los usuarios y difícilmente harán uso de ellas. Modelo de Robertson Este modelo es una aproximación logística a la estimación de los valores de exhaustividad y precisión, Robertson, en colaboración con Teather, desarrolla un modelo que estima las probabilidades correspondientes a E-P. Este procedimiento resulta inusual ya que al calcular una estimación de ambas probabilidades para una pregunta simple, considera dos cosas: la cantidad de datos empleados para alcanzar esas estimaciones y los promedios de las estimaciones de todas las demás preguntas22. El objetivo de este método es obtener un valor delta candidato a convertirse en una medida simple de la efectividad de un SRI.

9 OTROS INDICADORES DE CALIDAD. Longitud esperada de búsqueda Algunas medidas adicionales de valor único emplean también las diferencias entre los rangos de los documentos relevantes recuperados y, o bien los rangos ideales –aquellos casos donde los documentos relevantes son recuperados antes que los no relevantes-, obien los rangos aleatorios -donde los documentos relevantes son aleatoriamente incluidos en la salida entre los no relevantes-. Una de estas medidas es la longitud esperada de búsqueda. Esta medida no proporciona directamente un valor simple, más concretamente proporciona una serie de valores que muestran qué puede esperar el usuario del sistema bajo distintos requerimientos de exhaustividad. No obstante, esta serie de valores pueden sintetizarse en un valor simple. Rocchio, quien define la exhaustividad normalizada y una precisión normalizada para sistemas que presentan los documentos alineados y donde no afecte el tamaño de la muestra analizada. Define un sistema ideal donde los documentos relevantes se recuperan antes que los documentos no relevantes y se puede representar en un gráfico la evolución de la exhaustividad de esta operación de recuperación de información.

10 OTROS INDICADORES DE CALIDAD.

11 Ambas medidas asignan valores distintos de peso a los documentos recuperados en la secuencia, la precisión los asigna a los iniciales y la exhaustividad asigna un valor uniforme a todos los documentos relevantes En tercer lugar, estas medidas pueden entenderse como una aproximación de la precisión y exhaustividad promedio -estudiadas anteriormente- y, por último, los problemas que surgían en la determinación de la longitud esperada de búsqueda -por la posición de los documentos relevantes-, son inexistentes en este caso. Satisfacción y Frustración El esfuerzo que implica la determinación de las medidas anteriores, propicia que se establezcan otra nueva serie: satisfacción, frustración y total. La primera sólo considera los documentos relevantes, la segunda sólo contempla a los no relevantes y la tercera combina ponderadamente las medidas anteriores. Cuando se hace uso de los pesos, a los documentos relevantes se les suele asignar los valores más cercanos al umbral superior de la escala, y a los documentos no relevantes se les asigna valores cercanos al cero. Para calcular la medida de la satisfacción, el peso de los documentos no relevantes se simplifica a cero, aunque hay que considerar sus posiciones en la secuencia.

12 OTROS INDICADORES DE CALIDAD. De forma similar, para calcular la ratio de frustración, los documentos relevantes tendrán peso cero. La elección de un esquema de peso en la definición de la medida total viene determinada por el nivel de satisfacción que alcance el usuario cuando reciba los documentos relevantes pronto y sutolerancia a la presencia de documentos no relevantes.

13 OTROS INDICADORES DE CALIDAD. Se comparan dos SRI, cada uno de los cuales recupera los mismos 10 documentos. Estos documentos serán juzgados siguiendo una escala de 5 puntos, donde 0 y 1 representan documentos no relevantes; y 2, 3 y 4 representan documentos relevantes. El sistema A recupera los documentos en el orden {3, 4, 2, 0, 2, 3, 3, 3, 4, 1, 0} y el sistema B recupera los documentos en el orden {0, 4, 2, 3, 2, 0, 1, 3, 3, 4}30. Si se entiende que la medidatotal va a ser el resultado de restarle el valor de frustración al valor de satisfacción, aunque a primera vista los valores de satisfacción del sistema A están más cerca que los del sistema B del sistema ideal.

14 OTROS INDICADORES DE CALIDAD.

15 OTROS INDICADORES DE CALIDAD

16 OBRAS CONSULTADAS. Raquel Gómez Díaz. La evaluación en recuperación de la información [on line]. "Hipertext.net", núm. 1, [Consulta: 25/05/2006]. ISSN Martínez Méndez, Francisco Javier. REFLEXIONES SOBRE LA EVALUACIÓN DE LOS SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN: NECESIDAD,UTILIDAD Y VIABILIDAD. ANALES DE DOCUMENTACION, N º 7, 2004, P Á GS Martínez Méndez, Francisco Javier. RECUPERACIÓN DE INFORMACIÓN, MODELOS, SISTEMAS Y EVALUACIÓN. Murcia: Kiosko, Moya Anegón, Félix de. Los sistemas integrados de gestión bibliotecaria : estructuras de datos y recuperación de información. Madrid : ANABAD, c1995.


Descargar ppt "INDIZACION. SOLANO FLORES ANABEL. PROFESORA: CATALINA NAUMIS PEÑA. TEMA: OTROS INDICADORES DE CALIDAD."

Presentaciones similares


Anuncios Google