Análisis documental
Análisis documental El análisis documental tiene como objetivo primordial la recuperación de los documentos a partir de distintos criterios, formales, morfológicos o temáticos, generalmente normalizados. Aborda el documento en todas sus características, tanto formales (autor, título, soporte, formato, edición, etc.) como de contenido (enfoque, temática, cobertura, etc.)
Análisis documental "conjunto de procedimientos destinados a captar, segmentar y representar el significado de los documentos con el objetivo de su recuperación total o parcial. Se emplea, por tanto, como sinónimo de operaciones que afectan al plano del contenido y la estructura de la significación, exclusivamente" Definición de A.García Gutiérrez
Análisis documental: Funciones Control documental
Análisis documental : Funciones Control documental Gestión por medio de representaciones
Análisis documental : Funciones Control documental Gestión por medio de representaciones Información sobre el contenido
Análisis documental : Funciones Control documental Gestión por medio de representaciones Información sobre el contenido Ordenación sistemática
Análisis documental : Funciones Control documental Gestión por medio de representaciones Información sobre el contenido Ordenación sistemática Recuperación pertinente
Elementos del AD Análisis formal Análisis documental de contenido Catalogación Descripción documental Análisis documental de contenido Indización Clasificación Resumen analítico
Análisis formal El análisis formal es un proceso que se realiza para controlar e identificar los documentos que forman parte de una colección. Se realiza en dos operaciones complementarias, que tienden a confundirse, la catalogación y la descripción documental.
Análisis formal: Catalogación La catalogación pretende establecer la lista de documentos que componen una colección, es decir, el catálogo, considerado éste como instrumento de comunicación entre la colección y los usuarios, por lo que la catalogación se ocupa de diseñar las formas de acceso o puntos de entrada que los documentos tengan en el catálogo con el objeto de que puedan ser recuperados; esto en la práctica implica también operaciones propias del análisis de contenido.
Análisis formal: Descripción documental La descripción documental es la operación por la cual se describe el documento en función de sus características formales y externas, como el autor, el título, el lugar de edición, el editor, el año de publicación, las características físicas, etc. Se trata de una operación que debe estar sujeta a normas estrictas de la más amplia extensión posible con el objeto de que los registros resultantes sean intercambiables y comprensibles a todos los niveles.
Normas de descripción documental ISBD International Standard Bibliographic Descrption. AACR Anglo-American Cataloguing Rules. Dublin Core Normas de descripción para documentos web.
Análisis de contenido: Fases Conocimiento del documento: Lectura del mismo, atendiendo a los elementos característicos del texto, como temas, perspectiva de tratamiento, metodología, lugar, época o, también, objetivo, destinatarios y forma.
Análisis documental: Fases Análisis. Lectura empírica del texto, desectructurándolo de acuerdo con unas reglas lógicas de interrogación preestablecidas que variarán en función del tipo de texto, de temática, etc.
Análisis documental: Fases Síntesis. Condensación del texto en virtud de la pertinencia y relevancia de sus contenidos y la priorización de los temas fundamentales detectados.
Análisis documental: Fases Representación. Codificación de los resultados de acuerdo con las normas correspondientes para cada operación.
Análisis documental: Fases Recuperación. Utilización de los códigos adecuados y de reglas de combinación para, a partir de las necesidades de información del usuario, encontrar las respuestas oportunas.
Análisis documental: Operaciones Indización Clasificación Resumen analítico
Indización Procedimiento que produce entradas en un índice Índice: Lista ordenada de términos pertenecientes a un documento o a una colección
Indización Indización es el proceso de análisis del contenido informativo de registros de conocimiento (documentos) y la expresión de ese contenido en el lenguaje del sistema correspondiente. Indización es la operación que tiene como propósito representar los resultados del análisis documental de un documento por medio de términos extraídos de un lenguaje documental.
Indización La indización no pretende sólo determinar de qué trata un documento sino también porqué puede interesar a un grupo específico de usuarios
Indización: Elementos definitorios El objetivo de la indización es representar (expresar, describir o indicar) el contenido (temas, características) de un documento. El proceso de indización tiene dos componentes: (a) análisis de contenido para seleccionar los conceptos que representarán los documentos; y (b) traducción o expresión de los conceptos seleccionados en el lenguaje utilizado por el sistema.
Estrategia de indización 1/2 Fuentes de procedencia de los términos: Tesauro, vocabularios, lenguaje natural. Especificidad: ¿Cuán específico debe ser un indizador al traducir un concepto a un término índice? ¿Debe el término seleccionado ser tan específico como el concepto? o ¿debería utilizarse uno más amplio? Por ejemplo: Un documento trata sobre los perros de raza Cocker Spanniel, pero se puede pensar que este término es demasiado específico para el sistema y entra en el índice con el término Perro, más amplio. Evidentemente esto depende del sistema documental, porque si se tratara de una base de datos sobre perros el término de entrada adecuado sería el primero.
Estrategia de indización 2/2 Ponderación: ¿Se puede expresar de alguna manera la importancia relativa de un concepto en un documento? Precisión: ¿Qué grado de precisión debe tener la traducción? ¿Qué hacer cuando no hay un término adecuado? Grado de coordinación: ¿Deben utilizarse términos simples o términos compuestos? Por ejemplo, el término Educación Infantil puede ser equivalente a la combinación de términos Educación e Infancia, cada uno de ellos por separado y combinables en la búsqueda. Exhaustividad: ¿Todo debe ser indizado?
Índices: Objetivos y funciones Identificar y localizar información potencialmente relevante en el documento o la colección indizada. Discriminar entre información sobre un tema y simples menciones al tema. Excluir menciones al tema que no aporten nada significativo a un usuario potencial. Analizar los conceptos tratados en el documento para proponer encabezamientos (entradas) adecuados basados en su propia terminología. Indicar relaciones entre temas.
Índices: Objetivos y funciones Agrupar o reunir materiales separados en la colección. Organizar encabezamientos y subencabezamientos y modificadores en entradas del índice. Dirigir al usuario hacia términos válidos por medio de reenvíos del tipo USE o Véase. Sugerir al usuario de un tema que vea también otros por medio de reenvíos como Véase también. Organizar las entradas en un orden sistemático que ayude al usuario.
Indización: Operaciones prácticas Planteamiento de objetivos: Contexto de trabajo. Conocimiento del contenido del documento. Elección de conceptos a representar: Selectividad (Retener aquellos conceptos sobre los cuales el documento aporta información susceptible de interesar al usuario) Exhaustividad (Todos los conceptos útiles deben ser extraídos). El criterio principal de selección es el valor potencial del concepto escogido como elemento de expresión del tema del documento para su recuperación. Verificación de la pertinencia de los conceptos extraídos.
Indización: Operaciones prácticas Traducción de los conceptos escogidos al lenguaje documental del sistema. Los conceptos deberán traducirse por entradas del mismo nivel de especificidad o superior. Si el concepto es compuesto y existe la opción deberá traducirse por una entrada compuesta. Verificación de la pertinencia de los términos obtenidos planteándolos como términos posibles de interrogación y valorando si el documento es pertinente. Formalización de la descripción si el sistema prevé algún tipo de regla.
Descriptores El método de indización por descriptores se basa en la suposición de que los contenidos semánticos (las materias o temas) de un documento pueden expresarse con suficiente precisión por una palabra o conjunto de palabras que cumplen una función nominativa. Estas palabras-clave o descriptores actúan de forma independiente y pueden combinarse entre sí utilizando los operadores lógicos booleanos.
Descriptores: Definición Los descriptores son palabras o grupos de palabras incluidas en un lenguaje documental y escogidas de entre un conjunto de términos equivalentes para representar sin ambigüedad una noción contenida en un documento o en una petición de búsqueda documental.
Descriptores: Tipología Descriptor unitérmino o simple: Descriptor que representa un concepto mediante una sola palabra: CINE, OCIO, HIERRO, AUTOMOVIL Descriptor sintagmático o compuesto: Descriptor que representa un concepto utilizando más de una palabra (un sintagma nominal o preposicional): COMUNICACION SOCIAL, PARTIDOS POLITICOS, MEDIOS DE TRANSPORTE, EMPRESA PRIVADA.
Descriptores: Tipología Descriptor primario: Término o conjunto de términos que representan un concepto de manera unívoca. Es significativo, relevante y no hay posibilidad de ambigüedad en su sentido, pudiendo aparecer aislado sin necesidad de aclaración. Cualquiera de los citados en las categorías anteriores es así. Descriptor secundario: Descriptor que necesita ir acompañado de otros descriptores para expresar un significado preciso: ANALISIS, EVALUACION, CONCEPTO, TEORIA.
Descriptores: Tipología Descriptor temático: Representa cualquier contenido concreto o abstracto: Objetos, acciones, ideas, etc. Descriptor geográfico: Términos que designan lugares y sitios específicos. Descriptor onomástico: Representa un nombre de persona o de institución. Descriptor cronológico: Representa períodos de tiempo o fechas.
Cuestiones y perfiles de Área de búsqueda Cuestiones y perfiles de interés Documentos y datos Reglas del juego = Normas de indización + Lenguaje documental Vocabulario y Lenguaje de Indización Área de Almacén potencialmente relevantes Comparación/ Coincidencia Perfiles/ Búsquedas Representaciones De los documentos (Descriptiva y temática) Formulación de la Demanda en descriptores Almacén de perfiles documentos Sistema de almacenamiento y recuperación de información
Clasificación Clasificar, en términos generales, es el acto de organizar el universo del conocimiento en algún orden sistemático. Es una actividad fundamental de la mente humana. El acto de clasificar consiste en el proceso dicotómico de distinguir cosas que poseen cierta característica de aquellas que no la poseen y agrupar en una clase las cosas que poseen la propiedad o característica en común.
Tipos de clasificaciones Clasificaciones jerárquicas: Cada clase o subcategoría se divide en otras menores. Cada documento irá en un lugar. Clasificaciones facetadas: Crean una lista de elementos para cada característica o división (faceta). Combinan facetas para crear la clasificación.
Clasificaciones jerárquicas Literature Spanish French English Drama Poetry Prose 18th 17th 16th 19th ...
Clasificaciones facetadas A Language a English b French c Spanish B Genre a Prose b Poetry c Drama C Period a 16th Century b 17th Century c 18th Century d 19th Century Aa English Literature AaBa English Prose AaBaCa English Prose 16th Century AbBbCd French Poetry 19th Century BbCd Drama 19th Century
Clasificaciones CDU (Clasificación Decimal Universal) DDC (Clasificación Decimal de Dewey) LCC (Clasificación de la Biblioteca del Congreso de Washington) Directorio de Yahoo Open Directory
Clasificación medieval Trivium (Ciencia de las palabras) Gramática Retórica Dialéctica Quatrivium (Ciencia de las cosas) Aritmética Geometría Astronomía Música
Clasificación Decimal Universal 0. Generalidades. Ciencia y conocimiento. Organización. Información. Documentación. Biblioteconomía. Instituciones. Documentos y publicaciones 1. Filosofía.Psicología 2. Religión. Teología 3. Ciencias sociales.Estadística.Política. Economía. Comercio. Derecho. Gobierno. Asuntos militares. Bienestar social. Seguros. Educación. Folclore
Clasificación Decimal Universal 5. Matemáticas. Ciencias naturales. 6. Ciencias aplicadas. Medicina. Técnica 7. Bellas artes. Juegos. Espectáculos. Deportes 8. Lenguaje. Lingüística. Literatura 9. Geografía. Biografías. Historia