04 Jun

2.2.1 Primera fase o Fase de Análisis del documento

Se compone de tres etapas: el análisis del contenido o información del documento, la identificación de los conceptos que constituyen el contenido y la selección de los conceptos más representativos de ese contenido.
La bibliografía tradicional se ha limitado a marcar unas pautas generales para la identificación de los temas de que trata un documento.
En los últimos años, algunos especialistas, están trabajando en la creación de un método de indización.
2.2.1.1 Etapa de análisis del contenido
Es una etapa de toma de contacto con el contenido del mismo, el fin es ver de qué trata el documento. Es imposible que el indizador lea el documento completo, porque el tiempo empleado en indizar un documento restaría eficacia y economía al sistema de información. Por eso, el indizador debe centrarse en unas fuentes determinadas.
Las fuentes para los documentos impresos son:

– El título

Según el DRAE es: “Palabra o frase con que se da a conocer el nombre o asunto de una obra o de cada una de las partes o divisiones de un escrito”.
Aunque el título resume el contenido del documento, no es una fuente fiable ni objetiva. Es la menos objetiva, porque puede ser manipulada por el autor, o no expresa con precisión el contenido del documento.
El título es importante porque indica la intención del autor, pero debe usarse con otras fuentes.

– El resumen

Es la representación abreviada y precisa del contenido de un documento sin interpretación ni crítica alguna por parte del autor del resumen.
Está admitida la práctica de la indización sobre resúmenes.
Ventajas:
Operación correcta siempre que el resumen sea fiable, ya que resumir es «una actuación sobre el contenido de los documentos para aminorar la abundancia de información contenida en ellos y para realzar aquellas partes del mensaje que más convienen a los usuarios»
Los conceptos principales ya están recogidos y no es necesario analizar el documento en profundidad para seleccionar los conceptos representativos.
Inconveniente: Falta de fiabilidad de la indización, siempre que los resúmenes sean de calidad dudosa.
La persona que haga el resumen de un documento se encargue también de su indización, ya que el análisis del contenido puede servir para las dos operaciones.
El encargado de hacer el resumen, haga también una indización básica, con descriptores libres, sin mucho control, que representan de forma clara el contenido de los documentos. Esta práctica es frecuente en revistas.

-Sumario

Representa, de forma esquemática, los principales aspectos de que trata un documento. Sin embargo no suele aparecer en los artículos de revista.

Introducción o exordio


Es la primera parte de un trabajo científico. Presenta los mismos inconvenientes que el título. Puede ser utilizado por el autor para presentar subjetivamente su obra.
– El cuerpo del documento
Hay partes donde se localiza la información más importante:
– Los títulos de cada capítulo
– Las introducciones y conclusiones de los principales capítulos y párrafos
– Las leyendas de ilustraciones, diagramas y tablas importantes
– las palabras y frases destacadas con una tipografía diferente
– Las conclusiones generales
El indizador siempre tenderá a consultar todas las fuentes, ya que ninguna es segura si se utiliza de forma aislada y puede llevar a indizaciones erróneas.
En el caso de documentos audiovisuales el indizador acudirá al título o al resumen, pero siempre debe acceder al documento si la información escrita es insuficiente o inexacta.
2.2.1.2 Etapa de Identificación de conceptos
2.2.1.2.1 La identificación de conceptos
Es la operación de la indización que consiste en reconocer los conceptos que representan el contenido del documento.
Uno de los problemas con que se encuentra la indización en la actualidad es la necesidad de normalizar el método de identificación y selección de conceptos.
La norma ISO 5963, da unas recomendaciones generales para la identificación de los conceptos.
Según la versión inglesa de esta norma, los indizadores deben establecer una “check list” (lista cerrada o modelo), pero no indica cómo se debe construirse.
Según la versión francesa de la norma, los indizadores deben establecer una “grille d’identification” y tampoco indica cómo se debe construir.
La norma española UNE 50-121-91 “Métodos para el análisis de documentos, determinación de su contenido y selección de los términos de indización”, a la hora de normalizar el proceso de “Identificación de los conceptos” dice: “Las instituciones… deben establecer los factores que se consideran importantes en el campo temático cubierto por el índice.
La norma ISO: «después de conocer el contenido del documento, es necesario que el indizador siga un esquema lógico, o «plantilla» de indización, que le guiará en la elección de los conceptos que describan mejor la información».
La norma francesa: «los principales conceptos a identificar pueden ser ordenados en un pequeño número de clases que cada sistema documental puede precisar conforme a la disciplina cubierta, distinguiendo las categorías a las cuales pertenecen los conceptos
En definitiva, para la identificación de los conceptos es recomendable que el indizador cuente con un esquema previo formado por una serie de categorías de conceptos. Estas categorías pueden ser facetas o temáticas.
2.2.1.2.2 Objetivos de un esquema de identificación de conceptos
1.- proporcionar unas pautas que orienten al indizador para saber que conceptos pueden ser reconocidos y seleccionados del contenido de los textos y ser susceptibles de recuperación, que el indizador sepa qué información debe extraer
2.- unificar los criterios de los indizadores, que distintas personas que indicen documentos semejantes identifiquen los mismos conceptos
3.- saber qué clase de conceptos puede ser incluida en un lenguaje de indización
4.- facilitar la recuperación, al permitir saber, en las búsquedas, los conceptos que han sido susceptibles de indización
5.- En el caso de que se elabore un lenguaje de indización, saber cómo se ordena el vocabulario
Este esquema debe usarse sólo de modo orientativo. Son los documentos los que van a imponer los conceptos que deben extraerse.
2.2.1.2.3 Elaboración de un esquema de identificación de conceptos
Deben seguirse las siguientes pautas:
1. El esquema debe estar adaptado a la disciplina, materia o ciencia que se va a indizar
2. El esquema esté adaptado a la estructura de los documentos. En la práctica es difícil de cumplir, porque el indizador encuentra documentos variados, que no presentan una estructura uniforme.
3. Para su creación puede acudirse a algunas fuentes. El uso de estas fuentes dependerá del tipo de esquema que decidamos usar, facetado o temático.
4. hacer una cata en los documentos a indizar, hacer una indización rápida de algunos documentos, con el fin de detectar posibles temas que no aparezcan en las obras de referencia tradicionales, pero que sean temas de actualidad en ese momento. Para hacer más rápida esta cata, pueden seleccionarse publicaciones donde los documentos aparezcan ya con descriptores libres.
5. Determinación de las categorías conceptuales del esquema. Los esquemas de identificación pueden estar formados por categorías facetadas; categorías temáticas; o categorías facetadas y temáticas.

5.1 Categorías facetadas

Los aspectos generales bajo los que un grupo de conceptos puede ser agrupado. Por su carácter abstracto y su número limitado son apropiadas para determinar de antemano qué conceptos deben ser indizados.
Van Slype, afirma que en todos los tesauros con los que ha trabajado ha detectado 8 facetas o según Fugman, 8 categorías de conceptos. Son los siguientes:

1.- Fenómenos:


Acciones naturales que escapan a la mano del hombre

2.- Procesos:


Acciones provocadas por el hombre

3.- Materiales:


Elementos materiales, naturales o no, sobre los que actúan los fenómenos y los procesos

4.- Organizaciones:


Entidades complejas creadas por seres vivos
5.- Seres vivos: Microorganismos
, vegetales, animales, seres humanos considerados en su esencia biológica o en su comportamiento

6.- Equipamientos:


Medios construidos por el hombre para operar sobre los materiales o sobre los fenómenos a través de procesos

7.- Propiedades:


Características ligadas a fenómenos, procesos, materiales, seres vivos o equipamientos

8.- Disciplinas:


Ramas del conocimiento.
El Grupo de Clasificación de Londres (Classification Group), propone la siguiente clasificación de estas categorías:

Entidades:


Elementos naturales
– elementos creados por el hombre
– entidades concretas
– entidades abstractas

Atributos:


Propiedades

Actividades:


Operaciones
– procesos
El número de categorías facetadas es limitado, por eso es fácil decidir qué categorías deben tenerse en cuenta para identificar los conceptos.
No es suficiente con indicar las categorías. Fugmann, se deben indicar las cualidades o atributos de cada categoría facetada.
Para la categoría materia, se deben indicar los aspectos relacionados: propiedades, forma, uso, estado físico.
La indicación de estos atributos es complicada, ya que los atributos de una categoría cambiarán dependiendo de la disciplina que se trate.
La categoría «Materiales» pueden ser atributos: propiedades, forma, uso, estado físico. La categoría “Seres Vivos” pueden ser atributos de: edad, estado, sexo, talento. La categoría “Aparatos” pueden ser atributos de: durabilidad, costo, tamaño. La categoría “Procesos” pueden ser atributos de: rapidez, terminación.

5.2 Categorías temáticas

En algunas ocasiones es necesario utilizar categorías temáticas, categorías concretas en lugar de categorías abstractas. Se usan para resaltar un aspecto que tenga especial importancia dentro de los documentos a indizar.
Presentan la ventaja de su comprensión, sin embargo no son tan amplias como las facetadas, y deben definirse con mayor precisión.
En la realidad a una faceta le corresponden varios temas: fenómenos, procesos, organización, ser vivo, materiales, equipamiento, propiedad, disciplina.
6. En la presentación del esquema de identificación de conceptos se debe dar: a) la denominación de la categoría, b) una aclaración general sobre el uso de las categorías establecidas, con el fin de definir su ámbito y aclarar su aplicación, c) en el caso de indicar los atributos, especificar dichos atributos y, d) incluir algún ejemplo ilustrativo
2.2.1.3 La selección de los términos
Como recoge la norma ISO el indizador no debe retener todos los términos de indización extraídos de un documento, sino seleccionar los que identifiquen el contenido.
En la selección influyen tres factores:
– la profundidad de la indización
– el tipo de documento y su contenido
– los posibles intereses de los usuarios
2.2.1.3.1 La profundidad de la indización
La profundidad de la indización depende:
1. del propio esquema de identificación de conceptos, en el que se indicarán con mayor o menor detalle los conceptos que se deben extraer de los documentos
2. Del grado de especialización del centro de información.
Una biblioteca pública no necesita profundizar demasiado en la indización y tendrá suficiente con una indización general. En una biblioteca universitaria se necesitará profundizar más en las materias. La indización será más profunda en los centros de información especializados, donde se desciende de las materias a los conceptos, y al uso de tesauros.
3. Del sistema de indización. Cada biblioteca o centro de información necesita un sistema específico. Los sistemas de indización inciden en la profundidad de la misma.
Los sistemas que permiten más profundidad en la indización son, de mayor a menor:
a) descriptores libres y palabras-clave
b) descriptores controlados (tesauros)
c) encabezamientos de materia y clasificaciones
Los tres primeros permiten representar conceptos, los dos últimos sólo materias.
Cada sistema permite extraer un número determinado de conceptos, de media se pueden considerar los siguientes términos de indización:
palabras-clave — número de palabras no vacías
Descriptores libres – decena
Descriptores controlados –de 8 a 12
Encabezamientos de materia –de 1 a 3
Clasificaciones (CDU) –de 1 a 3

Deja un comentario