07 Jun

0.Introducción: los lenguajes documentales en la cadena documental


Desde mediados del S. XX se produce un incremento de la documentación en todas las áreas del conocimiento. 200 millones de títulos publicados y un millón de títulos de revistas científicas. Este aumento conocido como la explosión documental dificulta la recuperación de la información.
Ningún centro que pretenda organizar esta documentación logrará alcanzar sus objetivos sin unos instrumentos, los lenguajes documentales, de control que faciliten y unifiquen el almacenamiento y posterior recuperación de la información.
El uso de los lenguajes documentales se sitúa, en el proceso de almacenamiento, en la operación del análisis documental de contenido y es el instrumento utilizado en la operación de indizar.

1.Las formas de representación del contenido: tipos de indización


Definición de indización “es la operación que consiste en representar el contenido de un documento, mediante términos o signos que especifican los temas que trata, con el fin de ayudar a su almacenamiento y posterior recuperación”
Existen tres formas de indizar, que dan lugar a los tres tipos principales de indización:
1.extrayendo los términos de indización del documento tal como aparecen:
indización por extracción que le corresponde el sistema preciso de palabras-claves.

2.extrayendo los términos de indización del documento o asignando nuevos términos del lenguaje corriente:
indización libre que le corresponde el sistema preciso de los descriptores libres.

3.asignando los términos de indización de una lista de términos de indización preexistente:
indización por asignación que le corresponde los sistemas precisos de Descriptores (tesauros), Encabezamientos de materia y los Sistemas de clasificación.

Las palabras-clave, descriptores libres, descriptores y encabezamientos de materia, designan el contenido de los documentos por medio de palabras o términos dando lugar a la llamada indización alfabética.
Las clasificaciones, designan el contenido de los documentos por medio de designar una clase o un sistema, dando lugar a la indización sistemática.

2.Lenguaje natural, lenguaje de indización y lenguaje documental


El lenguaje natural es el lenguaje humano, cuyas reglas se han desarrollado con el uso. Los lenguajes de indización son lenguajes artificiales, es decir lenguajes creados con un fin preciso, su finalidad es la de permitir la representación del contenido de los documentos en el proceso de indización.
Un lenguaje de indización es el “Conjunto de signos o términos utilizados en la representación del contenido de los documentos en un sistema de almacenamiento y recuperación de la información”.
Dependiendo del sistema de indización será preciso utilizar un lenguaje de indización determinado. La indización mediante descriptores libres y palabras clave se hace con términos del leguaje libre. Los lenguajes libres consisten en utilizar términos del lenguaje natural que figuran en el documento original, sometidos a un mínimo control de forma. Los lenguajes libres son: descriptores libres y las palabras-claves.
La indización mediante descriptores, encabezamientos de materia o códigos de clasificación, exige, el uso de un lenguaje controlado.
Los términos utilizados en la indización son términos procedentes de un lenguaje documental previamente establecido y que se someten a un triple control: control morfológico o de forma, control semántico o de significado y control sintáctico.
Los lenguajes documentales son un tipo de lenguaje de indización, caracterizado por el máximo control sobre los términos utilizados en el índice. Los lenguajes documentales son: los encabezamientos de materia, los tesauros y las clasificaciones.

3.Los lenguajes documentales


Condensan y simplifican el lenguaje natural, empleando de éste un pequeña parte del léxico. Surgieron para hacer frente a la ambigüedad que se le achacaba al lenguaje natural. Su evaluación está en relación con el cuerpo documental y la comunidad de usuarios a la que sirve.

3.1.Definición


Un lenguaje documental es un léxico o vocabulario artificial (naturaleza)
y controlado, compuesto por una lista de términos normalizados, que se usa para representar la información contenida en un conjunto de documentos (función)
 con el fin de facilitar su almacenamiento y posterior recuperación.

3.1.1.El lenguaje documental como lenguaje


Está formado por:

A) símbolos


Son los términos de indización (expresiones del lenguaje corriente que obtienen su valor semántico a través de la normalización) o las notaciones de clasificación (unidades que representan otra cosa diferente a ellas mismas).
Dependiendo del tipo de lenguaje son predominantemente alfabéticos (Lista de Encabezamientos de Materia; Tesauros y algunas clasificaciones) o numéricos como la Clasificación Dewey o la CDU).
En los sistemas alfabéticos, los términos de indización son expresiones del lenguaje corriente que obtienen su valor semántico o significado exacto gracias a la normalización.
Los términos provienen de la información contenida en la documentación especializada, no necesariamente científica.
El proceso de establecimiento de los términos es el siguiente:
1.Se seleccionan1 los conceptos que deben formar parte del lenguaje documental y deben responder al léxico especializado de los documentos, variarán o se estabilizarán cuando el léxico especializado varíe o se estabilice.
2.Se normaliza la forma de los conceptos extraídos dando lugar a términos precisos. Estos términos se usan para acceder a la masa documental que sobrepasa la capacidad de acceso de los usuarios. Es decir son el elemento de orden en el catálogo alfabético de materias.
La extracción y normalización de los conceptos se complica por el incremento de los documentos y porque los términos representativos de los conceptos deben responder al léxico especializado de los documentos y debe variar o estabilizarse cuando este varíe o se estabilice.

Las relaciones entre los términos

El lenguaje documental no sólo está compuesto por una lista de términos, sino que los términos están relacionados. Las relaciones entre los términos dinamizan esos vocabularios y les dan categoría de lenguaje.
Dependiendo del tipo de lenguaje documental el grado de relación entre los términos varía.
Los encabezamientos de materia tienen unas relaciones más sencillas que los tesauros. De los tres tipos de relaciones semánticas posibles en las listas de encabezamientos de materia sólo se expresa explícitamente la relación de equivalencia por medio de las referencias de envío: por las abreviaturas “V.”: que dirige al término que se debe utilizar y, “U.p.” que precede al término que no se puede utilizar. Las relaciones jerárquicas por la abreviaturass “V.a.”, para indicar el término genérico y las relaciones asociativas por la abreviatura “R.e.” para indicar el término específico, se indican conjuntamente por medio de las referencias de relación.
En los tesauros las relaciones son más complejas y están más estructuradas. Tienen tres tipos de relaciones:
jerárquicas (T.g. -término genérico- T.e. -término específico-), asociativas (T.r. -Término relacionado-) y de equivalencia (U. -úsese- y Usado por -U.p.).
Los recursos de las clasificaciones en este sentido son muy escasos ya que las funciones de todas estas relaciones las desempeña la propia estructura lógica de la clasificación.

B) sintaxis


La razón que justifica el empleo del término lenguaje es que la mayoría de los lenguajes documentales tienen una sintaxis: un conjunto de reglas para la combinación de los símbolos con el fin de expresar una idea.
En la Lista de Encabezamientos de Materia para las Bibliotecas públicas la sintaxis obliga a usar los nombres en negrita como encabezamiento principal, impidiendo que se usen como subencabezamiento.
La finalidad de este control es normalizar la estructura de los mensajes o frases documentales para que la información se almacene y se recupere de la misma forma.

Deja un comentario