26 Sep

Estructura de un fichero

Un fichero es una estructura de datos que reside en memoria secundaria. Está formado por un conjunto de información estructurada en unidades de acceso denominados registros lógicos, todos con igual estructura.

Registro lógico

Es cada uno de los componentes de un archivo que poseen una cierta estructura idéntica para todos ellos y con el objetivo de almacenar la información referente a un tema general de archivo. Constituye la mínima unidad de acceso, puesto que cada vez que se lee un fichero se lee un registro lógico y se transfiere al buffer de memoria central reservado para el archivo. Cuando se graba en un fichero se graba en un registro lógico.

Campo de datos

Es un conjunto de caracteres que representa la mínima información a la que se puede hacer referencia en un tratamiento. Es cada uno de los datos que constituye un registro lógico.

Campo clave

Es el campo de un registro lógico cuyo valor sirve para identificar el registro al que pertenece. Se utiliza para localizar un registro concreto dentro del fichero.

Factor de bloqueo

Es el número de registros lógicos que hay en un registro físico.

Modelo de datos

Conjunto de conceptos, reglas y convenciones que nos permiten describir y manipular datos de un cierto mundo real que deseamos almacenar en una base de datos.

Propiedades

  • Estática
    • Elementos permitidos: entidades, relaciones, interrelaciones, atributos, dominios
    • Elementos no permitidos: 2-tuplas no pueden ser iguales, semántica, integridad
  • Dinámica
    • Operaciones que se pueden realizar: SQL

Definición de relación

Para definirla adecuadamente es necesario distinguir 2 conceptos de relación: esquema o intención y extensión de la relación.

Intención o esquema: conjunto de n pares de atributos, dominio donde n es el grado del esquema de la relación. Es la parte definitoria y relativa estática de la relación.

Extensión: conjunto de n tuplas donde cada tupla es un conjunto de n pares atributo: valor, donde el valor pertenece a un dominio asociado al atributo. El número de tuplas es la cardinalidad.

Redundancia, consistencia y falta de integridad

.

Registros sinónimos

Dos registros con la misma clave en los sistemas de información.

Dominio y atributo

Un dominio D es un conjunto finito de valores homogéneos y atómicos V1, V2, caracterizado por un nombre. Decimos valores homogéneos porque son todos del mismo tipo, y atómicos porque son indivisibles en lo que al modelo se refiere, es decir, si se descompusiesen, perderían la semántica a ellos asociada. Los dominios pueden definirse por intención o por extensión.



Tipos de archivos según su organización

Indexada

Área primaria: en esta zona se graban los registros cuando se crea el fichero y tienen que estar ordenados de forma ascendente por clave. Esta zona se divide en segmentos, cada uno de los cuales almacena un cierto número de registros consecutivos. El acceso a cada uno de los segmentos es directo y el acceso a los registros dentro de cada segmento es secuencial.

Área de índices: tiene la estructura de un archivo de organización secuencial con 2 campos por registro. Uno de los campos contiene la clave del último registro de cada segmento. En el otro campo se encuentra la dirección de comienzo de cada uno de los segmentos del área primaria.

Área de excedentes: esta es una zona que se encuentra vacía en el momento de la creación del fichero. Sirve para almacenar registros cuando se actualiza el fichero.

Secuencial: los registros se colocan en el soporte según el orden de entrada. Tiene ventajas a la hora de efectuar una tasa de consultas elevadas, es el acceso más rápido en este caso. Sin embargo, en tasas de consultas bajas utilizar este tipo de acceso no sería recomendable, sería un inconveniente. En este tipo de acceso el orden lógico y físico no tienen por qué coincidir. Solo permite el acceso secuencial. Otra ventaja: aprovechamiento del soporte. Otro inconveniente: necesidad de duplicar el fichero cuando hay que hacer actualizaciones.

Relativa: la dirección de cada registro sobre el soporte se obtiene aplicando a la clave del registro un algoritmo de transformación. El algoritmo de transformación lo decide el programador en función de las características que presenten las claves de un fichero concreto. Si la clave no precisa ninguna transformación para corresponderse con una posición determinada del soporte, la organización se denomina directa, en caso contrario: aleatoria. El problema de la organización aleatoria es que al aplicar el algoritmo pueden quedar huecos, o ocurrir sinónimos (dos registros con la misma clave).

Deja un comentario