0% encontró este documento útil (0 votos)

85 vistas11 páginas

Almacenamiento y Organización de Datos

Este documento describe las diferentes formas de organizar y almacenar registros de datos en un sistema de base de datos. Explica la jerarquía de memoria y dispositivos de almacenamiento, con almacenamiento primario como RAM y almacenamiento secundario como discos. Los datos de una base de datos generalmente se almacenan en discos debido a su gran tamaño y necesidad de persistencia. Los registros se organizan y almacenan en ficheros, los cuales pueden ser de montículo, ordenados o de direccionamiento calculado. También se usan

Cargado por

carlos

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOC, PDF, TXT o lee en línea desde Scribd

Temas abordados

tecnologías RAID,
almacenamiento secundario,
ficheros,
técnica ISAM,
almacenamiento de datos,
asignación de bloques,
índices dispersos,
técnicas de almacenamiento,
longitud de registros,
árboles B+

0% encontró este documento útil (0 votos)

85 vistas11 páginas

Almacenamiento y Organización de Datos

Cargado por

carlos

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOC, PDF, TXT o lee en línea desde Scribd

Temas abordados

tecnologías RAID,
almacenamiento secundario,
ficheros,
técnica ISAM,
almacenamiento de datos,
asignación de bloques,
índices dispersos,
técnicas de almacenamiento,
longitud de registros,
árboles B+

UNIVERSIDAD TECNOLÓGICA NACIONAL

FACULTAD REGIONAL RESISTENCIA

INGENIERÍA EN SISTEMAS
DE INFORMACIÓN

GESTIÓN DE DATOS

APUNTES TEÓRICOS

Unidad 6: Almacenamiento de Registros y

organización de ficheros primarios

Profesor Teoría: Ing. Carolina Orcola

Jefe de T. P.: Ing. Luis Eiman
Auxiliar de T.P.: Juan Carlos Fernandez
Universidad Tecnológica Nacional Ingeniería en Sistemas de Información
Facultad Regional Resistencia GESTIÓN DE DATOS

INTRODUCCIÓN.................................................................................................................................................................3
Jerarquías de memoria y dispositivos de almacenamiento.........................................................................................3
Almacenamiento de base de datos..............................................................................................................................3
DISPOSITIVOS DE ALMACENAMIENTO SECUNDARIO.........................................................................................................4
ACCESO PARALELO AL DISCO MEDIANTE EL USO DE TECNOLOGÍAS RAID.....................................................................4
ALMACENAMIENTO INTERMEDIO DE BLOQUES.................................................................................................................4
GRABACIÓN DE LOS REGISTROS DE UN FICHERO EN DISCO..............................................................................................5
Registros y tipos de registros......................................................................................................................................5
Ficheros, registros de longitud fija y registros de longitud variable..........................................................................5
Grabación de registros en bloques.............................................................................................................................5
Asignación en el disco de los bloques de un fichero...................................................................................................5
OPERACIONES CON FICHEROS...........................................................................................................................................6
ESTRUCTURAS DE ÍNDICE PARA FICHEROS.......................................................................................................................7
Índices de un solo nivel...............................................................................................................................................7
Índices multinivel........................................................................................................................................................9
Índices multinivel dinámicos basados en árboles B+...............................................................................................10
Índices sobre claves múltiples...................................................................................................................................11

Ing. Juan Carlos Fernandez Año 2007 Página 2

Universidad Tecnológica Nacional Ingeniería en Sistemas de Información
Facultad Regional Resistencia GESTIÓN DE DATOS

Introducción
La colección de datos que conforma una base de datos debe almacenarse físicamente en algún
medio de almacenamiento de la computadora. Estos medios de almacenamiento forman una
jerarquía que incluye dos categorías principales:
 Almacenamiento primario: incluye medios de almacenamiento sobre los cuales la CPU
puede operar directamente, como la memoria principal y las memorias caché. Ofrecen
acceso rápido a los datos, aunque su capacidad de almacenamiento es limitada.
 Almacenamiento secundario: incluye discos magnéticos, discos ópticos y cintas. Estos
generalmente tienen mayor capacidad, cuestan menos y ofrecen acceso más lento a los
datos que los dispositivos de almacenamiento secundario. La CPU debe copiar
previamente los datos del almacenamiento secundario al primario para poder operar con
ellos.

Jerarquías de memoria y dispositivos de almacenamiento

Los medios de almacenamiento presentan una relación entre los factores precio y velocidad de
acceso a los datos - capacidad de almacenamiento, teniendo generalmente las de mayor precio
más velocidad y menor capacidad.
La capacidad de almacenamiento se mide en kilobytes, megabytes, gigabytes y terabytes.
En la categoría de almacenamiento primario se encuentran los niveles:
- Memorias caché en el nivel más caro. Es una RAM estática utilizada por la CPU para
aumentar la velocidad de ejecución de los programas.
- DRAM o RAM dinámica, conocida como memoria principal, que proporciona a la CPU la
principal área de trabajo. Su ventaja es el bajo costo y su desventaja la volatilidad y menor
velocidad que la RAM estática.
En la categoría de almacenamiento secundario se encuentran:
- Discos magnéticos.
- Dispositivos CD-ROM. Almacenan datos ópticamente y son leídos mediante un láser. Sus
datos son pregrabados y no pueden ser sobrescritos. Su capacidad supera apenas el
medio gigabyte. También los DVD, con una capacidad mucho mayor (entre 4 y 15
gigabaytes), entran en este nivel.
- Cintas, en el nivel mas barato de la jerarquía. Los juke-box de cintas contienen un banco
de cintas catalogadas y que pueden ser cargadas automáticamente en las unidades de
cinta, llegando a contener varios terabytes.

Almacenamiento de base de datos

Las bases de datos almacenan grandes cantidades de datos que deben persistir por periodos
largos, lo que contrasta con la noción de estructuras de datos transitorias, que persisten sólo por
el tiempo que dura la ejecución del programa. La mayoría de las bases de datos se almacenan en
el almacenamiento secundario del disco magnético debido a:
 Son demasiado grandes como para caber completas en la memoria principal.
 La pérdida permanente de datos tiene una menor probabilidad de ocurrencia en el
almacenamiento secundario del disco que en el primario. Por esto se llama a los

Ing. Juan Carlos Fernandez Año 2007 Página 3

Universidad Tecnológica Nacional Ingeniería en Sistemas de Información
Facultad Regional Resistencia GESTIÓN DE DATOS

dispositivos de almacenamiento secundario almacenamiento no volátil, en contraste con el

almacenamiento volátil de los dispositivos de almacenamiento primario.
 El costo de almacenamiento por unidad de datos es menor en el caso de los discos que en
el del almacenamiento primario.
Las cintas magnéticas se usan a menudo para respaldar las bases de datos, debido a que su
costo es menor aún que el de los discos, pero a la vez su velocidad de acceso es mucho más
lenta y se encuentran off-line, es decir que para acceder a los datos es necesario cargar
previamente la cinta.
Las técnicas usadas para almacenar grandes cantidades de datos estructurados en un disco son
importantes para los diseñadores de bases de datos. Generalmente los SGBD ofrecen distintas
alternativas para organizar los datos, y el proceso de diseño físico de bases de datos implica
elegir de entre estas opciones de acuerdo a cuál se adapte mejor a los requerimientos de la
aplicación.
En general, las aplicaciones sólo requieren una pequeña porción de la base de datos en un
momento determinado, por lo que en ese momento habrá que localizarla en el disco y copiarla a la
memoria principal para poder procesarla, y luego volver a escribirla al disco si es que se
modificaron los datos. Estos datos están organizados en el disco en ficheros de registros. Cada
registro es una colección de datos que puede interpretarse como hechos acerca de entidades, sus
atributos y sus relaciones. Los registros deben almacenarse en el disco de manera tal que cuando
se los requiera puedan ser localizados eficientemente.
Hay varias organizaciones primarias de ficheros que determinan la forma en que los registros
de un fichero se colocan físicamente en el disco y cómo se puede acceder a éstos.
 Los ficheros de montículo (o ficheros no ordenados), colocan los registros en el disco sin
un orden específico y añaden los nuevos registros al final.
 Los ficheros ordenados (o secuenciales) mantienen los registros ordenados de acuerdo al
valor de un cierto campo clave.
 Los ficheros de direccionamiento calculado, técnica también conocida como hashing,
utilizan una función de direccionamiento calculado (función hash) aplicada a un campo
específico (clave de direccionamiento calculado) para determinar la colocación de los
registros en el disco.
Otras organizaciones primarias de ficheros, como los árboles B, utilizan estructuras de árbol. La
organización secundaria o estructura de acceso auxiliar permite que los accesos a los
registros de un fichero basado en campos alternativos sean más eficientes que los que han sido
utilizados para la organización primaria.

Dispositivos de almacenamiento secundario

Acceso paralelo al disco mediante el uso de tecnologías RAID

Almacenamiento intermedio de bloques

Cuando es preciso transferir varios bloques del disco a la memoria principal y se conocen todas
las direcciones de bloque, es posible reservar varios búferes en la memoria principal para agilizar
la transferencia. Mientras se lee o escribe un búfer, la CPU puede procesar los datos de otro,
debido a que se cuenta con un procesador independiente de E/S del disco (controlador), que

Ing. Juan Carlos Fernandez Año 2007 Página 4

Universidad Tecnológica Nacional Ingeniería en Sistemas de Información
Facultad Regional Resistencia GESTIÓN DE DATOS

puede transferir un bloque de datos entre la memoria y el disco independientemente del proceso
de la CPU y en paralelo con ésta.
Cuando el tiempo necesario para procesar un bloque de disco en la memoria es menor que el
tiempo necesario para leer el siguiente bloque y llenar un búfer, la lectura y el procesamiento
pueden realizarse en paralelo. La CPU puede empezar a procesar un bloque una vez completada
su transferencia a la memoria principal; al mismo tiempo, el controlador del disco puede estar
leyendo y transfiriendo el siguiente bloque a un búfer diferente. Esta técnica se conoce como de
doble búfer.

Grabación de los registros de un fichero en disco

Registros y tipos de registros

Los datos se almacenan casi siempre en forma de registros, cada uno de los cuales consta de
una colección de valores o elementos de datos relacionados, donde cada valor está formado de
uno o más bytes y corresponde a un determinado campo del registro. En general, los registros
describen entidades y sus atributos.
Una colección de nombres de campos y sus tipos correspondientes constituye una definición de
tipo de registro o formato de registro. El tipo de datos asociado a cada campo especifica el
tipo de valores que el campo puede tomar, el cual es casi siempre alguno de los tipos de datos
estándar utilizados en programación.

Ficheros, registros de longitud fija y registros de longitud variable

Un fichero es una secuencia de registros. Si todos los registros del fichero tienen exactamente el
mismo tamaño se dice que éste está compuesto de registros de longitud fija. Si diferentes
registros tienen tamaños distintos, los registros que componen el fichero son de longitud
variable.
La longitud de los registros puede ser variable por:
 Los registros del fichero son todos del mismo tipo, pero uno o más campos son de tamaño
variable.
 Los registros del fichero son todos del mismo tipo, pero uno o más de los campos pueden
tener múltiples valores en registros individuales.
 Los registros del fichero son todos del mismo tipo, pero uno o más de los campos son
opcionales.
 El fichero contiene registros de diferentes tipos y por lo tanto de tamaño variable.

Grabación de registros en bloques

Los registros de un fichero se deben asignar a bloques del disco porque el bloque es la unidad de
transferencia de datos entre el disco y la memoria. Si el tamaño del bloque es mayor que el del
registro, cada bloque contendrá numerosos registros. Inusualmente algunos ficheros pueden tener
registros grandes que no caben en un bloque.

Asignación en el disco de los bloques de un fichero

Algunas técnicas estándar para asignar bloques en disco son:

Ing. Juan Carlos Fernandez Año 2007 Página 5

Universidad Tecnológica Nacional Ingeniería en Sistemas de Información
Facultad Regional Resistencia GESTIÓN DE DATOS

 Asignación contigua. Los registros del fichero se asignan a bloques consecutivos del
disco, agilizando notablemente la lectura de todo el fichero si se emplea doble búfer, pero
dificultando la expansión del fichero.
 Asignación enlazada. Cada bloque del fichero contiene un puntero al siguiente bloque de
ese fichero, facilitando así la expansión del fichero pero volviendo más lenta su lectura.
 Segmentos de fichero. Se asignan grupos de bloques de disco consecutivos y luego se
enlazan los grupos.
 Asignación indexada. Uno o más bloques de índice contienen punteros a los bloques de
fichero actuales.

Operaciones con ficheros

El siguiente modelo de costo permite estimar el costo (en términos de tiempo de ejecución) de
diferentes operaciones de bases de datos. Se tiene:
- hay B bloques con R registros por bloque;
- el tiempo promedio para leer o escribir un bloque a disco es D;
- el tiempo promedio para procesar un registro (por ejemplo, comprar el valor de un campo
con una constante de selección) es C;
- en la organización de ficheros de direccionamiento calculado se utiliza una función hash
para mapear un registro a un rango de números, la cual requiere un tiempo H para ser
aplicada a cada registro.
Tomando valores típicos, como D = 25 milisegundos, C y H entre 1 y 10 microsegundos, se
espera controlar el costo de E/S de bloques de disco, ya que es mucho más significativo.
Un objetivo en bases de datos es comprender la importancia de la elección de una organización
de ficheros apropiada. Para poder realizar un análisis comparativo se toman las siguientes
operaciones simples:
 Scan: trata todos los registros en el fichero. Los bloques en el fichero deben ser llevadas
del disco al búfer.
 Búsqueda con selección de igualdad: trata todos los registros que satisfacen una
selección de igualdad. Deben tratarse los bloques de disco que contienen los registros
calificados, y a su vez obtenerse dichos registros dentro de cada bloque.
 Búsqueda con selección de rango: trata todos los registros que satisfacen una selección
de rango.
 Inserción: inserta un registro dado en un fichero. Se debe identificar el bloque en el que
debe insertarse el registro, obtenerlo del disco, modificarlo para incluir el nuevo registro y
volverlo a escribir al disco.
 Borrado: borra un registro especificado. Se debe identificar el bloque que contiene el
registro, obtenerlo del disco, modificarlo y volverlo a escribir.

Comparación según las organizaciones de ficheros:

Para la comparación se utilizan las organizaciones de: fichero de montículo, ordenado y
direccionamiento calculado (hash). Teniendo en cuenta el modelo de costo y las operaciones
presentados, se obtiene la siguiente tabla analítica:

Ing. Juan Carlos Fernandez Año 2007 Página 6

Universidad Tecnológica Nacional Ingeniería en Sistemas de Información
Facultad Regional Resistencia GESTIÓN DE DATOS

Tipo de fichero Scan Búsqueda de Búsqueda de Inserción Borrado

igualdad rango
Montículo BD 0.5BD BD 2D Búsqueda + D
Ordenado BD Dlog2B Dlog2B + # Búsqueda + BD Búsqueda + BD
coincidencias
Hash 1.25BD D 1.25BD 2D Búsqueda + D

Estructuras de índice para ficheros

Índice de un fichero es una estructura auxiliar diseñada para realizar más rápidamente las
operaciones que no son soportadas eficientemente por la organización básica de registros en
dicho fichero. El índice puede ser visto como una colección de entradas de datos, con una
manera eficiente de localizar todas las entradas de datos con clave de búsqueda k. Cada una de
tales entradas (k*) contiene información suficiente para recuperar registros de datos con valor k
para la clave de búsqueda.

Alternativas para entradas de datos en un índice:

Una entrada de datos k* permite recuperar uno o más registros de datos con clave de valor k. Se
consideran tres alternativas principales:
1. Una entrada de datos k* es un registro de datos actual (con clave de búsqueda k).
2. Una entrada de datos es un par (k, rid), donde rid es el identificador de registro de un
registro de datos con clave de búsqueda k.
3. Una entrada de datos es un par (k, rid-list), donde rid-list es una lista de identificadores de
registro de registros de datos con clave de búsqueda k.
Si un índice utiliza la Alternativa (1), no será necesario almacenar los registros de datos
separadamente.
Las Alternativas (2) y (3), las cuales contienen entradas de datos que apuntan a registros de
datos, son independientes de la organización de fichero que utiliza el fichero indexado. La
Alternativa (3) ofrece mejor utilización de espacio que la (2), pero las entradas de datos son de
longitud variable, dependiendo del número de registros de datos con un valor de clave de
búsqueda.
Si se quiere construir un índice sobre una colección de registros de datos, a lo sumo uno de ellos
podrá usar la Alternativa (1).

Índices de un solo nivel

Índices agrupados versus no agrupados

Cuando un fichero se encuentra organizado de manera tal que el ordenamiento de los registros de
datos es el mismo o similar al del ordenamiento de las entradas de datos en algún índice, se dice
que el índice es agrupado.
Los índices que mantienen sus entradas de datos ordenadas por la clave de búsqueda usan una
colección de entradas de índice, organizadas en una estructura de árbol, para guiar la búsqueda
de las entradas de datos.

Ing. Juan Carlos Fernandez Año 2007 Página 7

Universidad Tecnológica Nacional Ingeniería en Sistemas de Información
Facultad Regional Resistencia GESTIÓN DE DATOS

Entradas de
índice

(Búsqueda
directa para las
dentradas de
datos)
Fichero
índice

Entradas
de datos

Fichero
de
datos

Índice agrupado usando la Alternativa (2)

Un fichero de datos puede estar agrupado en a lo sumo una clave de búsqueda. Un índice que no
está agrupado se llama índice no agrupado: se pueden tener varios índices no agrupados sobre
un archivo de datos.

Entradas de
índice

(Búsqueda
directa para las
dentradas de
datos) Fichero
índice

Entradas
de datos

Fichero
de
datos

Índice no agrupado usando la Alternativa (2)

Índices densos versus dispersos

Un índice es denso si contiene al menos una entrada de datos por cada valor de la clave de
búsqueda que aparece en un registro. Un índice disperso o no denso contiene una entrada por
cada bloque de registros en el fichero de datos.

Ing. Juan Carlos Fernandez Año 2007 Página 8

Universidad Tecnológica Nacional Ingeniería en Sistemas de Información
Facultad Regional Resistencia GESTIÓN DE DATOS

Ayala, 25, 300

Benítez, 33, 400 22
Burgos, 30, 200 25
Ayala 30
Cáceres Cáceres, 50, 500 33
Sánchez Dorrego, 22, 600
Fabri, 40, 600 40
44
Sánchez, 44, 300 44
Tilger, 44, 500 50

Índice disperso Índice denso

DATOS
sobre nombre sobre edad

Índices primarios y secundarios

Índice primario es un índice sobre un conjunto de campos que incluyen la clave primaria. Si un
índice no es primario, se lo llama secundario.
Se dice que dos entradas de datos están duplicadas si tienen el mismo valor para el campo de la
clave de búsqueda asociada con el índice. Un índice primario está garantizado que no contendrá
duplicados, pero un índice sobre otros campos puede contener duplicados. Si se sabe que no
existen duplicados, el índice se llama único.

Índices multinivel

Método de Acceso Secuencial Indexado (ISAM):

Para entender el fundamento de la técnica ISAM es útil comenzar con un fichero ordenado simple.
Consideremos un fichero de registros de Alumnos ordenado por promedio. Para responder a una
selección de rango como “Encontrar todos los alumnos con un promedio superior a 7,00”, se debe
identificar el primero de tales alumnos mediante una búsqueda binaria del fichero y luego
recorrerlo a partir de ese punto. Si el fichero es grande, esta búsqueda puede resultar cara. Se
puede mejorar este método.
Una idea es crear un segundo fichero (índice) con un registro por cada bloque en el fichero
original, de la forma (primera clave del bloque, puntero a bloque), también ordenado por el atributo
clave (promedio).

Ing. Juan Carlos Fernandez Año 2007 Página 9

Universidad Tecnológica Nacional Ingeniería en Sistemas de Información
Facultad Regional Resistencia GESTIÓN DE DATOS

entrada
de índice

P0 K1 P1 K2 P2 ... Km Pm

Formato de un bloque de índice

Se puede realizar una búsqueda binaria del fichero índice para identificar el bloque que contiene el
primer valor de clave que satisface la selección de rango, y seguir el puntero al bloque que
contiene el primer registro de datos con ese valor de clave. Luego se recorre el fichero de datos
secuencialmente para obtener otros registros calificados.

k1 k2 kN Fichero
índice

Fichero
Bloque 1 Bloque 2 Bloque 3 Bloque N
de datos

Estructura de índice de un nivel

El fichero índice propuesto es probablemente mucho más pequeño que el fichero de datos.
Además una búsqueda binaria será mucho más rápida en el fichero índice que en el de datos. Sin
embargo, esta búsqueda sobre el fichero índice podría ser aún cara, y el tamaño del fichero es
aún lo suficientemente grande para hacer caras las inserciones y borrados.
El tamaño potencialmente grande del fichero índice motiva la idea de ISAM: aplicar el paso previo
de la construcción de un fichero auxiliar sobre el fichero índice y así recursivamente hasta que el
fichero auxiliar final quepa en un bloque. La repetida construcción de un índice de un nivel
conduce a una estructura arbórea. La estructura ISAM es completamente estática y por lo tanto
facilita optimizaciones de bajo nivel.
Cada nodo del árbol ISAM es un bloque de disco, y todos los datos residen en los bloques hoja.

Índices multinivel dinámicos basados en árboles B+

La estructura de búsqueda de árbol B+, ampliamente usada en la práctica, es un árbol balanceado
en el cual los nodos internos dirigen la búsqueda y los nodos hojas contienen las entradas de
datos. Debido a que la estructura de árbol crece y decrece dinámicamente no es factible ubicar los
bloques hoja secuencialmente. Con el objeto de recuperar los bloques hoja eficientemente, se los
enlaza usando punteros a bloques. Mediante la organización de éstos en una lista doblemente
enlazada, se puede recorrer fácilmente la secuencia de bloques hoja (conjunto secuencia) en
ambas direcciones.
Los árboles B+ tienen las siguientes características principales:
 Las operaciones (inserción, borrado) sobre el árbol la mantienen balanceado.
 Está garantizada una ocupación mínima del 50% para cada nodo excepto el raíz mediante
la implementación de ciertos algoritmos.

Ing. Juan Carlos Fernandez Año 2007 Página 10

Universidad Tecnológica Nacional Ingeniería en Sistemas de Información
Facultad Regional Resistencia GESTIÓN DE DATOS

 La búsqueda de un registro requiere solamente atravesar el árbol desde la raíz hasta la

hoja apropiada. La longitud del camino desde la raíz hasta una hoja (cualquiera, ya que el
árbol está balanceado) será la altura del árbol.

Índices sobre claves múltiples

La clave de búsqueda de un índice puede contener varios campos; tales claves se llaman claves
múltiples, compuestas o concatenadas.
<edad, sal> <edad>

11,80 Indice 11
Indice
12,10 12
nombre edad sal
12,20 12

13,75 bob 12 10 13

cal 11 80

<sal, edad> joe 12 20 <sal>

10,12 sue 13 75 10

20,12 20
DATOS
75,13 Indice 75
Indice
80,11 80

Índices de clave compuesta

Ing. Juan Carlos Fernandez Año 2007 Página 11

Common questions

Con tecnología de IA

Magnetic disks, used as secondary storage for databases, offer advantages such as larger capacity and lower cost per unit of data compared to primary storage. They are non-volatile, reducing the risk of data loss compared to volatile primary storage like RAM. However, accessing data from magnetic disks is slower than from primary storage since data must be transferred from disks to the primary storage for processing .

Hashing applies a hash function to a specific field of a record, producing a number that determines the physical location of the record on the disk. This method allows direct access to records, making data retrieval efficient for equality searches since records can be accessed in constant time, assuming minimal collisions. However, the efficiency can decrease with increased collisions, impacting retrieval speed and requiring strategies like bucket hashing or open-address hashing to manage collisions .

Caching, part of primary storage, is a high-speed storage mechanism that provides faster data access by temporarily storing frequently accessed data. It reduces the time needed to access data from the main memory by keeping a copy in a smaller, faster cache memory. The CPU can access this cache faster than data in DRAM, thus improving the overall system performance and execution speed. Despite its benefits, cache memory is volatile and has limited storage capacity .

RAID (Redundant Array of Independent Disks) enhances disk storage performance by combining multiple hard drives into a single unit to improve data redundancy and performance. It allows parallel disk access, which increases read/write speeds and provides data protection against disk failures. Different RAID levels offer varying balances between performance, storage efficiency, and fault tolerance .

Intermediate block storage uses buffering techniques to optimize data transfer by allowing simultaneous read/write operations. As data blocks are transferred from disk to main memory, buffers are used where the CPU processes one buffer's data while additional data is read into another buffer in parallel. This technique minimizes idle CPU time and bridge the speed disparity between slow disks and fast CPU processing, enhancing the throughput and efficiency of data transfer processes .

Choosing an appropriate file organization method critically influences database performance. Different methods optimize specific operations: heap files are efficient for bulk load and batch operations, ordered files suit range queries, and hash files improve direct access speed. Incorrect choice can lead to inefficiencies, such as slow query processing or high data maintenance costs. Therefore, it is vital to analyze the access patterns, query types, and operational requirements before settling on a file organization to ensure rapid and cost-effective database operations .

Magnetic disks, characterized by their high capacity and low cost, are ideal for use in databases that require frequent read/write access and need storage persistence. In contrast, CDs are more suited for data that don't require regular updating due to their slow write speeds and limited overwrite ability. Databases leveraging magnetic disks benefit from the flexibility and scalability necessary for dynamic data architectures. Thus, the choice of storage media impacts database performance, accessibility, and longevity .

Multi-level indexing involves creating an index of an index, forming a hierarchy that reduces the time to locate data. The primary-level index points to blocks of data, while the secondary-level index points to blocks in the primary index. This methodology significantly speeds up access time by minimizing the number of comparisons and disk accesses needed to find data compared to a single-layer index, making this approach beneficial for large databases where quick access to records is crucial .

Dense indexes contain an entry for every record in a database file, allowing direct access to any record by its key value. Sparse indexes, in contrast, have entries for only some of the records, typically one entry per data block. This results in smaller index files but requires additional steps to locate specific records, as the search must first identify the nearest indexed key and then scan sequentially through the data block. Dense indexes are more space-consumptive but faster for direct searches, whereas sparse indexes balance space efficiency and access speed .

Heap files, while unordered, offer simplicity and are efficient for insertions due to their lack of ordering but are inefficient for search operations. Ordered files maintain data sorted by a key, facilitating fast range queries and sorted output but have higher costs for insertions and deletions due to the need to maintain order. Hash files offer fast retrieval with a hash function used for immediate access and insertion, but they suffer in performance with range queries and can encounter collision handling issues. The choice affects overall DBMS efficiency, with trade-offs between speed, space, and operational complexity .

También podría gustarte

Jerarquía de Memoria y Almacenamiento en PCs
Aún no hay calificaciones
Jerarquía de Memoria y Almacenamiento en PCs
2 páginas
Almacenamiento y Indexación en Bases de Datos
Aún no hay calificaciones
Almacenamiento y Indexación en Bases de Datos
68 páginas
Almacenamiento de Datos: Tipos y Estructuras
Aún no hay calificaciones
Almacenamiento de Datos: Tipos y Estructuras
60 páginas
Almacenamiento y Organización de Archivos
Aún no hay calificaciones
Almacenamiento y Organización de Archivos
32 páginas
Almacenamiento y Organización de Archivos
Aún no hay calificaciones
Almacenamiento y Organización de Archivos
35 páginas
UD01 - El Almacenamiento de Información (Tema)
Aún no hay calificaciones
UD01 - El Almacenamiento de Información (Tema)
9 páginas
GBD Gestion de Base de Datos
Aún no hay calificaciones
GBD Gestion de Base de Datos
23 páginas
Resumen 2do Parcial BD2
Aún no hay calificaciones
Resumen 2do Parcial BD2
45 páginas
Tema 1-BD
Aún no hay calificaciones
Tema 1-BD
32 páginas
Medios de Almacenamiento en Bases de Datos
Aún no hay calificaciones
Medios de Almacenamiento en Bases de Datos
14 páginas
Almacenamiento y Organización de Archivos
Aún no hay calificaciones
Almacenamiento y Organización de Archivos
29 páginas
Ud 1 BBDD
Aún no hay calificaciones
Ud 1 BBDD
12 páginas
Evolución de Sistemas de Almacenamiento
Aún no hay calificaciones
Evolución de Sistemas de Almacenamiento
44 páginas
Apuntes de Bases de Datos 2022-23
Aún no hay calificaciones
Apuntes de Bases de Datos 2022-23
198 páginas
Evolución del Almacenamiento de Datos
Aún no hay calificaciones
Evolución del Almacenamiento de Datos
65 páginas
Almacenamiento Físico de Bases de Datos
Aún no hay calificaciones
Almacenamiento Físico de Bases de Datos
6 páginas
Introducción a Bases de Datos y Almacenamiento
Aún no hay calificaciones
Introducción a Bases de Datos y Almacenamiento
6 páginas
Administración del Espacio en Bases de Datos
Aún no hay calificaciones
Administración del Espacio en Bases de Datos
19 páginas
Almacenamiento y gestión de datos
Aún no hay calificaciones
Almacenamiento y gestión de datos
55 páginas
Módulo 1
Aún no hay calificaciones
Módulo 1
40 páginas
Gestión del Espacio en Disco en Bases de Datos
Aún no hay calificaciones
Gestión del Espacio en Disco en Bases de Datos
12 páginas
Altofbd
Aún no hay calificaciones
Altofbd
20 páginas
Estructuras Lógicas de Almacenamiento DB
Aún no hay calificaciones
Estructuras Lógicas de Almacenamiento DB
8 páginas
Base de Datos
Aún no hay calificaciones
Base de Datos
257 páginas
Configuración y Administración de Disco
Aún no hay calificaciones
Configuración y Administración de Disco
23 páginas
BBDD - Almacenamiento - de - La - Informacion - Jose Antonio Melgar Anaya
Aún no hay calificaciones
BBDD - Almacenamiento - de - La - Informacion - Jose Antonio Melgar Anaya
84 páginas
Introducción a Sistemas de Información y Almacenamiento
100% (1)
Introducción a Sistemas de Información y Almacenamiento
37 páginas
1-BD y Stmas de Almacenamiento de Información
Aún no hay calificaciones
1-BD y Stmas de Almacenamiento de Información
18 páginas
Resumen Base de Datos Tema 1
Aún no hay calificaciones
Resumen Base de Datos Tema 1
11 páginas
Almacenamiento y Bases de Datos: Guía Completa
Aún no hay calificaciones
Almacenamiento y Bases de Datos: Guía Completa
65 páginas
Guia de Aprendizaje 3
Aún no hay calificaciones
Guia de Aprendizaje 3
11 páginas
Sistemas de Almacenamiento de Información
Aún no hay calificaciones
Sistemas de Almacenamiento de Información
102 páginas
Introducción a Bases de Datos en Ingeniería
Aún no hay calificaciones
Introducción a Bases de Datos en Ingeniería
59 páginas
Técnicas de Almacenamiento en Bases de Datos
100% (1)
Técnicas de Almacenamiento en Bases de Datos
6 páginas
Tipos y Métodos de Ficheros en Bases de Datos
Aún no hay calificaciones
Tipos y Métodos de Ficheros en Bases de Datos
50 páginas
Manejo de Memoria en SMBD
Aún no hay calificaciones
Manejo de Memoria en SMBD
40 páginas
Configuracion y Administracion de Espacio en Disco
Aún no hay calificaciones
Configuracion y Administracion de Espacio en Disco
22 páginas
Almacenamiento Físico en Sistemas de BD
Aún no hay calificaciones
Almacenamiento Físico en Sistemas de BD
50 páginas
Introducción a Bases de Datos y Ficheros
Aún no hay calificaciones
Introducción a Bases de Datos y Ficheros
75 páginas
Bases de Datos
Aún no hay calificaciones
Bases de Datos
174 páginas
Unidad 01
Aún no hay calificaciones
Unidad 01
43 páginas
Configuración y gestión de espacio en SGBD
Aún no hay calificaciones
Configuración y gestión de espacio en SGBD
38 páginas
DAW BD01 Vers Imprimible PDF
Aún no hay calificaciones
DAW BD01 Vers Imprimible PDF
47 páginas
Introducción a Bases de Datos y Almacenamiento
Aún no hay calificaciones
Introducción a Bases de Datos y Almacenamiento
3 páginas
Clasificación de Dispositivos de Almacenamiento y Su Función
Aún no hay calificaciones
Clasificación de Dispositivos de Almacenamiento y Su Función
5 páginas
Configuracion y Administracion Del Espacio en Disco
100% (1)
Configuracion y Administracion Del Espacio en Disco
14 páginas
Evolución de Sistemas de Almacenamiento
Aún no hay calificaciones
Evolución de Sistemas de Almacenamiento
60 páginas
BD01
Aún no hay calificaciones
BD01
51 páginas
Almacenamiento de La Información
Aún no hay calificaciones
Almacenamiento de La Información
29 páginas
Almacenamiento Primario y Secundario
Aún no hay calificaciones
Almacenamiento Primario y Secundario
10 páginas
Diseño Fisico de Base de Datos
Aún no hay calificaciones
Diseño Fisico de Base de Datos
5 páginas
Tipos y Funciones de Almacenamiento de Datos
Aún no hay calificaciones
Tipos y Funciones de Almacenamiento de Datos
30 páginas
Unidad 4
Aún no hay calificaciones
Unidad 4
18 páginas
Guía sobre Almacenamiento de Información
Aún no hay calificaciones
Guía sobre Almacenamiento de Información
4 páginas
Estructura de Almacenamiento - Clases de Almacenami...
Aún no hay calificaciones
Estructura de Almacenamiento - Clases de Almacenami...
3 páginas
Dispositivos de Almacenamiento Secundaria
Aún no hay calificaciones
Dispositivos de Almacenamiento Secundaria
40 páginas
Método LEST: Evaluación de Trabajo
Aún no hay calificaciones
Método LEST: Evaluación de Trabajo
37 páginas
Especificaciones de Ergonomía 295/2003
Aún no hay calificaciones
Especificaciones de Ergonomía 295/2003
11 páginas
Método Strain Index: Índice de Esfuerzo
Aún no hay calificaciones
Método Strain Index: Índice de Esfuerzo
18 páginas
Reglamento Ley 19.587 Argentina 1979
Aún no hay calificaciones
Reglamento Ley 19.587 Argentina 1979
110 páginas
Régimen de Penalidades Transporte Nacional
Aún no hay calificaciones
Régimen de Penalidades Transporte Nacional
23 páginas
Strain Index: Calificación % EM Escala de Borg
Aún no hay calificaciones
Strain Index: Calificación % EM Escala de Borg
3 páginas
Revalorización del Rol de la Mujer Peruana
Aún no hay calificaciones
Revalorización del Rol de la Mujer Peruana
9 páginas
Ingenieria en Sistemas Computacionales
Aún no hay calificaciones
Ingenieria en Sistemas Computacionales
23 páginas
Informe Final Envases
Aún no hay calificaciones
Informe Final Envases
9 páginas
Sistemas Lineales y Ecuaciones Diferenciales
Aún no hay calificaciones
Sistemas Lineales y Ecuaciones Diferenciales
9 páginas
Tablas de Multiplicar para Niños
Aún no hay calificaciones
Tablas de Multiplicar para Niños
10 páginas
Altimetría
Aún no hay calificaciones
Altimetría
51 páginas
Osciladores con Circuito 555: Guía Completa
100% (1)
Osciladores con Circuito 555: Guía Completa
21 páginas
Cuaderno de Matemáticas 4º E.S.O.
Aún no hay calificaciones
Cuaderno de Matemáticas 4º E.S.O.
75 páginas
Nivelación Directa: Métodos y Ejemplos
Aún no hay calificaciones
Nivelación Directa: Métodos y Ejemplos
6 páginas
Histograma de Pesos de Azúcar en Bolzucar
Aún no hay calificaciones
Histograma de Pesos de Azúcar en Bolzucar
15 páginas
3 Introduccion A Los Sistemas Digitales
Aún no hay calificaciones
3 Introduccion A Los Sistemas Digitales
39 páginas
Qué Significa La Palabra Teoría
Aún no hay calificaciones
Qué Significa La Palabra Teoría
4 páginas
Rubrica de Evaluación: Disociación del Agua
Aún no hay calificaciones
Rubrica de Evaluación: Disociación del Agua
1 página
Ejercicios de Raíz Cuadrada 8° Básico
Aún no hay calificaciones
Ejercicios de Raíz Cuadrada 8° Básico
4 páginas
Historia del Hormigón Armado
Aún no hay calificaciones
Historia del Hormigón Armado
8 páginas
DINAMICA
Aún no hay calificaciones
DINAMICA
11 páginas
Microorganismos en Lapiceros Usuales
Aún no hay calificaciones
Microorganismos en Lapiceros Usuales
17 páginas
Fundamentos de Electrónica Analógica
Aún no hay calificaciones
Fundamentos de Electrónica Analógica
3 páginas
Fases del cabello y cosmética esencial
100% (1)
Fases del cabello y cosmética esencial
27 páginas
Cimentaciones para Torres Autos soportadas
100% (2)
Cimentaciones para Torres Autos soportadas
133 páginas
Cambio de variable a polares
Aún no hay calificaciones
Cambio de variable a polares
21 páginas
Entorno Reducido
Aún no hay calificaciones
Entorno Reducido
9 páginas
Diseño de Instalación Medidor Yokogawa RCUP80S
Aún no hay calificaciones
Diseño de Instalación Medidor Yokogawa RCUP80S
4 páginas
Examen Virtual de Química: Escenario 2
Aún no hay calificaciones
Examen Virtual de Química: Escenario 2
6 páginas
Diseño de Carretera para Ingenieros
Aún no hay calificaciones
Diseño de Carretera para Ingenieros
38 páginas
Crograma GENERAL ADSO - Ficha 3336166 2025
Aún no hay calificaciones
Crograma GENERAL ADSO - Ficha 3336166 2025
41 páginas
Actividad 2 Financiera
0% (1)
Actividad 2 Financiera
14 páginas
Norma Técnica E.090: Estructuras Metálicas
Aún no hay calificaciones
Norma Técnica E.090: Estructuras Metálicas
189 páginas
Series y Sucesiones en Cálculo Integral
Aún no hay calificaciones
Series y Sucesiones en Cálculo Integral
13 páginas
Laboratorio Nº4-Ablandamiento de Agua-Ipq
Aún no hay calificaciones
Laboratorio Nº4-Ablandamiento de Agua-Ipq
9 páginas

Almacenamiento y Organización de Datos

Cargado por

Almacenamiento y Organización de Datos

Cargado por

UNIVERSIDAD TECNOLÓGICA NACIONAL

FACULTAD REGIONAL RESISTENCIA

Unidad 6: Almacenamiento de Registros y

Profesor Teoría: Ing. Carolina Orcola

Ing. Juan Carlos Fernandez Año 2007 Página 2

Jerarquías de memoria y dispositivos de almacenamiento

Almacenamiento de base de datos

Ing. Juan Carlos Fernandez Año 2007 Página 3

dispositivos de almacenamiento secundario almacenamiento no volátil, en contraste con el

Dispositivos de almacenamiento secundario

Acceso paralelo al disco mediante el uso de tecnologías RAID

Almacenamiento intermedio de bloques

Ing. Juan Carlos Fernandez Año 2007 Página 4

Grabación de los registros de un fichero en disco

Registros y tipos de registros

Ficheros, registros de longitud fija y registros de longitud variable

Grabación de registros en bloques

Asignación en el disco de los bloques de un fichero

Ing. Juan Carlos Fernandez Año 2007 Página 5

Operaciones con ficheros

Comparación según las organizaciones de ficheros:

Ing. Juan Carlos Fernandez Año 2007 Página 6

Tipo de fichero Scan Búsqueda de Búsqueda de Inserción Borrado

Estructuras de índice para ficheros

Alternativas para entradas de datos en un índice:

Índices de un solo nivel

Índices agrupados versus no agrupados

Ing. Juan Carlos Fernandez Año 2007 Página 7

Índice agrupado usando la Alternativa (2)

Índice no agrupado usando la Alternativa (2)

Índices densos versus dispersos

Ing. Juan Carlos Fernandez Año 2007 Página 8

Ayala, 25, 300

Índice disperso Índice denso

Índices primarios y secundarios

Método de Acceso Secuencial Indexado (ISAM):

Ing. Juan Carlos Fernandez Año 2007 Página 9

Formato de un bloque de índice

Estructura de índice de un nivel

Índices multinivel dinámicos basados en árboles B+

Ing. Juan Carlos Fernandez Año 2007 Página 10

 La búsqueda de un registro requiere solamente atravesar el árbol desde la raíz hasta la

Índices sobre claves múltiples

<sal, edad> joe 12 20 <sal>

Índices de clave compuesta

Ing. Juan Carlos Fernandez Año 2007 Página 11

Common questions

What are the advantages and disadvantages of using magnetic disks over primary storage when managing large databases?

What are the advantages and disadvantages of using magnetic disks over primary storage when managing large databases?

How does the hashing technique determine the placement of records in file organization, and what are its implications on data retrieval efficiency?

How does the hashing technique determine the placement of records in file organization, and what are its implications on data retrieval efficiency?

Discuss the role of caching and its impact on the speed of data access in computing systems.

Discuss the role of caching and its impact on the speed of data access in computing systems.

Explain the concept of RAID and how it enhances disk storage performance in a database system.

Explain the concept of RAID and how it enhances disk storage performance in a database system.

In what ways does intermediate block storage, such as buffering techniques, optimize data transfer between memory and disk in a computing system?

In what ways does intermediate block storage, such as buffering techniques, optimize data transfer between memory and disk in a computing system?

Evaluate the importance of choosing an appropriate file organization method in the context of database system performance.

Evaluate the importance of choosing an appropriate file organization method in the context of database system performance.

How do the physical characteristics of storage media, such as magnetic disks and CDs, affect their use in databases?

How do the physical characteristics of storage media, such as magnetic disks and CDs, affect their use in databases?

Describe the method and benefits of using multi-level indexes in a database.

Describe the method and benefits of using multi-level indexes in a database.

How do the concepts of indexes, such as dense and sparse indexes, differ in their organization and application to database files?

How do the concepts of indexes, such as dense and sparse indexes, differ in their organization and application to database files?

Analyze the benefits and limitations of using various types of file organizations, such as heap, ordered, and hash files, in database management systems.

Analyze the benefits and limitations of using various types of file organizations, such as heap, ordered, and hash files, in database management systems.

También podría gustarte