Unidad I
Introducción
Introducción
Para poder acceder a determinada información en cualquier
momento, se necesitará que ella esté depositada en soportes
físicos los cuales la almacenan en forma permanente.
Este es el caso Memoria externa o auxiliar como:
Disquete
HD (disco duro)
Cinta magnética, etc.
Tarjetas perforadas
Introducción
Las cuales sin necesidad de estar conectadas a la
corriente eléctrica, la información almacenada en ella
permanece allí.
La forma de almacenar la información en ellos es
mediante unas estructuras de Datos llamadas ARCHIVOS
o FICHEROS (file).
ARCHIVOS DE DATOS
ARCHIVOS DE PROGRAMA
Introducción
Objetivos (entre otros...)
Almacenamiento permanente
Manipulación de un gran numero de datos
Independencia de los programas
Residentes en soportes externos
Estructura Archivos => Colección de Registros
Registros => Colección de campos (tamaño, longitud,...)
Campo => es la mínima unidad de información
1.1 Concepto de Archivo
¿Qué es un Archivo?
Procede del latín archivum, aunque su origen más
remoto se encuentra en la lengua griega y puede
traducirse como “residencia de los magistrados”
Usado para nombrar al conjunto ordenado de
documentos que una sociedad, una institución o una
persona elabora en el marco de sus actividades y
funciones.
1.1 Concepto de Archivo
En el área Informática
Un archivo es una colección de registros lógicamente
relacionados.
Un Registro es una estructura de campos de datos
lógicamente relacionados, los cuales tienen un formato
único, se almacenan juntos para algún propósito común
1.1 Concepto de Archivo
Los datos son:
Los valores que recibe el computador a través de
distintos medios, y que es manipulada mediante el
procesamiento de los algoritmos de programación.
Su contenido puede ser prácticamente cualquiera:
Estadísticas
Números
Descriptores, etc..
Que por separado no tienen relevancia, pero que en conjunto
pueden ser una información completa y específica.
1.1 Concepto de Archivo
Los datos son:
Los valores que recibe el computador a través de
distintos medios, y que es manipulada mediante el
procesamiento de los algoritmos de programación.
Su contenido puede ser prácticamente cualquiera:
Estadísticas
Números
Descriptores, etc..
Que por separado no tienen relevancia, pero que en conjunto
pueden ser una información completa y específica.
1.1 Concepto de Archivo
¿Cómo se Estructura del archivo?
Un archivo (File) es una estructura diseñada para contener
datos, estos están organizados de forma tal que se puedan
consultar, modificar, agregar o eliminar.
El cual debe contar con un identificador (nombre) que lo
diferencie de los demás, el cual debe de ser representativo
de su contenido.
1.1 Concepto de Archivo
Existen tres buenas razones para
estructurar una colección de datos como un archivo:
1. Almacenar datos independientemente de la ejecución de
un programa particular, un archivo proporciona un medio
perméate.
2. Pueden almacenar grandes volúmenes de información
que no podrían almacenarse en memoria principal.
3. Se puede usar solo una pequeña parte de la colección
por el programa, haciendo ilógico almacenar toda la
información simultáneamente en memoria principal.
1.1 Concepto de Archivo
Existen tres buenas razones para
estructurar una colección de datos como un archivo:
1. Almacenar datos independientemente de la ejecución de
un programa particular, un archivo proporciona un medio
perméate.
2. Pueden almacenar grandes volúmenes de información
que no podrían almacenarse en memoria principal.
3. Se puede usar solo una pequeña parte de la colección
por el programa, haciendo ilógico almacenar toda la
información simultáneamente en memoria principal.
1.1 Concepto de Archivo
¿Cuándo se utilizan?
Cuando se desea almacenar datos de manera persistente, o
para guardarlos en memoria secundaria con el fin de no
utilizar memoria primaria, dado que esta última es
normalmente más escasa que la anterior.
Dependiendo de cada sistema de archivos, los ficheros
pueden tener atributos particulares como:
Fecha de creación y/o última modificación
Dueño
Permisos de acceso.
1.1 Concepto de Archivo
¿Cuándo se utilizan?
La capacidad de almacenamiento de un archivo se limita por
el volumen disponible en la memoria secundaria y los límites
definidos por el sistema (archivos/operativo).
Su tipo es definido por el tipo de organización de los datos
almacenados y la interpretación que realiza el software que
los escribe o los lee.
En Resumen
Un registro es un conjunto de campos referentes a una
entidad en particular y constituyen
una unidad para su proceso.
ejemplo de un registro-: información de un
alumno, con los campos: clave, apellido y
nombre, domicilio, fecha de nacimiento, entre otros
campos.
Registro
En Resumen
Un registro es un conjunto de campos referentes a una
entidad en particular y constituyen
una unidad para su proceso.
ejemplo de un registro:
información de un alumno, con los campos: clave,
apellido y nombre, domicilio, fecha de nacimiento, entre
otros campos.
Registro
Estructura de datos de un Archivo
Un Campo es un conjunto de caracteres capaz de
suministrar una determinada información referida a un
concepto; al definirlo debemos indicar claramente sus
tres características:
Nombre: Es el identificador del conjunto
de caracteres que almacenara.
Tipo: Tipo de dato que puede almacenar
(carácter, String, entero, etc.).
Tamaño: Cantidad de caracteres que
puede contener.
Estructura de datos de un Archivo
Ejemplo: si tenemos que definir al campo número de
documento resultaría:
Nombre: Documento
Tipo: Numérico
Tamaño: 8 enteros
Un campo es la entidad lógica más pequeña, consiste en un
conjunto de byte que conforman un dato.
Estructura de datos de un Archivo
Un Registro es un conjunto de campos referentes a una
entidad en particular y constituyen una unidad para su
proceso.
Ejemplo: la información de un Alumno, que contiene los
Campos:
NoCtrl
Apat
Amat
Nombre
Domicilio
FechaNac.
1.2 Tipos de archivo
Existen seis tipos básicos de archivos, clasificados por la
función que desempeñan en in sistema informático.
1. Maestro: representa una visión estática de algún
aspecto de los negocios de una organización en un
momento dado.(clientes, facturas, inventario, etc.),
contiene datos relativamente permanentes de estado
histórico.
1.2 Tipos de archivo
2. Transacciones: almacena los cambios que se aplican a
los archivos maestros, puede contener datos para
agregar, borrar o modificar un registro. Cada registro
representa un cambio de alguna cosa, cuyo estatus es
registrado en un archivo maestro.
1.2 Tipos de archivo
3. Reportes: contiene datos que son fomentados para su
presentación al usuario. Puede ser impresos, o
presentarse en la pantalla.
1.2 Tipos de archivo
4. Trabajo: es un archivo temporal, se usan comúnmente
para pasar datos creados por un programa a otro.
5. Programa: contiene las instrucciones para procesar
datos, los cuales pueden almacenarse en otros
archivos o residir en memoria. Las instrucciones
pueden estar en código fuente, o ser el resultado de
una compilación.
1.2 Tipos de archivo
6. Texto: contiene los datos alfanuméricos y gráficos
ingresados agraves de un programa editor de textos.
1.2 Tipos de archivo
De acuerdo a los datos que almacenan se encuentran:
ASCII
American Standard Code for Information Interchange:
Es un estándar que asigna un
valor numérico a cada carácter,
con lo que se pueden representar
los documentos llamados de
Texto Plano, es decir, los que son
legibles por seres humanos.
1.2 Tipos de archivo
De acuerdo a los datos que almacenan se encuentran:
Binario:
almacena información en un lenguaje al que sólo la propia
computadora comprende.
Ejemplo:
imágenes (jpg, .gif, .tiff, .bmp)
Video (.mpg, .mov, .avi, .gif)
Empaquetados (zip, .Z, .gz, .tar, .)
Ejecutables (.exe, .com, .cgi, .o, .a)
Procesadores de palabras(.doc)
1.3 Organizaciones de archivos
Es la colección de registros lógicos en el archivo y la percepción que
tiene el programador acerca de la disposición lógica de los registros
almacenados en el archivo
La cual tiene una técnica de acceso, mediante la cual estos registros
pueden ser accedidos.
Esta técnicas son llamada organización de archivos y son:
Secuencial
Secuencial indexado
Directa/Relativa (Random)
1.3.1 Organizaciones de archivos
Secuenciales
Es la manera básica de organizar un conjunto de registros,
que forman parte del archivo.
En este los registros quedan grabados consecutivamente
cuando el archivo se crea y debe accederse
consecutivamente.
1.3.1 Organizaciones de archivos
Secuenciales
El término implica que lógicamente los registros del archivo
están almacenados en forma adyacente,
Uno tras otro en orden de llegada.
El acceso a algún registro, se deben leer
todos los registros que están almacenados
antes de éste.
El orden físico de los registros, es el orden
de lectura de los mismos.
1.3.1 Organizaciones de archivos
Secuenciales
Características:
La escritura de nuevos registros siempre se hace al final
del archivo.
Para leer un registro del archivo hay que avanzar siempre,
si la zona está antes de la zona actual de lectura, será
necesario regresar el puntero de lectura del archivo.
Los archivos sólo se pueden abrir para lectura o para
escritura, nunca de los dos modos a la vez.
1.3.1 Organizaciones de archivos
Secuenciales
Características:
La escritura de nuevos registros siempre se hace al final
del archivo.
Para leer un registro del archivo hay que avanzar siempre,
si la zona está antes de la zona actual de lectura, será
necesario regresar el puntero de lectura del archivo.
Los archivos sólo se pueden abrir para lectura o para
escritura, nunca de los dos modos a la vez.
1.3.1 Organizaciones de archivos
Secuenciales
Estructura de un archivo secuencial:
Normalmente cada registro tiene una estructura compuesta
por una cantidad finita de campos relacionados entre sí .
campos de distinto tipo
uno denomina campo llave “identificación única del registro”
1.3.1 Organizaciones de archivos
Secuenciales
Estructura de un archivo secuencial:
Ejemplo:
1.3.1 Organizaciones de archivos
Secuenciales
Estructura de un archivo secuencial:
Ventajas:
Proveen la mejor utilización de espacio y son rápidos cuando los registros
son accesados secuencialmente.
Son muy sencillos de usar y aplicar
Capacidad de acceso al "siguiente" registro rápidamente
Desventaja:
El acceso a un registro en particular es pobre, no se puede hacer
individualmente.
1.3.2 Organizaciones de archivos
Secuenciales Indexado
Un diccionario es un archivo secuencial:
los registros son las entradas
Las claves son las palabras definidas por las entradas.
Para buscar una palabra no se realiza de manera secuencial, sino
que se abre el diccionario por la letra inicial de la palabra.
Si se desea buscar “índice”:
1. se abre este por la letra I
2. en su 1er pag. se busca la cabecera de la página hasta
encontrar la página mas próxima a la palabra.
3. buscando a continuación palabra a palabra hasta encontrar
“índice”.
1.3.2 Organizaciones de archivos
Secuenciales Indexado
El diccionario típico de archivos secuencial-indexado con dos
niveles de índices, el nivel superior para las letras iniciales y el
nivel menor para las cabeceras de páginas se guardaran en un
archivo de índice independiente de las entradas del diccionario
(archivo de datos).
Por consiguiente, cada archivo secuencial-indexado consta de un
archivo índice y un archivo de datos.
1.3.2 Organizaciones de archivos
Secuenciales Indexado
Un archivo de esta tipo de organización se caracteriza por:
El tipo de sus registros contienen un campo clave que lo
identifica como único
Los registros están situados en un soporte direcciónatele por el
orden de los valores indicados por la clave.
Tiene un índice para cada posición, la dirección de la posición y
el valor de la clave; el índice contiene la clave del último
registro y la dirección de acceso al primer registro del bloque.
1.3.2 Organizaciones de archivos
Secuenciales Indexado
Ejemplo:
1.3.2 Organizaciones de archivos
Secuenciales Indexado
Ventajas:
Son de rápido acceso.
El sistema gestor de archivos se encarga de relacionar la
posición de cada registro con su contenido mediante la tabla de
índices.
Desventajas:
Se requiere especio adicional para el área de índices.
1.3.3 Organizaciones de archivos
Directa/Relativa (Random)
Este tipo de organización el orden físico de los registros no
corresponde con el orden lógico.
Los datos se sitúan en el archivo y se accede a ellos
mediante su posición, es decir, el lugar relativo que
ocupan.
1.3.3 Organizaciones de archivos
Directa/Relativa (Random)
Un archivo consta de registros ordenados por su dirección
relativa, sus los principales atributos:
La lectura de los registros como orden secuencial o
secuencial indexado.
Cada registro deben contar con un identificador que lo
haga un registro como único (campo llave).
“ dos registros no pueden tener la misma clave”
1.3.3 Organizaciones de archivos
Directa/Relativa (Random)
Almacenamiento en un soporte direccionable.
Existencia de una correspondencia entre los posibles
valores de la clave y las direcciones posibles sobre el
soporte.
1.3.3 Organizaciones de archivos
Directa/Relativa (Random)
Ventajas
Se pueden leer y escribir registros en cualquier orden y
posición.
Son muy rápidos de acceso a la información que
contienen.
la habilidad de acezar registros individuales
directamente.
1.3.3 Organizaciones de archivos
Directa/Relativa (Random)
Desventajas
Requiere programar la relación existente entre el la llave
y la posición que ocupara.
Se puede presentar la misma dirección para diferentes
valores de llave, es decir, se presentan COLISIONES.
El desperdicio de espacio debido a la distribución al azar
de los registros, pueden existir huecos libres entre los
registros.
1.4 Operaciones sobre archivos
Desde el punto de vista del desarrollador, el manejo de
archivos es importante ya que los programas pueden leer o
escribir en ellos.
Para ello se debe implementar:
Procedimientos
Funciones
Para comunicar al sistema operativo la operación a realizar y
obtener una respuesta de este.
1.4 Operaciones sobre archivos
El SO debe mantener cierta información sobre los archivos
que manipula:
Soporte físico
Tipo de organización
Inicio y fin del archivo
Los principales procedimientos sobre tipos de archivos son
1.4.1 Creación de Archivos
Esta operación asigna el espacio para el archivo donde
después los datos serán cargados “Esqueleto del archivo”
Esta es la primera operación sobre un archivo, mediante la
cual se introduce la información del archivo en un soporte
de almacenamiento de datos.
Para ser utilizado, este debe existir, es necesario que se
haya creado previamente.
1.4.1 Creación de Archivos
Esta exige:
Organización
Estructura
Localización (soporte de almacenamiento)
Durante la creación esta se requieren:
Nombre del dispositivo
Nombre de archivo
Tamaño
Organización, etc.
1.4.1 Creación de Archivos
Al momento de la creación puede suceder:
Que sea creado por primera vez en un soporte
determinado
Proceder de otro que ya existe
Ser el resultado de un cálculo, condición, etc. o ambas
cosas a la vez
1.4.2 Actualización de Archivos
Cambiar el contenido de un archivo para hacer que refleje un
momento transitorio más actual del mundo real es a lo cual se le
llama, actualización de archivos.
Estos cambios pueden incluir:
a) La inserción de nuevos registros, por ejemplo, la adición de un
registro para un empleado de nuevo ingreso en la compañía.
b) La modificación de datos a registros que ya existen en un
archivo, por ejemplo, cambiar el sueldo del empleado, cambiar
el indicativo de estado del empleado(activo/no activo/licencia).
1.4.3 Recuperación de información de Archivos
Es el acceso a un archivo con el propósito de extraer
información (consultar)
Formulada Mediante un lenguaje de consulta
Traduce las preguntas del usuario en instrucciones
Usadas directamente para acezar el archivo.
1.4.3 Recuperación de información de Archivos
Existen dos clases de recuperación de información:
La recuperación comprensiva
información de todos los registros del archivo (reportes)
La recuperación selectiva
aplica criterios de clasificación de registros
1.4.4 Mantenimiento de Archivos
Son los cambios hechos sobre los archivos
para mejorar la eficiente de los programas que los accedan
Existen dos clases de operaciones:
Restructuración de un archivo:
Implica Cambios Estructurales al Archivo
por ejemplo, cambiar la longitud de un campo, agregar uno
nuevo al registro, re-secuenciar los registros del archivo,
etc.
1.4.4 Mantenimiento de Archivos
Reorganización del archivo
Implica cambiar la organización a otro tipo
Ya que la organización difiere en sus requerimientos
1.4.5 Apertura y Cierre de Archivos
Para que un programa pueda utilizar un archivo, la primera
operación a realizar es:
La apertura del archivo: mediante un procedimiento que
identifique el archivo (nombre, ubicación) y el modo que se
empleara.
El SO construye a partir de esto UN DESCRIPTOR DE
ARCHIVO, con el cual se refiriera al archivo por un
número / variable asociado a este descriptor. “de manera
interna”
1.4.5 Apertura y Cierre de Archivos
El modo de apertura determina las operaciones que se
podrán realizar sobre el mismo:
Ejemplo:
No podríamos escribir en un archivo si en el descriptor
especifica que se abrió como “SOLO LECTURA”.
1.4.5 Apertura y Cierre de Archivos
Cuando va a ser Utilizado, se requiere indicar al SO:
EL fin de uso para que libere el descriptor del archivo
Asegurando que se almacene en el soporte físico
1.4.5 Apertura y Cierre de Archivos
Para cerrar un archivo el programa debe utilizar;
Un procedimiento de cierre, indicando el descriptor de
archivo interno (numero/variable).
Evidentemente para el uso de
un archivo, este debe existir,
por ello debe de haberse creado
en algún momento.
1.4.5 Apertura y Cierre de Archivos
Al abrirlo para lectura, la información debe haberse
almacenado sobre un soporte y ser utilizable.
Si se realiza la apertura para escritura y no existe, en
lenguajes eso al SO lo cree automáticamente (en caso
contrario se debe crear previamente)
Si ya existiera, su contenido será borrado y empezara a
escribirse desde el inicio.
1.4.5 Apertura y Cierre de Archivos
La forma de evitar el borrado de contenidos si se desea añadir datos
nuevos a los existentes, es NECESARIO ABRIRLO DE MODO AÑADIR.
Para la creación de un nuevo archivo es necesario saber:
Nombre dispositivo: soporte dónde de se almacenara fiscalmente el
archivo
Nombre del archivo: identificador que lo diferencia de los otros
Tamaño del archivo: especio necesario para la creación del archivo
Organización del archivo: tipo de organización del archivo
Tamaño del bloque (registro físico): cantidad de datos que se leen o
escriben en cada operación de E/S
1.4.5 Apertura y Cierre de Archivos
Errores en la creación de archivos:
Existencia de otro archivo con el mismo nombre en el soporte
El dispositivo no tiene especio disponible para crear el archivo
El dispositivo no está operando
Problemas en el hardware
Parámetros de entrada con errores
1.5 Almacenamiento y medios físicos
Las organizaciones requieren su información sea preservada para su
posterior manipulación.
Por ello:
Necesarios tener un soporte de almacenamiento especial
Debe preservarse indefinidamente
Por ello es necesaria la transcripción de los medio de almacenamiento
viejos a nuevos:
Por inestabilidad
Por tecnologías de grabación obsoletas
Por avances tecnológicos
1.5 Almacenamiento y medios físicos
Los principales dispositivos de almacenito estreno que se utilizan
para preservar los datos son:
1.5.1 Cintas magnéticas
En estas la información es registrada en forma de puntos
magnetizados a lo largo de varias pistas paralelas para
representar los símbolos binarios 1 y 0.
Los Datos son grabados o leídos por medio de una cabeza
magnética, en el caso de los procesadores hay tantas cabezas
como pistas paralelas.
1.5 Almacenamiento y medios físicos
1.5.1 Cintas magnéticas
Características:
Material plástico recubierto de óxido férrico
Ancho de menos de 2 cm, sobre la cual la información es registrada
Varias unidades de cinta pueden ser interconectadas al mismo
procesador, permitiendo de esta manera almacenar millones de
datos, registrándolos o leyéndolos a la velocidad de
aproximadamente 15,000 números y letras por segundo.
1.5 Almacenamiento y medios físicos
1.5.1 Cintas magnéticas
Ventajas:
Alta densidad de datos: Puede grabar 800,1600, 2400, 3200, 4000,
4800, 5600 y hasta 6400 bytes en cada pulgada dependiendo de la
unidad de cinta que utilice “6400 cart/pulgada” esto depende de la
longitud de la cinta
Bajo costo y facilidad de manejo: costo aproximado 20 dólares. Y
dado que el carrete es compacto y pesa menos de 1.5 kg, ocupa muy
poco espacio de almacenamiento y es fácil de manejar.
1.5 Almacenamiento y medios físicos
1.5.1 Cintas magnéticas
Desventajas:
Falta de acceso directo a los registros: es de acceso
secuencial por ello se requiere procesar toda la cinta para
actualizar.
Si se requiere acceso a los registros de manera aleatoria,
no se debe almacenar en este tipo; se requiere demasiado
tiempo en montar y desmontar, se desperdiciaría mucho
tiempo máquina en la lectura de registros que no necesitan.
1.5 Almacenamiento y medios físicos
1.5.1 Cintas magnéticas
Desventajas:
Problemas ambientales: Las partículas de polvo y la falta de
control de los niveles de la temperatura o humedad pueden
causar errores en la lectura de cintas. Las cintas y sus
envases deben etiquetarse y controlarse cuidadosamente
para no borrar por error un archivo importante.
Organización de Archivos
Tomando en cuenta los tipos, características, operaciones
y ventajas de los ARCHIVOS que se pueden manejar al
estructurar un sistema de información.
¿Cual de las diferentes organizaciones es la mas idónea
en el manejo de archivos de datos?
Organización de Archivos
La gestión de archivos tiene los siguientes objetivos:
Optimizar la categorización de la información.
Facilitar el acceso a los documentos.
Revisar y garantizar la validez de los archivos.
Brindar soporte directo ante el manejo de los datos y para
los dispositivos de almacenamiento.
Minimizar la pérdida de datos.
Propósito es la organizada de la información
Criterios para Elegir un tipo de
Organización
Rápido Acceso
Economía de Almacenamiento
Facilidad de Uso
La elección de la organización determina el
rendimiento. Algunas mediadas de rendimiento son:
a) Almacenamiento requerido por un registro.
b) Tiempo de búsqueda de un registro.
c) Tiempo requerido para leer todo el archivo.
d) Tiempo requerido para insertar un registro.
e) Tiempo para modificar un registro.
En Resumen
1.1 Concepto de Archivo
1.2 Tipos de archivo
1.3 Organizaciones de archivos
1.4 Operaciones sobre archivos
1.5 Almacenamiento y medios físicos