ORGANIZACIÓN DE DATOS

ARCHIVOS DIRECTOS

El archivo directo intenta explorar la capacidad, proporcionada por las unidades de disco y dispositivos similares, de lograr acceso a cualquier bloque de dirección conocida. Para lograr el direccionamiento directo se utiliza la llave del registro para localizarlo en el archivo. En la figura siguiente se muestra el diagrama correspondiente a acceso directo.
Los más antiguos archivos de disco de acceso directo fueron utilizados por las maquinas electrónicas de contabilidad que utilizaban un número perforado en una tarjeta,para determinar en dónde debería archivarse el resto del contenido de la tarjeta. Los métodos modernos de acceso directo transforman la llave mediante un algoritmo de computación antes de utilizarla como dirección. El método de acceso directo es rápido, ya que se evitan las operaciones intermedias de archivo, pero obliga a que los datos se localicen dé acuerdo con un solo atributo llave. Puede compararse el acceso directo con un archivo secuencial indexado en el que el acceso se proporciona de acuerdo con un solo atributo; sin embargo, los registros dentro de los archivos directos no están eslabonados con sus registros predecesores o sucesores. Los métodos de archivo directo utilizan un cálculo para proporcionar la dirección de registro para una llave, mientras que las organizaciones de archivo indexado buscan en índices para determinar cuál es el registro correspondiente a una llave. ESTRUCTURA DE LOS ARCHIVOS DIRECTOS.

Un archivo relativo (directo) consiste en una colección de registros de longitud fija almacenados uno al lado del otro en un dispositivo de almacenamiento de acceso directo (direct - access storage device, DASD). El almacenamiento de este tipo de archivos se restringe a los DASD, tales como discos y tambores, por que el acceso a registros se hace generalmente en orden aleatorio.

Cada registro en un archivo de organización relativa se puede referir por mediode un número -entero- de dirección, el cual indica su distancia o desplazamiento desde el origen del archivo. Al primer registro en un archivo relativo se le asigna el valor 1, 2 al siguiente y así sucesivamente. De este modo, la dirección relativa de un valor entero que refleja su posición respecto al primer registro del archivo. El acceso aleatorio de un registro en un archivo de organización relativa se hace vía su número relativo de registro.

Un archivo de organización relativa puede crearse con un programa en un lenguaje de alto nivel si es que el método de acceso del sistema operativo central es capaz de manejar esta organización, y si el compilador del lenguaje de interface con tal método de acceso.
import java.io.*;
import javax.swing.*;
public class CrearArchivoAleatorio {
private static final int NUMERO_REGISTROS = 100;
// permitir al usuario seleccionar el archivo a abrir
private void crearArchivo()
{
// mostrar cuadro de diálogo para que el usuario pueda seleccionar el archivo
JFileChooser selectorArchivo = new JFileChooser();
selectorArchivo.setFileSelectionMode( JFileChooser.FILES_ONLY );
int resultado = selectorArchivo.showSaveDialog( null );
// si el usuario hizo clic en el botón Cancelar del cuadro de diálogo, regresar
if ( resultado == JFileChooser.CANCEL_OPTION )
return;
// obtener el archivo seleccionado
File nombreArchivo = selectorArchivo.getSelectedFile();
// mostrar error si el nombre del archivo es inválido
if ( nombreArchivo == null || nombreArchivo.getName().equals( "" ) )
JOptionPane.showMessageDialog( null, "Nombre de archivo incorrecto",
"Nombre de archivo incorrecto", JOptionPane.ERROR_MESSAGE );
else {
// abrir el archivo
try {
RandomAccessFile archivo =
new RandomAccessFile( nombreArchivo, "rw" );
RegistroCuentasAccesoAleatorio registroEnBlanco =
new RegistroCuentasAccesoAleatorio();
// escribir 100 registros en blanco
for ( int cuenta = 0; cuenta < NUMERO_REGISTROS; cuenta++ )
registroEnBlanco.escribir( archivo );
archivo.close(); // cerrar el archivo
// mostrar mensaje indicando que el archivo se creó
JOptionPane.showMessageDialog( null, "Se creó el archivo " +
nombreArchivo, "Estado", JOptionPane.INFORMATION_MESSAGE );
System.exit( 0 ); // terminar el programa
} // fin del bloque try
// procesar excepciones durante operaciones de apertura, escritura o cierre del archivo
catch ( IOException excepcionES ) {
JOptionPane.showMessageDialog( null, "Error al procesar el archivo",
"Error al procesar el archivo", JOptionPane.ERROR_MESSAGE );
System.exit( 1 );
}
} // fin de instrucción else
} // fin del método crearArchivo
public static void main( String args[] )
{
JDialog.setDefaultLookAndFeelDecorated(true);
CrearArchivoAleatorio aplicacion = new CrearArchivoAleatorio();
aplicacion.crearArchivo();
}
} // fin de la clase CrearArchivoAleatorio

convierte una clave en una dirección (índice) dentro del arreglo.

como la asignación de una misma dirección a dos o más claves distintas.
H(K) = elegirdigitos (d1,d2...dn) + 1
Función de hashing resistente a seudocolisiones: Una función de hashing es resistente a

y algún IV, tal que h(x) = z.

y algún IV, tal que h(x) = z.

import java.util.*;
import java.io.*;
/** CloseWords: Saca probecho de la tendencia a la aglomeración que * posee el método hashCode() de la clase String para buscar palabras "cercanas" * al argumento. */
public class CloseWords
{
    Hashtable ht;
    String currString;

    /** En el código siguiente creamos una instancia de la clase Hashtable en la cual almacenaremos * nuestra lista de todas las palabras en el dicionario del sistema (si, es muy ineficiente * almacenar en memoria palabras mediante este indexado). * * @param args */
    public static void main(String[] args)
    {
ht = new Hashtable();
try
    {
DataInputStream in = new DataInputStream(
new BufferedInputStream(
new FileInputStream("/usr/dict/words")));
while((currString = in.readLine())!=null)
    ht.put(new Integer(currString.hashCode()), currString);

int i = args[0].hashCode();
int found=0;

while(found < 5)
    {
i--;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
i = args[0].hashCode();
found=0;

while(found < 5)
    {
i++;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
    }
catch(IOException ioe)
    {
    System.out.println("IO Exception");
    }
    }
}
/** CloseWords: Saca probecho de la tendencia a la aglomeración que * posee el método hashCode() de la clase String para buscar palabras "cercanas" * al argumento. */
public class CloseWords
{
    Hashtable ht;
    String currString;
    /** En el código siguiente creamos una instancia de la clase Hashtable en la cual almacenaremos * nuestra lista de todas las palabras en el dicionario del sistema (si, es muy ineficiente * almacenar en memoria palabras mediante este indexado). * * @param args */
    public static void main(String[] args)
    {
ht = new Hashtable();
try
    {
DataInputStream in = new DataInputStream(
new BufferedInputStream(
new FileInputStream("/usr/dict/words")));
while((currString = in.readLine())!=null)
    ht.put(new Integer(currString.hashCode()), currString);

int i = args[0].hashCode();
int found=0;

while(found < 5)
    {
i--;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
i = args[0].hashCode();
found=0;

while(found < 5)
    {
i++;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
    }
catch(IOException ioe)
    {
    System.out.println("IO Exception");
    }
    }
}
    /** En el código siguiente creamos una instancia de la clase Hashtable en la cual almacenaremos * nuestra lista de todas las palabras en el dicionario del sistema (si, es muy ineficiente * almacenar en memoria palabras mediante este indexado). * * @param args */
    public static void main(String[] args)
    {
ht = new Hashtable();
try
    {
DataInputStream in = new DataInputStream(
new BufferedInputStream(
new FileInputStream("/usr/dict/words")));
while((currString = in.readLine())!=null)
    ht.put(new Integer(currString.hashCode()), currString);
int i = args[0].hashCode();
int found=0;

while(found < 5)
    {
i--;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
i = args[0].hashCode();
found=0;

while(found < 5)
    {
i++;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
    }
catch(IOException ioe)
    {
    System.out.println("IO Exception");
    }
    }
}
int i = args[0].hashCode();
int found=0;
while(found < 5)
    {
i--;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
i = args[0].hashCode();
found=0;

while(found < 5)
    {
i++;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
    }
catch(IOException ioe)
    {
    System.out.println("IO Exception");
    }
    }
}
while(found < 5)
    {
i--;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
i = args[0].hashCode();
found=0;
while(found < 5)
    {
i++;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
    }
catch(IOException ioe)
    {
    System.out.println("IO Exception");
    }
    }
}
while(found < 5)
    {
i++;
if(ht.get(new Integer(i))!=null)
    {
System.out.println(ht.get(new Integer(i)));
found++;
    }
    }
    }
catch(IOException ioe)
    {
    System.out.println("IO Exception");
    }
    }
}

La clase CrearArchivoAleatorio.java, que posee el método main, muestra un cuadro de dialogo que permite al usuario crear el archivo:

FUNCIONES HASH Ó HASHING

El método llamado por transformación de claves (hash), permite aumentar la

velocidad de búsqueda sin necesidad de tener los elementos ordenados. Cuenta

también con la ventaja de que el tiempo de búsqueda es prácticamente

independiente del número de componentes del arreglo.

Trabaja basándose en una función de transformación o función hash (H) que

Cuando se tienen claves que no se corresponden con índices (p. ejem. por ser

alfanuméricas), o bien cuando las claves son valores numéricos muy grandes,

debe utilizarse una función hash que permita transformar la clave para obtener

una dirección apropiada. Esta función hash debe de ser simple de calcular y debe

de asignar direcciones de la manera mas uniforme posible. Es decir, dadas dos

claves diferentes debe generar posiciones diferentes. Si esto no ocurre

(H(K1)=d,H(K2)=d y K1K2), hay una colisión. Se define, entonces, una colisión

Función Módulo (por división)

Consiste en tomar el residuo de la división de la clave entre el numero de

componentes del arreglo.

La función hash queda definida por la siguiente formula:

H(K) = (K mod N) + 1

Se recomienda que N sea el numero primo inmediato inferior al numero total de

elementos.

Función Centro de Cuadrados

Consiste en elevar al cuadrado la clave y tomar los dígitos centrales como

dirección. El numero de dígitos a tomar queda determinado por el rango del índice.

La función hash que definida por la sig. formula:

Administración de Archivos Ing. Bruno López Takeyas

H(K) = digitos_centrales (K²) + 1

Función Plegamiento

Consiste en dividir la clave en partes de igual numero de dígitos (la ultima puede

tener menos dígitos) y operar con ellas, tomando como dirección los dígitos menos

significativos. La operación entre las partes puede hacerse por medio de sumas o

multiplicaciones. La función hash queda definida por la sig. formula:

H(K) = digmensig ((d1...di) + (di + 1...dj) + ... + (d1...dn)) + 1

Función Truncamiento

Consiste en tomar algunos dígitos de la clave y formar con ellos una dirección. La

función hash queda definida por la sig. fórmula:

Función de hashing resistente a colisiones: Una función de hashing es resistente a colisiones

si es computacionalmente no factible hallar un par de mensajes distintos x, x’ tal que h(x) =

h(x’). Hay dos variantes: con IV’s (initialization vectors) fijos (la habitual) o de IV aleatorio en

la cual uno de esos vectores puede variar libremente. Salvo que se indique lo contrario, nos

referiremos sólo a la variante con IV’s fijos. La complejidad de este ataque (IV fijo) contra un

hashing de n-bits es O(2n/2).

seudocolisiones si es computacionalmente no factible hallar un par de mensajes distintos x, x’

tal que h(x) = h(x’) en las cuales se puedan usar distintos IV’s para ambos mensajes x, x’.

Función de hashing resistente a seudopreimágenes: Una función de hashing es resistente a

seudopreimágenes si dado el digesto z es computacionalmente no factible hallar algún mensaje x

import java.lang.*;

ARCHIVOS INDEXADOS

Hablando de bases de datos, un archivo indexado se refiere a un archivo que guarda información del orden en que están guardados los datos. Estos son muy útiles para hacer búsquedas en la base, en donde los datos se introducen sin ningún orden. No es obligatorio que uses árboles-B para su implantación, pero esta es una de las formas más eficientes de indexar. Sólo que su implantación no es trivial. Si en la escuela no te pusieron restricciones en este sentido pues puedes implementar archivos indexados de una manera muy ineficiente pero muy fácil de hacerlo, por el método de guardar sólo la clave por el cual vas a ordenar la base y la posición que guarda en la tabla, en el archivo indexado, y mantenerlo siempre ordenado cuando añadas o quites un elemento de la base y realizar búsquedas binarias para encontrar un elemento de la base. Ahora que si realmente quieres hacerlo por medio de un árbol-B, por ahí tengo un libro antiguo sobre estructuras de datos en lenguaje C donde en un capítulo traen un ejemplo de la implantación de un árbol-B en disco usando enteros cómo claves y el cual podrías adaptar a tus necesidades. Sólo que tendría que capturar el código para dártelo. Hace tiempo que he querido hacerlo sólo que por desidia no lo he hecho. Esto sería un aliciente para terminarlo

Una de las organizaciones de archivos más utilizada es la secuencial indexada, la cual es posible el acceso a un registro en particular (aleatoria) y el proceso secuencial a partir del inicio del archivo en cualquier otro registro del archivo.

Cada registro en el archivo se identifica por medio de un número o un grupo de caracteres exclusivos; la llave primaria.

Este tipo de estructura de datos que mejora la velocidad de las operaciones, permite un rápido acceso a los registros de una tabla en una base de datos sencilla, Al aumentar drásticamente la velocidad de acceso, se suelen usar sobre aquellos campos sobre los cuales se hagan frecuentes búsquedas.

Ejemplo

Ejemplo: creación del archivo indexado

Se desea indexar el archivo directo de almacén. Para ello se debe leer secuencialmente el archivo de

organización directa e incluir el código de producto y la posición de todas las ranuras ocupadas en un array de

índices. Al acabar el proceso se debe ordenar el array y almacenarlo de forma temporal en un archivo secuencial

para las siguientes ocasiones en que se desee gestionar el índice.

//Creación del archivo indexado a partir del archivo de productos

algoritmo CreaciónIndexado

const

MaxReg = 120

//El índice sólo tiene 100 posiciones ya que sólo hay 100 productos distintos

numElemIndice = 100

tipos

registro = rProducto

entero : código

cadena: desc

entero : stock

entero : estado

fin_registro

archivo_d de rProducto = aProducto

registro = RIndice

entero : clave

entero : NRR

fin_registro

array[0..numElemIndice] de RIndice = vIndice

var

aProducto : A

rProducto : R

vIndice : Ind

entero : n, NRR

inicio

abrir(A,lectura/escritura,'PRODUCTOS.DAT')

n  0

NRR  0

leer(A,R)

mientras no fda(A) hacer

NRR  NRR + 1

si R.estado = 1 entonces

n  n + 1

ind[n].clave  R.código

ind[n].NRR  NRR

fin_si

leer(A,R)

fin_mientras

cerrar(A)

Ordenar(Ind,n)

GuardarIndice(Ind,n)

fin

//Para no perder el array de índices, el procedimiento GuardarIndice

//lo vuelca en un archivo secuencial

procedimiento GuardarIndice(valor vIndice : v; valor entero : n)

var

archivo_s de RIndice : A

entero : i

inicio

abrir(A,escritura,'CODIGO.IDX')

desde i  1 hasta n hacer

escribir(A,v[i])

fin_siUPSAM, Escuela superior de Ingeniería y Arquitectura, Luís Rodríguez Baena, 2012 2

cerrar(A)

fin_procedimiento

http://www.youtube.com/watch?feature=player_detailpage&v=fcdoUhKYB50

ORGANIZACIÓN DE DATOS

miércoles, 17 de abril de 2013

martes, 12 de marzo de 2013

ARCHIVOS INDEXADOS

lunes, 11 de marzo de 2013