El standard de empremtes digitals del FBI

El estandard de compressió de imatges de empremtes digitals del FBI

Aquest pagina conté un sumari del estandard de compressió de imatges de empremtes digitals del FBI, desenvolupat pel FBI, el Laboratori Nacional de los Alamos i el Institut Nacional de Standards i Tecnologia. El standard és un algorisme basat en una transformació en onetes discreta a la que ens referirem com QSO (quantització escalar de onetes).

Resum i Exemples:

A començament dels anys 90 l'FBI va escanejar la base de dades americana de empremtes digitals a una resolució de 500 punts per polzada amb una escala de grisos de 8 bits. A aquest nivell de resolució una sola empremta es converteix en uns 10Mb de dades!

Aqui teniu una mostra de imatge d'empremta de tamany 768 x 768 pixels (= 589,824 bytes)

``Cap problema,'' em direu, ``Tinc un disc de 10 gigabyte al meu ordinador!''

Si, però l'FBI ha estat coleccionant empremtes des de 1924, i donat que (com a la majoria de nosaltres) li costa molt desfer-se de res, al llarg dels ultims 70 anys la seva collecció ha crescut fins als 200 millions d'emprentes que ocupen un "acre" de arxivadors en el edifici J. Edgar Hoover en Washington. (Als EEUU no tenen DNI i per tant no tenen una collecció de empremtes digitals de tota la seva població). En particular, quant se els demanar de comparar una empremta amb els ``sospitosos habituals'' s'han d'examinar uns 29 millions de empremtes.

El vostre disk de 10 gigues comença a quedarse curt quant s'ha d'enfrontar amb 2.000 terabytes d'imatges. I per fer les coses més dificils, les empremtes s'acumulen a una velocitat de 30.000 a 50.000 noves fitxes CADA DIA, produint un embus serios a la Autopista de la Informació. (Vinga, calculeu el temps que es requereix a enviar una empremta de 10Mb mitjançant un modem a 9600 baudis amb una perdua de un 20% de la velocitat en els protocols de comunicació).

``Be,'' em direu, ``Necessiten utilitzar alguna forma d'empaquetament de les dades. El millor seria utilitzar un mètode en que no es perdes cap pixel d'informació.''

Desafortunadament, en la pràctica els mètodes de empaquetament d'informació sense perdua de qualitat no aconsegueixen res millor que un empaquetament 2:1 en el cas d'empremtes. L'FBI necessita molt més per a fer una reducció important a la seva base de dades. Això implica utilitzar mètodes en de compressió en els que es perd informació. Això vol dir que haurem de tolerar alguna distorsió en les imatges comprimides.

``Cap problema! Poden utilitzar el standard ISO JPEG que s'utilitza molt en internet i que s'aplica a QUALSEVOL tipus d'imatge.''

Be, potser; veiem com es comporta en aquestes imatges. Aquí tenim una ampliació x4 del ``nucli'' (o centre) de la empremta que hem vist abans. El granulat que veieu representa els pixels individuals en el escanejat a 500 punts per polzada. Els punts blancs a mig de les ones negres són els porus de la suor, is son punts admisibles per identificació en un judici, així com les petites ``illes'' de carn que es troben entre dues ones. Com que aquests detalls són tot just de l'amplada de dos pixels, el nostre mètode de compressió ha de preservar els detalls importants al mateix nivell de resolució que l'escanejat, un problema MOLT dificil donat que la majoria dels algorismes de compressió funcionen eliminant els detalls més petits (amb una freqüencia més elevada) de la imatge.

Imatge original; tamany del fitxer: 589824 bytes.

Veieu ara el que queda despres de la compressió JPEG amb un factor de compressió 13:1. Els detalls fins s'han perdut del tot i tota la imatge té aquesta estructura artificial ``en blocs'' superposada. Aquests blocs son molt molestos no només pels experts en empremtes sino també per implementar sistemes automàtics de busqueda de empremtes.

Imatge JPEG; Tamany del fitxer 45853 bytes, factor de compressió 13:1.

A continuació feu una ullada a la mateixa imatge comprimida a un factor 13:1 pel mètode QSO (el algorisme que es va triar en aquest projecte). Els detalls fins es preserven millor que amb el JPEG, i no hi ha estructura en blocs!

Imatge QSO; tamany del fitxer 45621 bytes, factor de compressió 13:1

Per aquesta aplicació particular, on la qualitat de la imatge és la preocupació decisiva, la transformada wavelet és superior.

Aquesta pàgina és una traducció d'una pagina original de:

Chris Brislawn (brislawn@lanl.gov)