Compressori loss-less
 

Originale

Conservando i files originali non si richiede decompressione. Non tutti hanno decompresssori o Ram o tempo necessario per la decompressione. Di solito se si verificano errori sui supporti, ed il file non è compresso, si può recuperare almeno una parte del file. Spesso i files ad alta entropia conviene lasciarli così. (es. gif, jpg, mp3, già archiviati, ecc)
 
 
WinZip
Versione 6.3, occupa 615KB. Parametri usati: Max compression.
Lo Zip è il formato più standard sul PC. Molte persone ad esempio possiedono WinZip o ZipMagic della Mijenix corp. Hanno la migliore interfaccia fra tutti i compressori, sono estremamente veloci e spesso comprimono a sufficienza.
Ma attenzione: molti vecchi computer non hanno installato neppure questo decompressore, per cui nel distribuire files compressi è bene includere anche il pkunzip o l'header di decompressione automatica.
ZipMagic ha il vantaggio di mostrare e gestire i files zip come directory. Il winZip è più stabile e lascia vedere le lunghezze dei file Zip. ZipMagic spesso comprime un poco di più.
Probabile algoritmo di compressione usato: variante dell' LZ77.
Reperibilità: le nuove versioni si trovano su tutti i principali siti di shereware, ad esempio 2Cows o Shereware.com, O suo sito http://www.winzip.com/winzip/
 
 

Rkive
Versione 1.92 beta 1, di Malcolm Taylor, 114 KB circa.

Contende a BOA la palma di miglior compressore testuale o per file a bassa entropia. Decente compressione multimediale. Alla massima compressione richiede talvolta quantitativi di RAM eccessivi, ed è più lento del BOA. Parametri usati: -mt3 o se 32MB di RAM non sono sufficienti, -mt2.
Algoritmo usato: ?
Reperibilità: Sua home page o archivio compressori.
 
 

Acb
Versione 2.00c di George Buyanovsky, 71KB circa.
Usa obbligatoriamente la compressione solida.
Non possiede la compressione multimediale.
Parametri usati nella Sfida: sempre compressione max (u)

     Molto potente per files generici, specialmente contenenti ripetitizioni lunghe e ad alta ridondanza, non multimediali. Ideale per HTML e sorgenti di programmi in genere. Buono per file testuali.
    Fra i programmi a linea di comando per Dos è quello di uso più semplice, sembra che esegua sempre quello che vogliamo fargli fare. Esegue automaticamente la ricerca ricorsiva di file in directory, permette con facilità di effettuare lo span dischi e di proteggere con password gli archivi.
    Fra tutti i compressori ha una particolarità quasi unica, detta Trainable Channel. Il programma genera un dizionario statistico per tutti i file che comprimiamo, e lo conserva. E' come se imparasse come sono fatti i file che comprimiamo di solito, e usasse ciò per ottenere file più piccoli. Da notare nella decompressione deve essere disponibile lo stesso dizionario.

Algoritmo usato: Variante personale di Buyanovsky della BWT (Trasfomata di M. Burrows & D.J. Wheeler).

Reperibilità: Archivio compressori. Riferimenti sulla BWT: Boom home page: http://www.cco.caltech.edu/~bloom/
Affidabilità: non mi ha mai dato prolemi con 32MB di Ram.
Velocità: al massimo (u) è fra i più lenti.
 
 

777
Versione 0.04 Beta 1 del 1° Mar. 1998 di Igor Pavlov, 157KB.
Possiede la compressione solida opzionale.
Possiede varie compressioni multimediali.
Parametri usati nella sfida: di solito non mi sono affidato alla ricerca automatica dl modello (-mg), ma li ho provati tutti e ho preso il più piccolo risultato.

Version 0.04 Beta 1 of May 1° 1998 by Igor Pavlov, 157KB.
It possesses the optional solid jam.
It possesses several multimediali jams.
Parameters used in the challenge: I haven't used the automatic model search parameter (- mg), but I have tried them all and I have taken the smallest result.

Questo è um compressore molto potente, grazie al fatto che contiene ben sette differenti algoritmi per comprimere file di tipo diffrente. In realtà probabilmente l'algorimo di compressione è uno solo, una codifica aritmetica dalla potenza mostruosa, sulla quale sono innestati dei modelli che sono adatti per file di struttura differente.
Usato in congiunzione con due compressori specifici per immagini (Bmf) e suoni (WavArc) produce risultati medi molto vicini al minimo assoluto, ottenuto usando quasi tutti i compressori.
Uno dei modelli che usa è detto "Strange method", ed effettivamente, come dice l'autore è in grado spesso di ricomprimere files già compressi a bassa densità, come quelli ottenuti da zip alla minima compressione, da Zoo o altri. Non so come funzioni, ma data la velocità di compressione di questo modello direi che è di ordine molto basso (cioè che sfrutta correlazioni di bassa lunghezza). Questo modello è tanto potente che una volta l'ho usato per mostrare che dei numeri pseudocasuali erano di qualità bassa, perchè comprimibili.

Ideale per eseguibili (paramertro -m9) e per files ad altissima entropia (parametro -m1). Spesso il migliore per file audio 8 bit mono a basso volume (parametro -m6), per i quali batte anche WaveArc (probabilmente perchè quest'ultimo non ha compressione entropica basata su un archivio dinamico, come quello dei buoni compressori).
Questo significa che sia 777 che WaveArc sarebbero migliorabili, usando il modello audio di WavArc innestato sulla compressione aritmetica (probabile) del 777.
In effetti su una compressione aritmetica di questa qualità si potrebbe innestare di tutto, incluso l'ottimo modello per immagini di Bmf.

Fra i più lenti e avidi di RAM, tanto che pare non si possa usare con files troppo grandi (la dimensione effettiva dipende dalla struttura informativa dei file, quelli a bassa entropia richiedono un dizionario più piccolo e richiedono meno Ram). Sono disponibili parametri per limitare il consumo di Ram.

Nella Sfida ho messo i file Caso50 e Caso100 per testare quanto i compressori aritmetici si avvicinano ai minimi teorici. Direi che i risultati sono imprevisti, dato che ad esempio ha vinto WinZip, ma buoni, dato che si sono avvicinati parecchio al minimo.

Possiede anche un comando per la scelta automatica del modello migliore per ogni file. E' una bella idea ma sceglie solo fra pochi modelli, è troppo lento, produce troppi accessi all'Hd, e non sempre sceglie il più adatto. L'autore dice che questo metodo prova a comprimere l'inizio del file con alcuni metodi, e sceglie quello dal risultato più piccolo. Io penso che l'inizio di un file possa avere caratteristiche diverse dal resto, per cui forse sarebbe meglio provare a comprimere un "riassunto" del file, ottenuto giuntando spezzoni presi quì e là nel file. Questa scelta automatica potrebbe basarsi anche, (o in alternativa, per scelte veloci) sul tipo di file, letto nel suo header, e poi usare metodi euristici per sceglirere il modello più adatto (ad esempio se è un eseguibile o simili potrebbe provare solo il modello generale e quello per eseguibili).

---

This is a very powerful compressor, thanks to the fact that contains seven different very algorithms in order to compress files of diffrente type. Probably it uses only an algoritm, an Arithmetic Compression of monstrous power, on which are grafted of the models that are adapted for files of different structure.
Used in conjunction with two specific compressors, for images (Bmf) and for sounds (WavArc) they products turned out next absolute minimum, obtained using nearly all the archivers.
One of the models that it uses is said "Strange method", and effectively, like says the author,  is in degree often of recrunch files already archived at low density, like those obtained from zip to the minimal power, Zoo or others. I do not know how it works, but given the speed of this model, I think that it is of very low order model (that is that it takes advantage of correlations of low length). This model is so powerful, that once I have used it in order to show that the numbers produced by a pseudorandom generator were of low quality, because they can be crunched.

It is ideal for executables (parameter -m9) and for very high entropy files (parameter -m1). Often it is the best for 8 bits mono audio to the low volume (parameter -m6), for which it probably strikes also WaveArc (probably due to the dynamic dictionary used in the best archivers).
This means that 777 and WaveArc can be perfected, using the audio model of WavArc grafted on the arithmetic coding (probable) of 777.
On an arithmetic coding of this quality it could be grafted everything, even the good model for images of Bmf.

It is one of the slowest and eager of RAM, a lot that seems it cannot be used with too much large files (the effective dimension depends on the informative structure of the files, those of low entropy demand a smaller dictionary and demand little Ram). Exists parameters to limit the Ram usage.

In the Challenge I have put the Caso50 and Caso100 files in order to test how much the arithmetic codings can approach the theoretical minimums. The result are unexpected, since as an example WinZip has won, but good, since best archivers have almost approached minimum.

It possesses also a command for the automatic choice of the best model for a file. It's a beautiful idea, but it search between few models, it is too much slow, it produces too many accesses to the Hd, and not always it chooses the best model. The author says that this method tries to archive the beginning of the files with some methods, and chooses that from the smaller result. I think that the beginning of a file can have characteristics different from the rest of it, for which it would perhaps be better to try to compress a "abstract" of the file, obtained gluing fragments of the file. This automatic selection could be based also, (or in alternative, for fast choices) on the type of file, bed in its header, and then use heuristic methods to select the best method (for example if it is an executable, or similar, it have only to try the general model and that one for executables).

Reperibilità: Archivio compressori e un suo mirror. Suo sito.
Affidabilità: Sufficiente per una beta, talvolta mi produce overflow di memoria.
Algoritmo usato: probabilmente codifica aritmetica.
Velocità: forse il più lento fra tutti quelli della sfida.

Where: The compression archive and his page.
Reliability: Sufficient for a beta, sometimes it produces me overflow of memory.
Algoritm used: probably it uses Arithmetic Coding.
Speed: perhaps the slowest between all those of the challenge.
 
 

Boa 0.58
Versione 0.58b di Ian Sutton, 104KB.
Parametri usati: -m15

Ideale per lunghi file di testo, per i quali si avvicina ai record del mondo di efficienza. Buono per file a bassa entropia. Talvolta funziona molto bene anche coi files ad entropia molto alta.
Piuttosto veloce, marcatamente più veloce di Rkive.
Questo compressore usa un quantitativo di Ram fissato dall'utente. Rkive invece ne usa molta, apparentemente senza limiti, per cui talvolta produce overflow.
Nel caso che il file non sia troppo grande (~400Kb per un file testo) e si abbiano almeno 32Mb di Ram, si può usare Rkive col parametro -mt3, ciò spesso produce un file più piccolo di quello prodotto dal Boa.
Reperibilità: Archivio compressori. Suo "sito".
 
 

Loco
LOCO-I/JPEG-LS Compressor - V.0.90  86KB circa

 

Eri 5
Bmp2Eri 5.01 (c) RAO Inc 47KB circa
Piuttosto potente. Può essere usato anche per immagini ad un byte/pixel col parametro -38
 
 

Minerva
minerva 1.00.44 Per librerie Pic vers. 1.03 (il pic che uso è "PICN4613 IMStar Compress") 658KB
E' uno dei pochi shereware a tempo indeterminato che possiede la compressione lossy di immagini con wavelet. Ottimo per compressione losless di immagini binarie, o a pochi colori per pixel.
 
 

Gif
Il formato più standard per le immagini. Massimo 1 byte/pixel. Foprmato grafico proprietario.
 

Bmf 0.3
BMF 0.3 di D. Shkarin 58KB circa
Mediamente il formato grafico lossless più denso. Meriterebbe di essere più noto.
 

Wa
WavArc (Wa) 1.1 di Dennis Lee  68KB
Mediamente il formato audio lossless più denso. Meriterebbe di essere più noto.

 

WinRar
Versione 2.04 di Eugene Roshal  474KB
Reperibilità: http://www.geocities.com/SiliconValley/Lakes/2797/
Forse l'unica alternativa allo Zip come standardizzazione, velocità e comodità d'uso.

 

Szip
Vers. 1.11BETA di Michael Schindler 39KB circa

Reperibilità: http://www.compressconsult.com/szip/
Dannatamente veloce, talvolta più dello Zip. Spesso ideale per file postscript. Buono per file testuali. Ha vinto una gara come algoritmo usato per comprimere in tempo reale gli enormi quantitativi di dati grezzi prodotti dai sensori di esperimenti dio fisica alle alte energie (acceleratori di particelle e simili).

Algoritmo usato: Trasformata S (da cui il nome), variante semplificata della traformata BWT.

Uharc
Uharc 0.2 di Uwe Herklotz  101KB
Ottimo per file multimediali non definiti.