Pembaruan terakhir maximumcompression.com adalah Juni-2011 (jawaban diperbarui pada Okt-2015)
Oleh karena itu website ini tidak menyebutkan
kompresor teks juara saat ini di seluruh dunia :
cmix
Kompetisi/Tolok Ukur:
- enwiki6
Kompresi 18,2% dari file teks 1MB enwik6 - Calgary
Kompresi 17,6% dari 14 file corpus Calgary (berkas tar 3GB) - Hadiah Hutter
Kompresi 15,7% dari file teks 100MB enwik8
(tetapicmix
bukan pemenang karena membutuhkan terlalu banyak RAM, lebih dari 20GB) - Tolok Ukur Kompresi Sumber Terbuka Silesia
Kompresi 15,7% dari 202MB Silesia corpus - Tolok Ukur Kompresi Teks Besar
Kompresi 12,4% dari file teks 1GB enwik9
Detail:
Byron Knoll secara aktif mengembangkan cmix
sebagai perangkat lunak gratis (GPL) sejak 2013 berdasarkan buku Data Compression Explained oleh Matt Mahoney. Matt Mahoney juga mempertahankan beberapa tolok ukur di atas dan mengusulkan ZPAQ (WP), pengarsip tambahan baris perintah.
Jika Anda lebih suka alat yang lebih standar (membutuhkan lebih sedikit RAM), saya sarankan:
lrzip
lrzip
merupakan evolusi dari rzip
oleh Con Kolivas.
lrzip
singkatan dari dua nama:Long Range ZIP dan Lzma RZIP .
lrzip
seringkali lebih baik daripada xz
(alat kompresi populer lainnya).
Alexander Riccio juga merekomendasikan lrzip
.
Favorit saya adalah:
zpaq
"pakar pengarsipan" , Matt Mahoney, telah mengerjakan algoritme PAQ secara intensif selama sepuluh tahun dan memberikan kompromi terbaik antara sumber daya CPU/memori dan tingkat kompresi.
Namun, zpaq
terakhir versi tidak sering dikemas/tersedia di distro terbaru :-(
Saya selalu mengkompilasinya dari sumber ketika saya memiliki mesin baru dan saya membutuhkan kompresor yang sangat bagus:https://github.com/zpaq/zpaq
clone https://github.com/zpaq/zpaq
cd zpaq
g++ -O3 -march=native -Dunix zpaq.cpp libzpaq.cpp -pthread -o zpaq
Biasanya, bz2 memiliki rasio kompresi yang lebih baik, dikombinasikan dengan fitur pemulihan yang lebih baik.
OTOH, gz lebih cepat.
xz dikatakan lebih baik daripada bz2, tapi saya tidak tahu perilaku waktunya.
Mungkin Anda dapat melihat tolok ukur tersebut, terutama bagian yang menguji kompresi file log.