GNU/Linux >> Belajar Linux >  >> Linux

Metode pengarsipan mana yang lebih baik untuk mengompresi file teks di Linux?

Pembaruan terakhir maximumcompression.com adalah Juni-2011 (jawaban diperbarui pada Okt-2015)
Oleh karena itu website ini tidak menyebutkan
kompresor teks juara saat ini di seluruh dunia :

      cmix

Kompetisi/Tolok Ukur:

  • enwiki6
    Kompresi 18,2% dari file teks 1MB enwik6
  • Calgary
    Kompresi 17,6% dari 14 file corpus Calgary (berkas tar 3GB)
  • Hadiah Hutter
    Kompresi 15,7% dari file teks 100MB enwik8
    (tetapi cmix bukan pemenang karena membutuhkan terlalu banyak RAM, lebih dari 20GB)
  • Tolok Ukur Kompresi Sumber Terbuka Silesia
    Kompresi 15,7% dari 202MB Silesia corpus
  • Tolok Ukur Kompresi Teks Besar
    Kompresi 12,4% dari file teks 1GB enwik9

Detail:
Byron Knoll secara aktif mengembangkan cmix sebagai perangkat lunak gratis (GPL) sejak 2013 berdasarkan buku Data Compression Explained oleh Matt Mahoney. Matt Mahoney juga mempertahankan beberapa tolok ukur di atas dan mengusulkan ZPAQ (WP), pengarsip tambahan baris perintah.

Jika Anda lebih suka alat yang lebih standar (membutuhkan lebih sedikit RAM), saya sarankan:

      lrzip

lrzip merupakan evolusi dari rzip oleh Con Kolivas.
lrzip singkatan dari dua nama:Long Range ZIP dan Lzma RZIP .
lrzip seringkali lebih baik daripada xz (alat kompresi populer lainnya).
Alexander Riccio juga merekomendasikan lrzip .

Favorit saya adalah:

      zpaq

"pakar pengarsipan" , Matt Mahoney, telah mengerjakan algoritme PAQ secara intensif selama sepuluh tahun dan memberikan kompromi terbaik antara sumber daya CPU/memori dan tingkat kompresi.

Namun, zpaq terakhir versi tidak sering dikemas/tersedia di distro terbaru :-(
Saya selalu mengkompilasinya dari sumber ketika saya memiliki mesin baru dan saya membutuhkan kompresor yang sangat bagus:https://github.com/zpaq/zpaq

clone https://github.com/zpaq/zpaq
cd zpaq
g++ -O3 -march=native -Dunix zpaq.cpp libzpaq.cpp -pthread -o zpaq

Biasanya, bz2 memiliki rasio kompresi yang lebih baik, dikombinasikan dengan fitur pemulihan yang lebih baik.

OTOH, gz lebih cepat.

xz dikatakan lebih baik daripada bz2, tapi saya tidak tahu perilaku waktunya.


Mungkin Anda dapat melihat tolok ukur tersebut, terutama bagian yang menguji kompresi file log.


Linux
  1. Gunakan anacron untuk crontab yang lebih baik

  2. Panduan Lengkap untuk Menggunakan AsciiDoc di Linux

  3. Linux vs Windows:OS Mana yang Lebih Baik untuk Game PC

  1. Cara Menggabungkan Dua File Teks di Linux

  2. Perangkat Lunak Kompresi File Manakah Untuk Linux yang Menawarkan Pengurangan Ukuran Tertinggi??

  3. Linux – Aplikasi Mana yang Digunakan Untuk Kalender?

  1. 3 editor teks ringan untuk Linux

  2. 10 Editor Teks Teratas untuk Desktop Linux

  3. Perintah Grep di Linux (Temukan Teks di File)