GNU/Linux >> Belajar Linux >  >> Linux

Cara menghapus kata duplikat dari file teks biasa menggunakan perintah linux

Dengan asumsi bahwa kata-kata tersebut adalah satu kata per baris, dan file tersebut sudah diurutkan:

uniq filename

Jika file tidak diurutkan:

sort filename | uniq

Jika mereka bukan satu per baris, dan Anda tidak keberatan mereka menjadi satu per baris:

tr -s [:space:] \\n < filename | sort | uniq

Itu tidak menghapus tanda baca, jadi mungkin Anda ingin:

tr -s [:space:][:punct:] \\n < filename | sort | uniq

Tapi itu menghilangkan tanda hubung dari kata-kata yang ditulis dgn tanda penghubung. "man tr" untuk opsi lainnya.


ruby -pi.bak -e '$_.split(",").uniq.join(",")' filename ?

Saya akui kedua jenis kutipan itu jelek.


Linux
  1. Cara Menulis Teks Pada Gambar menggunakan Perintah Linux

  2. Bagaimana Cara Menghapus Garis Duplikat Di Dalam File Teks?

  3. 7 Contoh Perintah Linux Uniq untuk Menghapus Baris Duplikat dari File

  1. Cara membagi iso atau file menggunakan perintah 'split' di Linux

  2. Cara membuat file sparse di Linux menggunakan perintah 'dd'

  3. Bagaimana cara menghapus baris baru dari file teks?

  1. Cara Menghapus (Menghapus) File atau Direktori di Linux

  2. Cara Membuat File di Linux Menggunakan Terminal/Command Line

  3. Bagaimana cara melampirkan file menggunakan perintah mail di Linux?