Mengapa uniq menghitung kata yang identik sebagai berbeda?

Coba urutkan dulu:

cat .temp_occ | sort| uniq -c | sort -k1,1nr -k2 > distribution.txt

Atau gunakan "sort -u" yang juga menghilangkan duplikat. Lihat di sini.

Ukuran file tidak ada hubungannya dengan apa yang Anda lihat. Dari halaman manual uniq(1):

Catatan:'uniq' tidak mendeteksi baris berulang kecuali baris tersebut berdekatan. Anda mungkin ingin mengurutkan input terlebih dahulu, atau menggunakan 'sort -u' tanpa 'uniq'. Selain itu, perbandingan menghormati aturan yang ditentukan oleh 'LC_COLLATE'.`

Jadi jalankan uniq aktif

a
b
a

akan mengembalikan:

a
b
a

URL yang menyandikan string dalam skrip bash Larang akses memori yang tidak selaras pada x86/x86_64

Linux