Coba urutkan dulu:
cat .temp_occ | sort| uniq -c | sort -k1,1nr -k2 > distribution.txt
Atau gunakan "sort -u" yang juga menghilangkan duplikat. Lihat di sini.
Ukuran file tidak ada hubungannya dengan apa yang Anda lihat. Dari halaman manual uniq(1):
Catatan:'uniq' tidak mendeteksi baris berulang kecuali baris tersebut berdekatan. Anda mungkin ingin mengurutkan input terlebih dahulu, atau menggunakan 'sort -u' tanpa 'uniq'. Selain itu, perbandingan menghormati aturan yang ditentukan oleh 'LC_COLLATE'.`
Jadi jalankan uniq
aktif
a
b
a
akan mengembalikan:
a
b
a