Saya melakukan pengikisan situs web untuk proyek konversi. Saya ingin melakukan beberapa statistik tentang jenis file di sana — misalnya, 400 .html
file, 100 .gif
, dll. Apa cara mudah untuk melakukannya? Itu harus rekursif.
Sunting: Dengan skrip yang diposting maxschelpzig, saya mengalami beberapa masalah karena arsitektur situs yang saya gores. Beberapa filenya bernama *.php?blah=blah&foo=bar
dengan berbagai argumen, sehingga dianggap unik. Jadi solusinya perlu mempertimbangkan *.php*
untuk menjadi semua dari tipe yang sama, sehingga untuk berbicara.
Jawaban yang Diterima:
Anda dapat menggunakan find
dan uniq
untuk ini, misalnya:
$ find . -type f | sed 's/.*.//' | sort | uniq -c
16 avi
29 jpg
136 mp3
3 mp4
Penjelasan perintah
find
mencetak semua nama file secara rekursifsed
menghapus dari setiap nama file awalan hingga ekstensi fileuniq
mengasumsikan input yang diurutkan-c
melakukan penghitungan (seperti histogram).
Linux – Konfigurasikan Sistem Linux Untuk Caching Sistem File yang Lebih Agresif?
Bagaimana Menangguhkan Dan Membawa Proses Latar Belakang Ke Latar Depan?