Pertanyaan: Situs web intranet perusahaan saya menghosting perangkat dan aplikasi perangkat lunak GB. Saya telah mencoba mengunduh semuanya melalui perintah wget namun mempertahankan struktur direktori yang sama (direktori sumber telah mengatur alat di bawah berbagai kategori, yang saya suka mempertahankannya sama). Berikut ini contoh direktori web intranet – http://intranet.company.com/software-tools/ . 'Software-tools' adalah direktori yang berisi banyak subdirektori dan file. Saya ingin mengunduh semua itu secara rekursif menggunakan perintah wget. Tetapi sepertinya saya tidak dapat menemukan opsi yang tepat untuk wget? Dapatkah seseorang dari techglimpse membantu saya? – Naveen.
Jawaban:
wget adalah utilitas baris perintah untuk mengunduh file dari server web jarak jauh. Ini memungkinkan Anda mendownload file tertentu, mengulang direktori (maksud saya, secara rekursif) dan mendownload file dari subdirektori juga.
wget unduh rekursif
# wget -r http://intranet.company.com/software-tools/
Perintah di atas akan mengunduh semua file dan direktori di dalam direktori 'perangkat lunak-alat'. Tapi ingat, itu juga akan mengunduh file 'index.html' di bawah direktori 'perangkat lunak' dan juga di dalam subdirektori. Untuk menghindarinya, Anda harus menggunakan opsi tolak dengan nilai sebagai ‘index.html’.
opsi tolak wget
# wget -r --reject "index.html*" http://intranet.company.com/software-tools/
Catatan: Opsi rekursif untuk wget hanya akan berfungsi jika Daftar Direktori diizinkan oleh server web.
Contoh keluaran:
:::::::::::::::::::::::::: Removing intranet.company.com/software-tools/index.html?C=M;O=D since it should be rejected. ::::::::::::::::::::::::::
Jangan naik ke direktori induk saat mengunduh secara rekursif menggunakan wget
Jika Anda tidak ingin wget mengikuti tautan di indeks direktori dan naik ke direktori induk, maka opsi ‘–no-parent’ harus digunakan seperti di bawah ini.
wget -r --no-parent --reject "index.html*" http://intranet.company.com/software-tools/
Anda akan menemukan informasi lebih lanjut dari man wget.