GNU/Linux >> Belajar Linux >  >> Linux

Bagaimana cara menggunakan Wget untuk mengunduh file secara rekursif dari direktori web?

Pertanyaan: Situs web intranet perusahaan saya menghosting perangkat dan aplikasi perangkat lunak GB. Saya telah mencoba mengunduh semuanya melalui perintah wget namun mempertahankan struktur direktori yang sama (direktori sumber telah mengatur alat di bawah berbagai kategori, yang saya suka mempertahankannya sama). Berikut ini contoh direktori web intranet – http://intranet.company.com/software-tools/ . 'Software-tools' adalah direktori yang berisi banyak subdirektori dan file. Saya ingin mengunduh semua itu secara rekursif menggunakan perintah wget. Tetapi sepertinya saya tidak dapat menemukan opsi yang tepat untuk wget? Dapatkah seseorang dari techglimpse membantu saya? – Naveen.

Jawaban:

wget adalah utilitas baris perintah untuk mengunduh file dari server web jarak jauh. Ini memungkinkan Anda mendownload file tertentu, mengulang direktori (maksud saya, secara rekursif) dan mendownload file dari subdirektori juga.

wget unduh rekursif

# wget  -r http://intranet.company.com/software-tools/

Perintah di atas akan mengunduh semua file dan direktori di dalam direktori 'perangkat lunak-alat'. Tapi ingat, itu juga akan mengunduh file 'index.html' di bawah direktori 'perangkat lunak' dan juga di dalam subdirektori. Untuk menghindarinya, Anda harus menggunakan opsi tolak dengan nilai sebagai ‘index.html’.

opsi tolak wget

# wget  -r --reject "index.html*" http://intranet.company.com/software-tools/

Catatan: Opsi rekursif untuk wget hanya akan berfungsi jika Daftar Direktori diizinkan oleh server web.

Contoh keluaran:

::::::::::::::::::::::::::
 Removing intranet.company.com/software-tools/index.html?C=M;O=D since it should be rejected.
 ::::::::::::::::::::::::::

Jangan naik ke direktori induk saat mengunduh secara rekursif menggunakan wget

Jika Anda tidak ingin wget mengikuti tautan di indeks direktori dan naik ke direktori induk, maka opsi ‘–no-parent’ harus digunakan seperti di bawah ini.

wget -r --no-parent --reject "index.html*" http://intranet.company.com/software-tools/

Anda akan menemukan informasi lebih lanjut dari man wget.


Linux
  1. Cara Mengunggah atau Mengunduh File/Direktori Menggunakan sFTP di Linux

  2. Dasar-dasar Linux:Cara Mengunduh File di Shell Dengan Wget

  3. Cara mengunduh File dari server SFTP Menggunakan skrip python

  1. Bagaimana cara ftp dan Mengunduh file dari Skrip Shell UNIX?

  2. wget vs curl:Cara Mengunduh File Menggunakan wget dan curl

  3. Cara mengunduh folder secara rekursif melalui FTP di Linux

  1. Bagaimana cara menggunakan perintah 'mv' untuk memindahkan file kecuali yang ada di direktori tertentu?

  2. Bagaimana cara mengunduh seluruh direktori dan subdirektori menggunakan wget?

  3. Bagaimana cara memindahkan semua file dari direktori saat ini ke direktori atas?