Saya mencoba mengunduh http://ccachicago.org
. secara rekursif , dan saya mendapatkan tepat satu file, root index.html
, diunduh.
Saya telah melihat Unduh secara rekursif dengan wget dan mulai menggunakan -e robots=off
yang direkomendasikan , tetapi masih berperilaku sama.
Caranya, dengan wget
atau alat lain, dapatkah saya mengunduh salinan situs?
Jawaban yang Diterima:
Anda bertanya wget
untuk melakukan rekursif unduh http://ccachicago.org
, tetapi URL ini tidak menyediakan konten langsung apa pun. alih-alih itu hanya mengarahkan ulang ke http://www.ccachicago.org
(yang belum Anda beri tahu wget
untuk mengambil secara rekursif)..
jika Anda memberi tahu wget
untuk mengunduh URL yang benar, ini akan berfungsi:
wget -r -e robots=off http://www....