Saya mencoba mengunduh http://ccachicago.org . secara rekursif , dan saya mendapatkan tepat satu file, root index.html , diunduh.
Saya telah melihat Unduh secara rekursif dengan wget dan mulai menggunakan -e robots=off yang direkomendasikan , tetapi masih berperilaku sama.
Caranya, dengan wget atau alat lain, dapatkah saya mengunduh salinan situs?
Jawaban yang Diterima:
Anda bertanya wget untuk melakukan rekursif unduh http://ccachicago.org , tetapi URL ini tidak menyediakan konten langsung apa pun. alih-alih itu hanya mengarahkan ulang ke http://www.ccachicago.org (yang belum Anda beri tahu wget untuk mengambil secara rekursif)..
jika Anda memberi tahu wget untuk mengunduh URL yang benar, ini akan berfungsi:
wget -r -e robots=off http://www....