GNU/Linux >> Belajar Linux >  >> Linux

Bagaimana cara mengekstrak semua tautan eksternal halaman web dan menyimpannya ke file?

Anda memerlukan 2 alat, lynx dan awk , coba ini:

$ lynx -dump http://www.google.com.br | awk '/http/{print $2}' > links.txt

Jika Anda membutuhkan baris penomoran, gunakan perintah nl , coba ini:

$ lynx -dump http://www.google.com.br | awk '/http/{print $2}' | nl > links.txt

Inilah peningkatan pada jawaban lelton:Anda tidak perlu awk sama sekali karena lynx memiliki beberapa opsi yang berguna.

lynx -listonly -nonumbers -dump http://www.google.com.br

jika Anda ingin angka

lynx -listonly -dump http://www.google.com.br

Linux
  1. Cara mengekstrak file .gz dan .tar.gz di Linux

  2. Perbedaan Antara Tautan Simbolik dan Tautan Keras?

  3. Simpan Semua Output Terminal Ke File?

  1. Semuanya ada di file titik - YADM dan Homeshick

  2. Apa itu Tautan Simbolik (Tautan Lunak) dan cara membuatnya di Linux

  3. Bagaimana cara menyimpan output dari perintah awk ini ke file?

  1. Bagaimana Menemukan Jenis File Img Dan Memasangnya?

  2. Cara mendapatkan semua file yang melebihi ukuran tertentu dan menghapusnya

  3. Bagaimana Anda mem-gunzip file dan menyimpan file .gz?