GNU/Linux >> Belajar Linux >  >> Linux

Bagaimana cara mengubah HTML menjadi teks?

Saya tidak berpikir curl memiliki prosesor HTML bawaan. Namun:

lynx --dump <URL>

melakukan trik.

Jika Anda masih ingin menggunakan curl, Anda bisa menggunakan html2text (tersedia di Ubuntu).


Anda dapat menginstal html2text (konverter HTML-ke-teks tingkat lanjut) dan penggunaannya langsung:

$ html2text http://example.com/
$ cat file.html | html2text -o file.txt

Pasang dengan:

  • Linux:apt-get install html2text
  • OS X:brew install html2text

Contoh dengan curl :

$ curl -sL google.com | html2text
Search Images Maps Play YouTube News Gmail Drive More ?
Web History | Settings | Sign in
     A better way to browse the web
       Get Google Chrome

          Advanced search Language tools

        [Google Search][I'm Feeling Lucky]

     Advertising Programmes Business Solutions+GoogleAbout GoogleGoogle.com
                           ? 2016 - Privacy - Terms

Linux
  1. Ubah Surat Masuk Dari Teks/biasa Menjadi Teks/html?

  2. Konversikan semua halaman manual Linux menjadi teks / html atau penurunan harga

  3. Mengkonversi gambar ke teks

  1. Bagaimana mengkonversi HTML ke PDF dengan HTMLDoc di Debian 10

  2. Cara menginstal Vim (vi) di Windows 10

  3. Cara membuka teks 80 karakter

  1. Cara mengonversi file teks ke semua huruf besar atau kecil

  2. Cara Mengonversi PDF ke Teks di Linux (GUI &Baris Perintah)

  3. Bagaimana cara mengubah output shell Linux ke HTML?