GNU/Linux >> Belajar Linux >  >> Linux

Bagaimana saya bisa meraster semua teks dalam PDF?

Anda dapat menguji apakah PDF berbasis gambar juga tercemar. Pertama, konversi PDF ke (multi halaman) TIFF, mis. dengan ghostscript:

gs -sDEVICE=tiffg4 -o sample.tif sample.pdf

Kemudian konversikan TIFF ke PDF, mis.:

tiff2pdf -z -f -F -pA4 -o sample-img.pdf sample.tif

Ini menghasilkan file PDF yang halamannya berupa gambar, bukan teks.

Cara lainnya, jika sistem Anda mendukung pencetakan file TIFF, cobalah untuk mencetaknya secara langsung.

Ada juga opsi pdf2ps untuk mengonversi PDF ke PS, yang jika berfungsi, kemungkinan akan lebih disukai.


Linux
  1. Bagaimana menemukan semua file yang jarang di Linux

  2. Bagaimana saya bisa menemukan semua ekstensi file yang berbeda dalam hierarki folder?

  3. Bagaimana saya bisa mendaftar semua vhosts di nginx

  1. Bagaimana saya bisa mendaftar semua IP di jaringan yang terhubung, lebih disukai melalui Terminal?

  2. Bagaimana saya bisa mengedit semua file yang dikembalikan oleh find in vi di Linux?

  3. Bagaimana saya bisa menyalin semua file pdf secara rekursif dalam direktori (dan itu subdirektori) ke dalam satu direktori keluaran?

  1. Cara menyaring / meraster PDF di Linux

  2. Bagaimana saya bisa mendapatkan daftar semua kata yang salah eja dalam teks menggunakan Linux?

  3. Bagaimana saya bisa memantau panjang antrian penerimaan?