Saya selalu menggunakan “pdfgrep” untuk menelusuri di dalam beberapa file PDF dari baris perintah. Tetapi saya menemui masalah:Karakter pengikat ini "fi" (lihat https://www.compart.com/en/unicode/U+FB01).
"fi" ada di kata "fixed", jadi saya tidak bisa mencari istilah "operator titik tetap" dengan pdfgrep -iR 'fixed point operator'
. Namun, ketika saya membuka file dengan pembaca PDF seperti Foxit reader dan Evince, "fi" dibagi menjadi "f" dan "i", sehingga dapat dicari. Apakah ada alternatif yang lebih andal untuk "pdfgrep"? Atau apakah ada kata kunci pilihan di “pdfgrep” untuk memperluas penyandian?
File PDF adalah http://direct.mit.edu/books/chapter-pdf/238450/9780262321037_can.pdf .
Ubuntu 20.04, amd64, versi kernel Linux 5.6.0-1018-oem. pdfgrep memiliki opsi --unac
. Tetapi jika saya menginstal pdfgrep dengan sudo apt-get install pdfgrep
, perintah --unac
akan melaporkan “pdfgrep:dukungan UNAC dinonaktifkan pada waktu kompilasi!”
pdfgrep:
Installed: 2.1.2-1build1
Candidate: 2.1.2-1build1
Version table:
*** 2.1.2-1build1 500
500 http://mirrors.huaweicloud.com/ubuntu focal/universe amd64 Packages
100 /var/lib/dpkg/status
Jawaban yang Diterima:
Untuk mengatasi masalah ini, Anda harus terlebih dahulu menggunakan pdftotext
untuk mengetahui seperti apa ligatur Anda dalam bentuk UTF-8, misalnya saya menjalankan ini:
pdftotext -f 11 -l 13 ~/Mathematics/Analysis/MeasureTheory.pdf text && cat text
dan dapatkan sederet hasil seperti ini
1.6. Infinite and σ-finite measures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
maka saya tahu fi
sebenarnya adalah telepon dering di terminal, namun diterjemahkan sebagai fi
di peramban.
Jadi saya lanjutkan dengan pdfgrep
pdfgrep --page-range=11-13 fi ~/Mathematics/Analysis/MeasureTheory.pdf
Akhirnya, tentu saja saya mendapatkan hasil yang diinginkan:
1.6. Infinite and σ-finite measures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4. The general definition of the Lebesgue integral . . . . . . . . . . . . . . 118
2.6. Integration with respect to infinite measures . . . . . . . . . . . . . . . . 124
3.5. Infinite products of measures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187