Ada sejumlah pembaca OCR untuk linux yang dapat mengonversi dari gambar ke teks. Lihat opsi berikut:
- GOCR:halaman Wikipedia
- Ocrad:halaman Wikipedia
- ocropus:halaman Wikipedia
- tesseract-ocr:halaman Wikipedia
Semua hal di atas, kecuali ocropus, ada di repositori Ubuntu dalam paket dengan nama yang sama.
Pembaca yang berbeda mendukung format gambar yang berbeda, jadi pilihan Anda mungkin dibatasi oleh format file dokumen Anda. Alternatifnya, Anda dapat menggunakan alat konversi dari ImageMagick untuk mengubah format jika Anda ingin menggunakan pembaca OCR tertentu.
Diadaptasi dari jawaban saya di sini.
Membuat komputer berbunyi bip dari jarak jauh pada speaker internal
Bagaimana cara Menggabungkan find dan grep untuk pencarian yang kompleks? ( GNU/linux, temukan, grep )