(Tidak terlalu sopan untuk menjawab pertanyaan Anda sendiri, tetapi inilah yang akhirnya saya dapatkan.)
LanguageTool adalah pemeriksa tata bahasa mandiri berbasis Java yang sangat bagus. Namun, ini berfungsi pada teks biasa. Oleh karena itu, saya perlu mengonversi dokumen LaTeX saya menjadi dokumen teks sejelas mungkin - Bukan tugas yang mudah. Saya berhasil melakukannya dengan menggunakan trik berikut:
- Saya mengatur agar semua pelampung mempertahankan posisinya menggunakan paket pelampung dan opsi H. Hal ini diperlukan agar teks tidak merusak paragraf saat diubah menjadi teks biasa.
- Saya menghapus nomor baris menggunakan paket nopageno.
- Saya menggunakan skrip sed untuk menyempurnakannya, seperti menambahkan titik pada nama bagian dan label deskripsi. Saya tidak menerbitkan skrip di sini, karena ini sangat spesifik untuk gaya dan konvensi saya sendiri.
- Setelah preprocessing ini, saya mengkompilasi ke DVI dan menjalankan
catdvi -s
. - Saya menggunakan skrip sed sederhana lainnya untuk menghilangkan baris kosong dan jeda halaman. Hasil akhirnya adalah konversi tekstual yang wajar dari dokumen LaTeX, yang dapat dikerjakan oleh LanguageTool.
Masih ada beberapa gangguan yang tersisa, seperti daftar program sebaris, yang tidak dapat dipahami oleh pemeriksa tata bahasa, tetapi secara keseluruhan saya mendapatkan pemeriksaan bukti otomatis yang layak darinya :)
Saya menulis pemeriksa tata bahasa untuk memeriksa dokumen TeX yang disebut LyX-GC. Ini juga dapat digunakan secara online sebagai aplikasi web.
Itu dapat menggunakan LanguageTool sebagai back-end. Keuntungan utama dibandingkan hanya menggunakan LanguageTool secara langsung adalah (1) memfilter TeX untuk menghindari kesalahan positif dari LanguageTool yang mencoba menginterpretasikan perintah TeX sebagai bahasa Inggris dan (2) memiliki ratusan aturan sendiri, termasuk aturan khusus TeX. Misalnya, ia mengetahui bahwa "See \ref{lem:foo}
" harus benar-benar menjadi "See Lemma \ref{lem:foo}
". (Selain itu, jika Anda menggunakan LyX, LyX-GC jelas memiliki keunggulan karena dapat berintegrasi dengan LyX.)
LyX-GC hanya benar-benar mendukung bahasa Inggris (walaupun ada dukungan Perancis eksperimental di repositori git).
Saya baru saja selesai menulis alat baru untuk memeriksa ejaan dan tata bahasa secara langsung pada file LaTeX, yang disebut TeXtidote :
https://sylvainhalle.github.io/textidote
Program ini dapat menghapus markup dari file dan mengirimkannya ke pustaka Alat Bahasa, yang melakukan verifikasi ejaan dan tata bahasa dalam selusin bahasa. Apa yang unik untuk TeXtidote adalah melacak posisi relatif kata-kata antara teks asli dan teks "bersih". Ini berarti dapat menerjemahkan pesan dari Alat Bahasa kembali ke lokasi yang tepat secara langsung di file sumber Anda. Secara default, TeXtidote menghasilkan laporan HTML yang menampilkan sumber asli Anda, dengan kesalahan yang ditemukan oleh Alat Bahasa disorot di lokasi yang benar:
Alat ini gratis dan mudah dipasang (OS-independen, membutuhkan Java). Saya mendorong Anda untuk mencobanya dan beri tahu saya pendapat Anda! (Informasi selengkapnya tentang pengunduhan/pemasangan/penggunaan dapat ditemukan di halaman Readme di repositori GitHub; klik tombol "Unduh" di situs web untuk membukanya.)