GNU/Linux >> Belajar Linux >  >> Linux

python mengonversi dokumen microsoft office menjadi teks biasa di linux

Alat biasa untuk mengonversi dokumen Microsoft Office ke HTML atau format lain adalah mswordview, yang sejak saat itu telah diganti namanya menjadi vwWare.

Jika Anda mencari alat baris perintah, mereka benar-benar merekomendasikan penggunaan AbiWord untuk melakukan konversi:

AbiWord --to=txt

Jika Anda mencari perpustakaan, mulailah dari halaman ikhtisar wvWare. Mereka juga mengelola daftar pustaka dan alat yang membaca dokumen MS Office.


Saya akan memilih solusi baris perintah (lalu menggunakan modul subproses Python untuk menjalankan alat dari Python).

Pengonversi untuk msword (catdoc ), unggul (xls2csv ) dan ppt (catppt ) dapat ditemukan (dalam bentuk sumber) di sini:http://vitus.wagner.pp.ru/software/catdoc/.

Tidak dapat mengomentari kegunaan catppt tetapi catdoc dan xls2csv berfungsi dengan baik!

Tapi pastikan untuk terlebih dahulu mencari repositori distribusi Anda... Di ubuntu misalnya, catdoc hanyalah satu apt-get away yang cepat.


Anda dapat mengakses OpenOffice melalui Python API.

Coba gunakan ini sebagai basis:http://wiki.services.openoffice.org/wiki/Odt2txt.py


Linux
  1. Cara menginstal Python di Linux Mint 20

  2. Ubah Surat Masuk Dari Teks/biasa Menjadi Teks/html?

  3. Microsoft Teams Sekarang Tersedia di Linux

  1. Cara Menginstal Python 3.10 di Rocky Linux 8

  2. Editor teks baris perintah di Linux

  3. Contoh Perintah chfn di Linux

  1. Cara menginstal Python di Linux

  2. Konversikan semua halaman manual Linux menjadi teks / html atau penurunan harga

  3. Perbarui python di linux 2.7 ke 3.5