GNU/Linux >> Belajar Linux >  >> Linux

Bagaimana Cara Menghapus Bom Dari File Utf-8?

Saya memiliki file dalam penyandian UTF-8 dengan BOM dan ingin menghapus BOM. Apakah ada alat baris perintah linux untuk menghapus BOM dari file?

$ file test.xml
test.xml:  XML 1.0 document, UTF-8 Unicode (with BOM) text, with very long lines

Jawaban yang Diterima:

Jika Anda tidak yakin apakah file tersebut berisi UTF-8 BOM, maka ini (dengan asumsi implementasi GNU dari sed ) akan menghapus BOM jika ada, atau tidak membuat perubahan jika tidak.

sed '1s/^xEFxBBxBF//' < orig.txt > new.txt

Anda juga dapat menimpa file yang ada dengan -i pilihan:

sed -i '1s/^xEFxBBxBF//' orig.txt

Jika Anda menggunakan sed versi BSD (misalnya macOS) maka Anda harus membuat bash melakukan escaping:

 sed $'1s/xefxbbxbf//' < orig.txt > new.txt

Linux
  1. Cara Menghapus Kata Sandi Dari Kunci SSL Anda

  2. Bagaimana cara menghapus garis yang muncul pada file B dari file A lainnya?

  3. Bagaimana cara menghapus X byte dari akhir file besar tanpa membaca seluruh file?

  1. Bash Script Untuk Menghapus File Terlama Dari Folder A?

  2. Cara menggunakan sed untuk menghapus n baris terakhir dari sebuah file

  3. Bagaimana cara menghapus perangkat cache dari bcache?

  1. Cara menghapus kata sandi dari file pdf di Ubuntu

  2. Bagaimana cara menghapus baris baru dari file teks?

  3. Bagaimana cara mendeteksi jika suatu file memiliki BOM UTF-8 di Bash?