GNU/Linux >> Belajar Linux >  >> Linux

Cerita Linux:Saat pencadangan menyelamatkan hari

Artikel ini adalah cerita dari masa lalu saya. Saya dulu bekerja sebagai sysadmin untuk sebuah perusahaan yang menjalankan toko online yang menjual perangkat keras dan lunak komputer.

Di belakang, puluhan karyawan menggunakan server terminal untuk bekerja dengan perangkat lunak ERP yang mengatur semua barang dan perdagangan. Server terminal dan database sangat penting untuk proses bisnis penjualan produk kami. Ketika salah satu sistem ini gagal, lusinan karyawan tidak dapat melakukan pekerjaan mereka, dan pelanggan tidak dapat membeli apa pun lagi.

Berapa lama waktu yang kita miliki?

Jadi, kami duduk dengan pemilik proses bisnis dan bertanya:"Coba pikirkan situasi di mana sistem rusak dan tidak dapat digunakan lagi. Berapa lama Anda harus pulih sampai kerusakan pada perusahaan akan menghancurkan?" Manajer memikirkannya selama beberapa waktu dan berkata:"Dua jam, maksimal!"

Kami duduk dengan orang-orang yang menjalankan aplikasi ERP dan bertanya kepada mereka:"Berapa lama waktu yang dibutuhkan untuk menginstal ulang aplikasi dan mengkonfigurasi server terminal jika kami harus pulih dari kegagalan sistem yang fatal?" Jawabannya adalah:"Dua hari, minimal!" Saya kira Anda bisa melihat celahnya di sini.

Bagi saya, prioritas pertama adalah menurunkan waktu pemulihan dari dua hari menjadi di bawah dua jam. Menginstal ulang sistem operasi, aplikasi, dan memulihkan cadangan data bukanlah opsi karena membutuhkan waktu terlalu lama. Saya memilih aplikasi pencadangan gambar yang dapat melakukan pencadangan sistem lengkap, yaitu sistem operasi, aplikasi yang diinstal, pustaka, dan data. Dengan menggunakan software ini, saya dapat memulihkan sistem tanpa harus menyelesaikan tugas penginstalan manual.

Apa yang kita butuhkan?

Penyiapan klasik adalah menjalankan pencadangan di malam hari saat tidak ada orang yang bekerja. Jika terjadi kegagalan, kami harus mengembalikan gambar dari tadi malam atau mungkin versi yang lebih lama. Dalam skenario ini, pengujian menunjukkan bahwa kami membutuhkan lima jam untuk pemulihan total. Itu lebih baik dari dua hari tapi masih belum cukup baik. Dan ada masalah lain yang tersembunyi dalam pendekatan ini. Jika sistem mogok di malam hari, dan kami harus memulihkan dari cadangan tadi malam, kami akan kehilangan semua perubahan dari hari ini. Itu tidak dapat diterima untuk toko online kami. Nah, pikiran pertama kami adalah menjalankan pencadangan tambahan setiap jam. Dalam hal ini, kami hanya akan kehilangan data satu jam terakhir. Tetapi apa yang terjadi ketika masalah yang merusak sistem kami sudah ada di gambar cadangan ketika kami menemukan masalahnya? Nah, inilah yang kami lakukan.

Kami duduk kembali dan membahas berapa lama waktu yang diperlukan untuk menemukan masalah yang merusak yang akan mengarah pada pemulihan sistem. Kami menyepakati jangka waktu empat jam. Singkatnya, kami ingin kehilangan pekerjaan sesedikit mungkin, memulihkan dalam waktu maksimal dua jam, dan memastikan bahwa masalah belum ada dalam cadangan saat kami menemukannya. Dengan informasi ini, saya menyiapkan pendekatan pencadangan yang oleh vendor perangkat lunak disebut sebagai pemulihan instan, pemulihan bayangan, pemulihan preemptive, atau istilah serupa. Kami menjalankan tugas pencadangan tambahan setiap jam dan memulihkan cadangan di latar belakang ke mesin virtual baru. Setiap jam penuh, kami memiliki sistem yang siap empat jam ke belakang dan hanya perlu diselesaikan. Jadi, jika saya memilih untuk memulihkan inkremental dari satu jam yang lalu, itu akan memakan waktu lebih sedikit daripada pemulihan sistem lengkap karena hanya inkremental kecil yang harus dikembalikan ke mesin virtual yang hampir siap.

Dan usaha itu membuahkan hasil

Suatu hari, saya sedang berlibur, mengadakan barbekyu dan minum bir, ketika saya mendapat telepon dari rekan saya yang memberi tahu saya bahwa server terminal dengan aplikasi ERP rusak karena pembaruan yang gagal dan orang yang menjalankan pembaruan lupa mengambil snapshot terlebih dahulu.

Satu-satunya hal yang perlu saya beri tahu rekan saya adalah mematikan mesin yang rusak, menemukan UI sistem pencadangan/pemulihan kami, dan kemudian mengidentifikasi pekerjaan pemulihan. Akhirnya, saya memberi tahu dia cara memilih stempel waktu dari empat jam terakhir saat pemulihan harus selesai. Pemulihan selesai 30 menit kemudian, dan sistem siap digunakan kembali. Kami kembali beraksi setelah total 30 menit, dan hanya pekerjaan dari dua jam terakhir yang hilang! Luar biasa! Sekarang, kembali ke liburan.

Selesai

Jadi, ingatlah, waktu dan uang untuk solusi pencadangan dan pemulihan yang tepat dihabiskan dengan baik dalam hal pemulihan darurat.

[ Kursus online gratis:Ikhtisar teknis Red Hat Enterprise Linux. ]


Linux
  1. Cerita Linux:Saat pencadangan menyelamatkan hari

  2. Linux – Bagaimana Mengukur Waktu Ketika Sebuah Paket Tiba?

  3. Linux – Bagaimana Cara Menampilkan Sar Untuk Hari Sebelumnya?

  1. Linux – Nilai Vm.swappiness yang Tepat Saat Menggunakan Zram?

  2. Linux – Bagaimana Cara Mendapatkan Pacman Untuk Menggunakan Pkgbuilds Kustom Saat Memperbarui?

  3. Mencegah laptop bangun saat membuka tutupnya di linux

  1. Kuasai perintah Linux ls

  2. Menjinakkan perintah tar:Kiat untuk mengelola cadangan di Linux

  3. Bagaimana cara menjalankan skrip secara otomatis ketika konten direktori berubah di Linux?