GNU/Linux >> Belajar Linux >  >> Linux

Perencanaan kapasitas Linux:5 hal yang perlu Anda lakukan

Saya pikir banyak administrator sistem takut akan perencanaan kapasitas atau hanya berpikir itu tidak perlu. Pertama, tidak ada alasan untuk takut dengan perencanaan kapasitas (ini bukan ilmu roket); dan kedua, perencanaan kapasitas 100% diperlukan. Di masa lalu, administrator sistem harus berurusan dengan manajemen yang membuat keputusan besar untuk menambah kapasitas dan meningkatkan kinerja, baik dengan memasukkan sistem baru ke dalam campuran atau menambahkan CPU, RAM, atau penyimpanan yang lebih cepat. Biasanya, tetapi tidak selalu, masalah tetap ada di luar peningkatan dan penambahan kapasitas. Tetapi kualifikasi "biasanya" adalah bagian dari persamaan yang membuat administrator dan manajer sistem bingung—sampai-sampai tidak ada yang mau berurusan dengan kapasitas dan perencanaan kinerja dan administrasi yang sebenarnya.

Masalah ini tidak harus menjadi perjuangan. Dalam artikel ini, saya menyajikan lima hal yang perlu Anda ketahui untuk memulai perencanaan kapasitas Linux. Anda juga dapat menerapkan panduan ini ke lingkungan apa pun:Linux, Windows, Unix, atau versi campurannya.

Dasar-dasar perencanaan kapasitas

Ketika Anda membahas kapasitas, Anda benar-benar mendiskusikan kinerja. Kapasitas dan kinerja selalu disebutkan bersama. Anda harus mengukur dan memantau kinerja untuk melakukan perencanaan kapasitas apa pun. Kapasitas berarti kemampuan untuk memproses dan menyimpan data tanpa hambatan atau berdampak pada pengguna akhir. Sebagian besar waktu, administrator sistem memikirkan kinerja dalam hal pemrosesan data untuk situs web, database, atau aplikasi. Tapi, itu bukan di mana kinerja berakhir. Pikirkan tentang pencadangan dan pemulihan kinerja. Pencadangan memerlukan kompresi, deduplikasi, transfer disk-ke-disk, atau transfer over-the-network. Dan jangan lupa, memindahkan mesin virtual dari satu host ke host lain membutuhkan komputasi, penyimpanan, DAN kapasitas jaringan.

Takeaway Anda di sini adalah ini:Kapasitas dan kinerja terlalu erat kaitannya untuk memisahkan mereka ke dalam percakapan yang berbeda. Mari kita lihat langkah-langkah dalam proses ini.

Pertama:Dapatkan dasar

Tidak masalah apakah sistem Anda baru atau berusia tiga tahun, Anda harus menetapkan garis dasar sebelum dapat memulai perencanaan dan proyeksi kapasitas. Menetapkan baseline agak memakan waktu karena baseline bukanlah snapshot, melainkan pandangan kinerja jangka panjang. Gunakan setidaknya satu bulan dasar untuk setiap sistem. Data satu bulan akan memberi Anda rentang kinerja yang dapat digunakan untuk merencanakan dan memperkirakan kebutuhan kapasitas.

Ada tiga angka yang perlu Anda periksa setelah Anda mengumpulkan tanggal awal:beban atau penggunaan puncak, rendah, dan rata-rata. Setelah menganalisis data ini, Anda akan menyadari mengapa Anda tidak dapat bergantung pada snapshot beban untuk memandu Anda melalui proses perencanaan kapasitas. Garis dasar memberi tahu Anda di mana Anda berada dalam proses ini.

Kumpulan data berikutnya yang perlu Anda pertimbangkan adalah kapasitas saat ini. Anda perlu menilai RAM, CPU, disk, dan informasi kapasitas jaringan. Kemudian, Anda perlu mencari tahu berapa kapasitas maksimum Anda untuk setiap sistem. Perbedaan antara kapasitas saat ini dan maksimum memberi Anda kapasitas pertumbuhan Anda. Misalnya, pertimbangkan sistem yang memiliki konfigurasi berikut:dua CPU Quad-core, RAM 128GB, dua disk 1TB di RAID 1 (dicerminkan), dan satu antarmuka jaringan Ethernet Gb ganda. Maka, kapasitas maksimum Anda untuk sistem ini adalah empat CPU quad-core, RAM 512 GB, enam disk, dan dua slot PCIe terbuka untuk kartu ekspansi seperti kartu antarmuka jaringan Ethernet Gb (NIC).

 
CPU 2 - Inti empat 4 - Inti empat
RAM 128 GB 512 GB
Disk 2 Disk - 1 TB - RAID 1 6 Disk
NIC 2 GbE (Dual) 6 GbE (Dual) - 10 GbE (Quad)

Sekarang, bandingkan keduanya. Sistem ini memiliki lebih banyak kapasitas yang tersedia untuk meningkatkan daya komputasi, jaringan, dan penyimpanan. Parameter kapasitas perangkat keras ini ditambah data kinerja bulanan Anda adalah titik awal Anda dalam memprediksi kebutuhan akan kapasitas tambahan, baik dalam bentuk peningkatan sistem atau pembaruan teknologi lengkap.

Kedua:Siapkan pemantauan kinerja

Jika Anda belum memiliki paket pemantauan kinerja seperti sysstat diinstal, Anda dapat dengan mudah melakukannya dari repositori default. Periksa untuk melihat apakah Anda memiliki sysstat :

$ rpm -qa |grep sysstat

Jika Anda tidak memilikinya, maka instal dengan:

$ sudo yum -y install sysstat

Jalankan dua perintah berikut untuk menjalankan sysstat pengumpul data saat startup dan kemudian memulai sysstat pengumpul data di sistem Anda:

$ sudo systemctl enable sysstat sysstat-collect.timer sysstat-summary.timer

$ sudo systemctl start sysstat sysstat-collect.timer sysstat-summary.timer

sysstat paket terdiri dari beberapa perintah yang melaporkan statistik kinerja pada berbagai subsistem dan layanan dari CIFS/Samba ke disk hingga tugas Linux. Perintah yang paling berguna adalah sar , Pelapor Aktivitas Sistem. sar perintah memberi Anda daftar statistik aktivitas sistem yang berjalan. Setiap pengguna dapat mengeluarkan sar perintah untuk melihat statistik:

$ sar 
Linux 4.18.0-80.7.1.el8_0.x86_64 (rhel) 	08/14/2019 	_x86_64_	(1 CPU)

12:00:24 AM     CPU     %user     %nice   %system   %iowait    %steal     %idle
12:10:01 AM     all      0.22      0.00      0.43      0.01      0.00     99.33
12:20:32 AM     all      1.18      0.05      1.24      0.12      0.00     97.41
12:30:01 AM     all      0.27      0.00      0.49      0.01      0.00     99.23
12:40:32 AM     all      0.20      0.00      0.38      0.00      0.00     99.41
12:50:32 AM     all      0.18      0.00      0.36      0.01      0.00     99.46

Secara default, statistik sistem dikumpulkan setiap 10 menit. sar perintah menampilkan statistik sistem umum, tetapi opsi statistik yang jauh lebih berguna dan ekstensif menyediakan segalanya sar ditawarkan, menggunakan -A pilihan:

$ sar -A

Outputnya terlalu panjang untuk diposting di sini, tetapi perhatikan bahwa Anda akan melihat semua statistik untuk setiap subsistem dan layanan yang sar mengumpulkan. Silakan merujuk ke sar halaman manual untuk informasi lebih lanjut dan detail tentang statistik spesifik dan opsinya.

Ketiga:Analisis dan plot data

sysstat kolektor mengumpulkan informasi sistem dan menyimpannya di bawah /var/log/sa . Nomor file adalah hari dalam bulan dari mana mereka dikumpulkan. Anda memerlukan beberapa metode untuk mengumpulkan dan menganalisis data ini. Saya menyarankan Orca Blair Zajac. Saya juga menyarankan agar Anda mentransfer data yang dikumpulkan ke repositori pusat untuk diproses dan ditampilkan. Dengan kata lain, jangan memproses statistik Anda pada sistem produksi Anda karena hal itu akan berdampak negatif pada statistik kinerja Anda dan mengubah hasil Anda.

Orca tidak sepele tetapi tidak terlalu sulit untuk diatur. Beberapa tahun yang lalu, saya menulis artikel yang membantu Anda mulai menampilkan statistik kinerja Anda di server web dengan Orca. Orca sudah lama tidak diperbarui, tetapi masih berfungsi seperti yang ditunjukkan dalam dokumentasi dan artikel saya.

Keempat:Tetapkan ambang batas performa

Untuk setiap produksi atau sistem yang dipantau, Anda harus menjawab pertanyaan:"Seberapa sibuk apa sibuk?" Tidak ada jawaban yang sempurna, dan Anda kemungkinan akan mengubah angka di beberapa titik untuk mengurangi berapa banyak notifikasi yang Anda terima dari pelanggaran ambang batas tersebut. Misalnya, katakanlah Anda memiliki lima server web yang memiliki beban seimbang untuk memasok layanan web ke pelanggan eksternal Anda, dan Anda perlu memantau kinerjanya untuk memprediksi kapan harus menambahkan lebih banyak sistem ke tambak, atau kapan Anda dapat mengambil satu atau lebih offline.

Sebagai tes awal, Anda menetapkan ambang CPU pada 80% sibuk untuk kelima server. Dua kali per hari, Anda menerima peringatan email bahwa sistem Anda telah melampaui 80%. Masalah? Anda menerima peringatan setiap lima menit dari kelima server, selama dua jam, dua kali sehari. Ini merupakan indikasi bahwa ambang batas yang ditetapkan terlalu rendah kecuali jika Anda senang mendapatkan semua notifikasi tersebut.

Anda harus melihat performa selama waktu puncak tersebut untuk memutuskan di mana harus menetapkan ambang batas, dan apakah Anda perlu menambahkan lebih banyak sistem ke peternakan untuk menurunkan pemanfaatan secara keseluruhan atau tidak. Setelah memeriksa angka-angkanya, Anda melihat bahwa pemanfaatan tidak pernah melebihi 87% untuk waktu puncak apa pun di server mana pun. Anda kemudian memutuskan untuk menyetel ambang batas CPU pada 90% dan terus memeriksa monitor setiap lima menit, tetapi Anda menurunkan ambang peringatan menjadi 90% selama lebih dari dua jam. Ini berarti bahwa jika penggunaan CPU sistem melebihi 90% selama lebih dari dua jam, Anda akan menerima pemberitahuan. Ambang batas untuk lingkungan ini masuk akal dan dapat dikelola. Tingkat toleransi Anda untuk menambahkan sistem baru ke peternakan, setelah beberapa bulan pengamatan, adalah CPU di atas 95% selama lebih dari dua jam.

Ini adalah proses menentukan seberapa sibuk sibuk dan tingkat toleransi Anda untuk setiap layanan. Tampaknya arbitrer, tetapi tidak, karena Anda mengamati data secara terus menerus dan membuat penyesuaian dan keputusan berdasarkan pengamatan Anda. 90% pemanfaatan selama dua jam tidak berlebihan, tetapi Anda tidak ingin melebihi level tersebut karena pengguna akan mulai mengalami waktu tunggu yang lama saat menarik data dari sistem Anda.

Kelima:Peringatan performa

Saya telah membahas peringatan tetapi belum memberi Anda solusi untuk membuat dan menangani acara (peringatan). Anda dapat membuat sesuatu yang sederhana seperti skrip Bash untuk memeriksa sar data untuk nomor pemanfaatan, tetapi Anda juga dapat menerapkan solusi komersial atau bahkan sesuatu di antaranya. Saya tidak akan merekomendasikan solusi peringatan kepada Anda, tetapi ada beberapa aplikasi pemantauan dan peringatan open source yang tersedia. Sebagian besar berbasis agen, jadi tambahkan menginstal dan memelihara layanan lain ke daftar tugas administrasi Anda.

Seperti yang dinyatakan di bagian sebelumnya, Anda harus menyesuaikan ambang batas dan toleransi Anda untuk menghindari membuat diri Anda gila dengan peringatan, terutama jika peringatan itu muncul sebagai teks ke telepon Anda. Anda hanya ingin diberi tahu jika ada sesuatu yang tidak beres atau dalam masalah dan memerlukan perhatian Anda untuk penyelesaiannya.

Dilema perencanaan kapasitas

Dilema perencanaan kapasitas dan pemantauan kinerja akhir-akhir ini adalah bahwa alih-alih membeli beberapa rak server, Anda mungkin menyewa perangkat keras server Anda, atau Anda menggunakan semacam solusi cloud di mana kapasitas dan kinerja ditangani secara dinamis oleh aturan bisnis. . Sewa perangkat keras tiga tahun menentukan bahwa Anda harus melakukan penyegaran perangkat keras setiap tiga tahun, apakah Anda perlu atau tidak. Jenis kebijakan perangkat keras yang Anda miliki di perusahaan Anda tentu saja mengubah cara Anda merencanakan perubahan kapasitas.

Jika Anda menyewa, Anda masih perlu melakukan pemantauan kinerja dan memikirkan kapasitas, karena jika Anda memiliki perangkat keras yang terlalu kecil atau kurang dibeli, Anda pasti perlu mengetahuinya. Jika Anda membeli, maka Anda harus melihat kinerja dan perencanaan kapasitas secara bergulir lima tahun. Saya katakan lima tahun karena manajer dan pemilik bisnis tidak ingin mengganti perangkat keras setiap tiga tahun jika mereka membelinya. Kemungkinan mereka menggunakan pembelian perangkat keras sebagai aset yang diamortisasi.

Trik dengan aset yang dibeli adalah Anda tidak ingin membuang kapasitas dengan membeli terlalu banyak terlalu cepat. Ada banyak cerita yang beredar tentang orang yang membeli sistem top-of-the-line hanya untuk menyegarkannya dalam lima tahun tanpa pernah mengetuk kapasitas sistem tersebut, dan setelah lima tahun mereka terlalu tua untuk repot memperbarui dan meningkatkan. Intinya untuk memperoleh perangkat keras baru yang disewa atau dibeli adalah membeli dengan mempertimbangkan pertumbuhan dan kemudian memanfaatkan pertumbuhan itu dengan menganggarkan untuk peningkatan berdasarkan pemanfaatan. Dengan kata lain, beli apa yang Anda butuhkan, tingkatkan versi sesuai kebutuhan, dan manfaatkan sepenuhnya aset perangkat keras Anda sebelum siklus penyegaran berikutnya.

Ringkasan

Perencanaan kapasitas dan pemantauan kinerja bekerja sama untuk memberi Anda gambaran lengkap tentang siklus hidup perangkat keras dan perangkat lunak Anda. Sangat penting untuk meluangkan waktu dan melakukan upaya untuk mengatur pemantauan dan peringatan, dan untuk menganalisis data. Terlalu sering, administrator sistem yang sibuk menyiapkan solusi rumit untuk pemantauan dan kemudian mengabaikannya. Temukan cara untuk mencapai keseimbangan antara tergila-gila dengan peringatan performa dan tidak pernah melihat peringatan yang mengakibatkan waktu henti yang diperpanjang. Perencanaan kapasitas juga membantu Anda menghemat uang dengan menerapkan ulang layanan dari sistem yang terlalu banyak digunakan ke sistem yang kurang dimanfaatkan.


Linux
  1. 30 hal yang tidak Anda ketahui tentang kernel Linux

  2. 3 hal berguna yang dapat Anda lakukan dengan alat IP di Linux

  3. 10 perintah dasar Linux yang perlu Anda ketahui

  1. 3 terminal Linux yang perlu Anda coba

  2. 24 desktop Linux yang perlu Anda coba

  3. Apakah Linux memerlukan pembersihan sesekali?

  1. 15 hal yang perlu Anda ketahui tentang Struktur Direktori Linux

  2. Kompresi File Linux:Semua yang Perlu Anda Ketahui

  3. Izin File Linux:Semua yang Perlu Anda Ketahui