Hadoop memiliki dua komponen inti yaitu HDFS dan BENANG . HDFS adalah untuk menyimpan Data , BENANG adalah untuk memproses Data . HDFS adalah Sistem File Terdistribusi Hadoop , ia memiliki Namenode sebagai Layanan Utama dan Datanode sebagai Layanan Budak .
Node Nama adalah komponen penting Hadoop yang menyimpan metadata data yang disimpan di HDFS . Jika Namenode turun, seluruh cluster tidak akan dapat diakses, ini adalah satu-satunya titik kegagalan (SPOF ). Jadi, lingkungan produksi akan memiliki Ketersediaan Tinggi Namenode untuk menghindari penghentian produksi jika satu Namenode turun karena berbagai alasan seperti mesin mogok, aktivitas pemeliharaan terencana, dll.
Hadoop 2.x memberikan kelayakan di mana kita dapat memiliki dua Namenode , salah satunya adalah Aktif Namenode dan yang lainnya adalah Siaga Namenode .
- Node Nama Aktif – Ini mengelola semua operasi klien.
- Node Nama Siaga – Ini berlebihan dari Active Namenode . Jika NN Aktif turun, lalu Siaga NN akan mengambil semua tanggung jawab NN Aktif .
Mengaktifkan Ketersediaan Tinggi Namenode membutuhkan Penjaga Kebun Binatang yang wajib untuk failover otomatis. ZKFC (Pengendali Kegagalan Penjaga Kebun Binatang ) adalah Penjaga Kebun Binatang klien yang digunakan untuk mempertahankan status Namenode .
Persyaratan
- Praktik Terbaik untuk Menerapkan Server Hadoop di CentOS/RHEL 7 – Bagian 1
- Menyiapkan Prasyarat Hadoop dan Pengerasan Keamanan – Bagian 2
- Cara Menginstal dan Mengonfigurasi Cloudera Manager di CentOS/RHEL 7 – Bagian 3
- Cara Menginstal CDH dan Mengonfigurasi Penempatan Layanan di CentOS/RHEL 7 – Bagian 4
Dalam artikel ini, kita akan mengaktifkan Ketersediaan Tinggi Namenode di Pengelola Cloudera .
Langkah 1:Pemasangan Zookeeper
1. Masuk ke Pengelola Cloudera .
http://Your-IP:7180/cmf/home
2. Di Kluster (tekmin ) prompt tindakan, pilih “Tambahkan Layanan ”.
3. Pilih layanan “Penjaga Kebun Binatang ”.
4. Pilih server tempat kita akan memiliki Penjaga Kebun Binatang terpasang.
5. Kami akan memiliki 3 Penjaga Kebun Binatang untuk membentuk Kuorum Penjaga Kebun Binatang . Pilih server seperti yang disebutkan di bawah ini.
6. Konfigurasikan Penjaga Kebun Binatang properties, di sini kita memiliki yang default. Secara waktu nyata, Anda harus memiliki direktori/titik pemasangan terpisah untuk menyimpan Penjaga Kebun Binatang data. Di Bagian-1 , kami telah menjelaskan tentang konfigurasi penyimpanan untuk setiap layanan. Klik ‘lanjutkan ' untuk melanjutkan.
7. Instalasi akan dimulai, setelah menginstal Zookeeper akan dimulai. Anda dapat melihat operasi latar belakang di sini.
8. Setelah berhasil menyelesaikan langkah di atas, Status akan menjadi ‘Selesai '.
9. Sekarang, Penjaga Kebun Binatang berhasil Diinstal dan Dikonfigurasi. Klik tombol ‘Selesai '.
10. Anda dapat melihat Penjaga Kebun Binatang layanan di Cloudera Manager Dasbor.
Langkah 2:Mengaktifkan Namenode Ketersediaan Tinggi
11. Buka Pengelola Cloudera –> HDFS –> Tindakan –> Aktifkan Ketersediaan Tinggi .
12. Masukkan Nama Layanan Nama sebagai “nameservice1 ” – Ini adalah Namespace umum untuk Namenode Aktif dan standby.
13. Pilih Node Nama Kedua di mana kita akan memiliki Namenode siaga .
14. Di sini kami memilih master2.tecmint.com untuk siaga Namenode .
15. Pilih Jurnal node, ini adalah layanan wajib untuk menyinkronkan Aktif dan Siaga Namenode .
16. Kami membuat Jurnal Kuorum dengan menempatkan Jurnal node di 3 server seperti yang disebutkan di bawah ini. Pilih 3 server dan klik 'OK'.
17. Klik ‘Lanjutkan ' untuk melanjutkan.
18. Masukkan Node Jurnal jalur direktori. Kami hanya perlu menyebutkan jalur saat menginstal direktori ini akan secara otomatis dibuat oleh layanan itu sendiri. Kami menyebutkan sebagai ‘/jn’
. Klik ‘Lanjutkan ' untuk melanjutkan.
19. Ini akan mulai mengaktifkan Ketersediaan Tinggi .
20. Setelah menyelesaikan semua proses latar belakang, kita akan mendapatkan 'Selesai ’ Status.
21. Terakhir, kita akan mendapatkan notifikasi ‘Berhasil mengaktifkan Ketersediaan Tinggi '. Klik ‘Selesai '.
22. Verifikasi Aktif dan Node Nama Siaga dengan membuka Pengelola Cloudera –> HDFS –> Instance .
23. Di sini, Anda dapat melihat dua Namenode , satu akan berada di 'Aktif ' dan yang lainnya akan berada di 'Siaga ' menyatakan.
Kesimpulan
Dalam artikel ini, kami telah melalui proses langkah demi langkah untuk mengaktifkan Ketersediaan Tinggi Namenode . Sangat disarankan untuk memiliki Ketersediaan Tinggi Namenode di semua cluster dalam lingkungan waktu nyata. Silakan kirim keraguan Anda jika Anda menghadapi kesalahan saat melakukan proses ini. Kita akan melihat Ketersediaan Tinggi Manajer Sumber Daya di artikel selanjutnya.