Pendahuluan
Apache Hive adalah alat pergudangan data yang digunakan untuk melakukan kueri dan menganalisis data terstruktur di Apache Hadoop. Ini menggunakan bahasa seperti SQL yang disebut HiveQL.
Dalam artikel ini, pelajari cara membuat tabel di Hive dan memuat data. Kami juga akan menunjukkan kepada Anda perintah HiveQL penting untuk menampilkan data.
Prasyarat
- Sistem yang menjalankan Linux
- Akun pengguna dengan sudo atau akar hak istimewa
- Akses ke jendela terminal/baris perintah
- Bekerja Hadoop pemasangan
- Bekerja Sarang pemasangan
Buat dan Muat Tabel di Hive
Tabel di Hive adalah kumpulan data yang menggunakan skema untuk mengurutkan data menurut pengenal yang diberikan.
Sintaks umum untuk membuat tabel di Hive adalah:
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name
(col_name data_type [COMMENT 'col_comment'],, ...)
[COMMENT 'table_comment']
[ROW FORMAT row_format]
[FIELDS TERMINATED BY char]
[STORED AS file_format];
Ikuti langkah-langkah di bawah ini untuk membuat tabel di Hive.
Langkah 1:Buat Basis Data
1. Buat database bernama “perusahaan” dengan menjalankan create
perintah:
create database company;
Terminal mencetak pesan konfirmasi dan waktu yang diperlukan untuk melakukan tindakan tersebut.
2. Selanjutnya, verifikasi database yang dibuat dengan menjalankan show
perintah:
show databases;
3. Temukan database “perusahaan” dalam daftar:
4. Buka database “perusahaan” dengan menggunakan perintah berikut:
use company;
Langkah 2:Buat Tabel di Hive
Basis data "perusahaan" tidak berisi tabel apa pun setelah pembuatan awal. Mari buat tabel yang pengidentifikasinya akan cocok dengan file .txt yang ingin Anda transfer datanya.
1. Buat file “employees.txt” di /hdoop direktori. File harus berisi data tentang karyawan:
2. Susun data dari file “employees.txt” dalam kolom. Nama kolom dalam contoh kita adalah:
- ID
- Nama
- Negara
- Departemen
- Gaji
3. Gunakan nama kolom saat membuat tabel. Buat tabel dengan menjalankan perintah berikut:
create table employees (id int, name string, country string, department string, salary int)
4. Buat skema logis yang mengatur data dari file .txt ke kolom yang sesuai. Dalam file “employees.txt”, data dipisahkan dengan '-'
. Untuk membuat jenis skema logis:
row format delimited fields terminated by '-';
Terminal mencetak pesan konfirmasi:
5. Verifikasi apakah tabel dibuat dengan menjalankan show
perintah:
show tables;
Langkah 3:Muat Data Dari File
Anda telah membuat tabel, tetapi tabel tersebut kosong karena data tidak dimuat dari file “employees.txt” yang terletak di /hdoop direktori.
1. Muat data dengan menjalankan load
perintah:
load data inpath '/hdoop/employees.txt' overwrite into table employees;
2. Verifikasi apakah data dimuat dengan menjalankan select
perintah:
select * from employees;
Terminal mencetak data yang diimpor dari employees.txt berkas:
Tampilkan Data Hive
Anda memiliki beberapa opsi untuk menampilkan data dari tabel. Dengan menggunakan opsi berikut, Anda dapat memanipulasi data dalam jumlah besar dengan lebih efisien.
Menampilkan Kolom
Menampilkan kolom tabel dengan menjalankan desc
perintah:
desc employees;
Output menampilkan nama dan properti kolom:
Tampilkan Data yang Dipilih
Mari kita asumsikan bahwa Anda ingin menampilkan karyawan dan negara asal mereka. Pilih dan tampilkan data dengan menjalankan select
perintah:
select name,country from employees;
Outputnya berisi daftar karyawan dan negara mereka: