GNU/Linux >> Belajar Linux >  >> Ubuntu

Cara Membuat Tabel di Hive

Pendahuluan

Apache Hive adalah alat pergudangan data yang digunakan untuk melakukan kueri dan menganalisis data terstruktur di Apache Hadoop. Ini menggunakan bahasa seperti SQL yang disebut HiveQL.

Dalam artikel ini, pelajari cara membuat tabel di Hive dan memuat data. Kami juga akan menunjukkan kepada Anda perintah HiveQL penting untuk menampilkan data.

Prasyarat

  • Sistem yang menjalankan Linux
  • Akun pengguna dengan sudo atau akar hak istimewa
  • Akses ke jendela terminal/baris perintah
  • Bekerja Hadoop pemasangan
  • Bekerja Sarang pemasangan

Buat dan Muat Tabel di Hive

Tabel di Hive adalah kumpulan data yang menggunakan skema untuk mengurutkan data menurut pengenal yang diberikan.

Sintaks umum untuk membuat tabel di Hive adalah:

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name
(col_name data_type [COMMENT 'col_comment'],, ...)
[COMMENT 'table_comment']
[ROW FORMAT row_format]
[FIELDS TERMINATED BY char]
[STORED AS file_format];

Ikuti langkah-langkah di bawah ini untuk membuat tabel di Hive.

Langkah 1:Buat Basis Data

1. Buat database bernama “perusahaan” dengan menjalankan create perintah:

create database company;

Terminal mencetak pesan konfirmasi dan waktu yang diperlukan untuk melakukan tindakan tersebut.

2. Selanjutnya, verifikasi database yang dibuat dengan menjalankan show perintah:

show databases;

3. Temukan database “perusahaan” dalam daftar:

4. Buka database “perusahaan” dengan menggunakan perintah berikut:

use company;

Langkah 2:Buat Tabel di Hive

Basis data "perusahaan" tidak berisi tabel apa pun setelah pembuatan awal. Mari buat tabel yang pengidentifikasinya akan cocok dengan file .txt yang ingin Anda transfer datanya.

1. Buat file “employees.txt” di /hdoop direktori. File harus berisi data tentang karyawan:


2. Susun data dari file “employees.txt” dalam kolom. Nama kolom dalam contoh kita adalah:

  • ID
  • Nama
  • Negara
  • Departemen
  • Gaji

3. Gunakan nama kolom saat membuat tabel. Buat tabel dengan menjalankan perintah berikut:

create table employees (id int, name string, country string, department string, salary int)

4. Buat skema logis yang mengatur data dari file .txt ke kolom yang sesuai. Dalam file “employees.txt”, data dipisahkan dengan '-' . Untuk membuat jenis skema logis:

row format delimited fields terminated by '-';

Terminal mencetak pesan konfirmasi:

5. Verifikasi apakah tabel dibuat dengan menjalankan show perintah:

show tables;

Langkah 3:Muat Data Dari File

Anda telah membuat tabel, tetapi tabel tersebut kosong karena data tidak dimuat dari file “employees.txt” yang terletak di /hdoop direktori.

1. Muat data dengan menjalankan load perintah:

load data inpath '/hdoop/employees.txt' overwrite into table employees;

2. Verifikasi apakah data dimuat dengan menjalankan select perintah:

select * from employees;

Terminal mencetak data yang diimpor dari employees.txt berkas:

Tampilkan Data Hive

Anda memiliki beberapa opsi untuk menampilkan data dari tabel. Dengan menggunakan opsi berikut, Anda dapat memanipulasi data dalam jumlah besar dengan lebih efisien.

Menampilkan Kolom

Menampilkan kolom tabel dengan menjalankan desc perintah:

desc employees;

Output menampilkan nama dan properti kolom:

Tampilkan Data yang Dipilih

Mari kita asumsikan bahwa Anda ingin menampilkan karyawan dan negara asal mereka. Pilih dan tampilkan data dengan menjalankan select perintah:

select name,country from employees;

Outputnya berisi daftar karyawan dan negara mereka:


Ubuntu
  1. Bagaimana Cara Membuat Usb yang Persisten?

  2. Bagaimana Cara Membuat Lingkup?

  3. Cara Membuat Subdomain

  1. Cara Membuat Pengguna Sudo di Debian

  2. Cara membuat tabel di PhpMyAdmin

  3. Cara membuat subdomain

  1. Cara Membuat Database MySQL di Workbench

  2. Cara Mengekspor Tabel PostgreSQL ke CSV

  3. Cara Menggunakan rsync untuk Mencadangkan Data