GNU/Linux >> Belajar Linux >  >> Linux

Cara mengimpor data ke Apache Solr

Baru-baru ini saya memandu Anda melalui proses penerapan platform pencarian tingkat perusahaan, Apache Solr. Dengan alat ini, Anda dapat mengambil data dalam jumlah besar dan menjalankan kueri penelusuran canggih terhadapnya dengan penyorotan klik, pengindeksan waktu nyata, pengelompokan dinamis, dan banyak lagi.

Setelah Apache Solr diterapkan, Anda harus dapat menambahkan data Anda ke koleksi sehingga dapat dicari. Di sini, kami akan mengimpor daftar data CSV (yang dapat berukuran berapa pun) ke dalam koleksi baru, lalu menjalankan kueri terhadap data baru.

Yang Anda perlukan

Untuk mengikuti ini, Anda memerlukan instance Apache Solr yang sedang berjalan (dengan kredensial pengguna Solr) dan file data CSV. Saya akan membuat contoh file data CSV yang dapat Anda gunakan sebagai template.

Cara membuat file CSV untuk diimpor

Hal pertama yang harus Anda lakukan adalah masuk ke server hosting Apache Solr, baik melalui SSH atau login lokal. Setelah login, buat file baru dengan perintah:

nano ~/solrdata.csv

Anda dapat memberi nama file ini apa pun yang Anda suka dan menyimpannya di direktori mana pun. Buat baris teratas yang menyertakan nama untuk setiap kolom:Saya akan mendemonstrasikan dengan file CSV yang mendefinisikan negara. Baris teratas akan menentukan beberapa item (seperti kode negara, wilayah, dan sub-wilayah) dan terlihat seperti ini:

Sumber terbuka:Liputan yang wajib dibaca

name,alpha-2,alpha-3,country-code,iso_3166-2,region,sub-region,intermediate-region,region-code,sub-region-code,intermediate-region-code

Sisa file berisi entri seperti ini:

Afghanistan,AF,AFG,004,ISO 3166-2:AF,Asia,Southern Asia,"",142,034,""

Åland Islands,AX,ALA,248,ISO 3166-2:AX,Europe,Northern Europe,"",150,154,""

Albania,AL,ALB,008,ISO 3166-2:AL,Europe,Southern Europe,"",150,039,""

Algeria,DZ,DZA,012,ISO 3166-2:DZ,Africa,Northern Africa,"",002,015,""

American Samoa,AS,ASM,016,ISO 3166-2:AS,Oceania,Polynesia,"",009,061,""

Andorra,AD,AND,020,ISO 3166-2:AD,Europe,Southern Europe,"",150,039,""

Angola,AO,AGO,024,ISO 3166-2:AO,Africa,Sub-Saharan Africa,Middle Africa,002,202,017

Anda dapat mengunduh seluruh contoh file country.csv dengan perintah:

wget https://cdn.wsform.com/wp-content/uploads/2018/09/country.csv

Simpan file tersebut ke drive lokal mesin hosting Apache Solr.

Cara membuat koleksi baru

Sekarang mari kita buat koleksi baru untuk menampung data negara kita. Kami akan memanggil koleksi ini "country_data" dan membuatnya dengan perintah:

su - solr -c "/opt/solr/bin/solr create -c country_data -n data_driven_schema_configs"

Anda akan dimintai kata sandi pengguna Solr. Setelah Anda berhasil mengautentikasi, koleksi akan dibuat, dan Anda siap untuk melanjutkan.

Cara mengimpor data

Ubah ke direktori perumahan Solr dengan perintah:

cd /opt/solr

Kita kemudian dapat mengimpor data dengan perintah:

./bin/post -c country_data /path/to/country.csv

Dimana /path/to adalah jalur yang tepat ke direktori yang menampung file country.csv yang baru diunduh.

Anda akan melihat output seperti ini:

Posting files to [base] url http://localhost:8983/solr/country_data/update...

Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log

POSTing file country.csv (text/csv) to [base]

1 files indexed.

COMMITting Solr index changes to http://localhost:8983/solr/country_data/update...

Time spent: 0:00:02.674

Cara melihat data baru

Masuk ke antarmuka web Apache Solr dengan mengarahkan browser ke http://SERVER:8983 (di mana SERVER adalah alamat IP dari server hosting). Pilih country_data dari tarik-turun data baru di navigasi kiri. Di jendela yang dihasilkan (Gambar A ), klik Kueri.

Gambar A

Di jendela yang dihasilkan, klik Execute Query tanpa mengubah apa pun dan seluruh dokumen yang diimpor akan terdaftar (Gambar B ).

Gambar B

Katakanlah Anda ingin mencari Irlandia. Ketik "Irlandia" di bagian q (di bawah umum) dan tekan Execute Query. Hasilnya hanya akan mencantumkan entri untuk, Anda dapat menebaknya, Irlandia (Gambar C ).

Gambar C

Cara yang lebih mudah untuk mengimpor data CSV

Bahkan ada cara yang lebih mudah untuk mengimpor data CSV ke Apache Solr.

Katakanlah Anda telah membuat koleksi baru, yang disebut pengumpulan data, dan Anda ingin mengimpor file country.csv dari antarmuka berbasis web. Masuk ke Apache Solr, pilih pengumpulan data dari drop-down, lalu klik Dokumen di navigasi kiri. Di jendela yang dihasilkan, pilih CSV dari tarik-turun Jenis Dokumen lalu salin/tempelkan seluruh konten file country.csv ke bagian Dokumen (Gambar D ).

Gambar D

Klik Kirim Dokumen dan Anda akhirnya akan melihat (di panel kanan) output berikut:

Status: success

Response:

{

"responseHeader": {

"status": 0,

"QTime": 3533

}

}

Sekarang Anda seharusnya dapat mengkueri data yang diimpor dengan cara yang sama seperti yang Anda lakukan sebelumnya.

Dan hanya itu yang diperlukan untuk mengimpor data berformat CSV ke Apache Solr. Ini adalah alat yang sangat kuat yang membuat pencarian kumpulan data yang sangat besar menjadi sangat sederhana. Jika bisnis Anda mengandalkan data, ini mungkin salah satu dari banyak alat yang Anda butuhkan.


Linux
  1. Cara Menginstal Apache Solr di Debian 10

  2. Cara Menginstal Apache Solr di CentOS 8

  3. Cara Menginstal Apache Solr di Ubuntu 14.04

  1. Bagaimana Cara Menulis File Ke Yang Lain?

  2. Bagaimana Cara Memasukkan Data Csv Ke Tabel Sqlite Melalui Pipa Shell?

  3. Cara Mengimpor Akun Email Menggunakan File CSV Atau Excel

  1. Cara Instal Apache Solr di AlmaLinux 8

  2. Cara Instal Apache Solr di Debian 11

  3. Cara Menginstal Apache Solr di CentOS 7