GNU/Linux >> Belajar Linux >  >> Cent OS

Skema Bintang vs. Kepingan Salju

Pendahuluan

Bintang dan kepingan salju skema adalah desain penyimpanan logis yang biasa ditemukan di data mart dan arsitektur gudang data. Sementara tipe database umum menggunakan diagram ER (Entity-Relationship), struktur logis gudang menggunakan model dimensi untuk membuat konsep sistem penyimpanan.

Baca terus untuk mengetahui perbedaan, karakteristik, dan kekurangan skema bintang dan kepingan salju.

Skema Bintang vs. Skema Kepingan Salju:Perbedaan Utama

Dua elemen utama dari model dimensi skema bintang dan kepingan salju adalah:

1. Tabel Fakta . Tabel dengan jumlah data paling banyak, juga dikenal sebagai kubus .

2. Tabel dimensi . Struktur data turunan memberikan jawaban atas kueri atau dimensi ad hoc, yang sering disebut tabel pencarian .

Menghubungkan dimensi chosen yang dipilih di tabel fakta membentuk skema. Skema bintang dan kepingan salju menggunakan dimensi data untuk memodelkan sistem penyimpanan.

Perbedaan utama antara kedua skema adalah:

Skema Bintang Skema Kepingan Salju
Elemen Tabel Fakta Tabel Dimensi Tabel fakta Tabel dimensi Tabel subdimensi
Struktur Berbentuk bintang Berbentuk kepingan salju
Dimensi Satu tabel per dimensi Beberapa tabel untuk setiap dimensi
Arah Model Top-down Bottom-up
Ruang penyimpanan Menggunakan lebih banyak penyimpanan Menggunakan lebih sedikit ruang
Normalisasi Tabel dimensi yang didenormalisasi Tabel dimensi yang dinormalisasi
Kinerja Kueri Cepat, lebih sedikit GABUNG yang diperlukan karena lebih sedikit kunci asing Lambat, lebih banyak GABUNG yang diperlukan karena lebih banyak kunci asing
Kompleksitas Kueri Sederhana dan lebih mudah dipahami Rumit dan lebih menantang untuk dipahami
Redundansi Data Tinggi Rendah
Kasus penggunaan Tabel dimensi dengan beberapa baris, tipikal dengan data mart Tabel dimensi dengan beberapa baris ditemukan dengan gudang data

Karena kompleksitas skema kepingan salju dan kinerja yang lebih rendah, skema bintang adalah pilihan yang lebih disukai bila memungkinkan. Salah satu cara umum untuk mengatasi masalah dalam skema kepingan salju adalah dengan menguraikan penyimpanan khusus menjadi beberapa entitas yang lebih kecil dengan skema bintang.

Apa itu Skema Bintang?

Skema bintang adalah struktur logis untuk pengembangan data mart dan gudang data yang lebih sederhana. Model sederhana terdiri dari tabel dimensi yang terhubung ke tabel fakta di tengah.

Tabel fakta biasanya terdiri dari:

  • Data numerik yang dapat diukur, seperti nilai atau jumlah.
  • Referensi ke dimensi melalui kunci asing.

Tabel pencarian mewakili informasi deskriptif yang terhubung langsung ke tabel fakta.

Misalnya, untuk memodelkan penjualan bisnis e-niaga, tabel fakta untuk pembelian mungkin berisi total harga pembelian. Di sisi lain, tabel dimensi memiliki informasi deskriptif tentang item, data pelanggan, waktu atau lokasi pembelian.

Skema bintang untuk analisis pembelian dalam contoh memiliki empat dimensi. Tabel fakta terhubung ke tabel dimensi melalui konsep kunci asing dan kunci primer. Selain data numerik, tabel fakta juga terdiri dari kunci asing untuk mendefinisikan hubungan antar tabel.

Karakteristik Skema Bintang

Karakteristik utama dari skema bintang adalah:

  • Kueri yang disederhanakan dan cepat . Lebih sedikit operasi GABUNG karena denormalisasi membuat informasi lebih mudah tersedia.
  • Hubungan sederhana. Skema ini bekerja sangat baik dengan hubungan satu-ke-satu atau satu-ke-banyak.
  • Dimensi tunggal . Satu tabel menjelaskan setiap dimensi.
  • ramah OLAP . Sistem OLAP banyak menggunakan skema bintang untuk mendesain kubus data.

Kelemahan Skema Bintang

Kerugian menggunakan skema bintang adalah:

  • Redundansi . Tabel dimensi adalah satu dimensi, dan ada redundansi data.
  • Integritas rendah . Karena denormalisasi, memperbarui informasi adalah tugas yang rumit.
  • Kueri terbatas . Kumpulan pertanyaan terbatas, yang juga mempersempit daya analisis.

Apa itu Skema Kepingan Salju?

Skema kepingan salju memiliki struktur logis bercabang yang digunakan di gudang data besar. Dari tengah ke tepi, informasi entitas beralih dari umum ke lebih spesifik.

Terlepas dari elemen umum model dimensi, skema kepingan salju selanjutnya menguraikan tabel dimensi menjadi subdimensi.

Model analisis penjualan e-niaga dari contoh sebelumnya bercabang lebih lanjut ("kepingan salju") ke dalam kategori dan subkategori minat yang lebih kecil.

Empat dimensi terurai menjadi subdimensi. Tabel pencarian selanjutnya dinormalisasi melalui serangkaian objek yang terhubung.

Karakteristik Skema Kepingan Salju

Fitur utama skema kepingan salju meliputi:

  • Penyimpanan kecil . Skema kepingan salju tidak membutuhkan banyak ruang penyimpanan.
  • Perincian tinggi . Membagi tabel ke dalam subdimensi memungkinkan analisis di berbagai kedalaman minat. Menambahkan subdimensi baru juga merupakan proses yang sederhana.
  • Integritas . Karena normalisasi, skema memiliki tingkat integritas data yang lebih tinggi dan redundansi yang rendah.

Kelemahan Skema Kepingan Salju

Kelemahan skema kepingan salju adalah:

  • Kompleksitas . Model basis datanya kompleks, begitu pula kueri yang dieksekusi. Beberapa tabel multidimensi membuat desain menjadi rumit untuk digunakan secara keseluruhan.
  • Pemrosesan lambat . Banyak tabel pencarian memerlukan beberapa operasi GABUNG, yang memperlambat pengambilan informasi.
  • Sulit untuk dipertahankan . Tingkat granularitas yang tinggi membuat skema sulit untuk dikelola dan dipelihara.

Cent OS
  1. Bagaimana Cara Menggunakan Gsettings Ketika Tidak Ada Skema yang Terdaftar?

  2. Cara Mengubah Skema Tabel Mssql, Prosedur Tersimpan, dan Tampilan Semua pada Saat yang Sama

  3. Cara Menemukan Tabel Besar di Database SQL

  1. Dasar-dasar PHP &MySQL:Database &Tabel

  2. tidak ada skema yang dipilih untuk dibuat di ... error

  3. Melarikan diri dari karakter bintang (*) di bash

  1. Cara menyalin tabel MySQL antar database

  2. Cara memodifikasi bidang dalam tabel database dengan phpMyAdmin

  3. Cara menghapus bidang dari tabel database menggunakan phpMyAdmin