Схема зірок та сніжинок у сховищі даних із прикладами

Зміст:

Anonim

Що таке багатовимірна схема?

Багатовимірна схема спеціально розроблена для моделювання систем зберігання даних. Схеми розроблені з урахуванням унікальних потреб дуже великих баз даних, розроблених для аналітичних цілей (OLAP).

Типи схеми сховища даних:

Нижче наведено 3 основні типи багатовимірних схем, кожна з яких має свої унікальні переваги.

  • Схема зірок
  • Схема сніжинки
  • Схема галактики

У цьому підручнику ви дізнаєтесь більше про

  • Що таке схема зірок?
  • Що таке схема сніжинки?
  • Схема зірок проти схеми сніжинки: ключові відмінності
  • Що таке схема Galaxy?
  • Що таке схема скупчення зірок?

Що таке схема зірок?

Схема зірок у сховищі даних, в якій центр зірки може мати одну таблицю фактів та ряд пов'язаних таблиць розмірностей. Вона відома як схема зірок, оскільки її структура нагадує зірку. Модель даних Star Schema - це найпростіший тип схеми сховища даних. Він також відомий як схема з’єднання зірки та оптимізований для запитів великих наборів даних.

У наступному прикладі зіркової схеми таблиця фактів знаходиться в центрі, де містяться ключі до кожної таблиці вимірів, такі як Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID та інші атрибути, такі як продані одиниці та дохід.

Приклад діаграми схеми зірок

Характеристики зіркової схеми:

  • Кожен вимір у схемі зірки представлений єдиною одновимірною таблицею.
  • Таблиця розмірів повинна містити набір атрибутів.
  • Таблиця розмірностей приєднується до таблиці фактів за допомогою зовнішнього ключа
  • Таблиця розмірів не приєднана одна до одної
  • Фактична таблиця містила б ключ і міру
  • Схема "Зірка" проста для розуміння та забезпечує оптимальне використання диска.
  • Таблиці розмірів не нормовані. Наприклад, на наведеному малюнку Country_ID не має таблиці пошуку країни, як це було б у дизайні OLTP.
  • Схема широко підтримується BI Tools

Що таке схема сніжинки?

Схема сніжинки у сховищі даних - це логічне розташування таблиць у багатовимірній базі даних, така що діаграма ER нагадує форму сніжинки. Схема сніжинки - це продовження зіркової схеми, яка додає додаткові розміри. Таблиці розмірностей нормалізовані, що розбиває дані на додаткові таблиці.

У наступному прикладі схеми сніжинок країна далі нормалізується в окрему таблицю.

Приклад схеми сніжинки

Характеристики схеми сніжинки:

  • Основною перевагою схеми сніжинки вона використовує менший простір на диску.
  • До схеми додано простіший варіант реалізації виміру
  • Через кілька таблиць продуктивність запитів знижується
  • Основна проблема, з якою вам доведеться зіткнутися під час використання схеми сніжинок, полягає в тому, що вам потрібно виконати більше зусиль з технічного обслуговування через більшу кількість таблиць пошуку.

Схема зірок проти схеми сніжинки: ключові відмінності

Нижче наведено ключову відмінність схеми зірок від схеми сніжинки:

Схема зірок Схема сніжинки
Ієрархії розмірів зберігаються у таблиці розмірів. Ієрархії розділені на окремі таблиці.
Він містить таблицю фактів, оточену таблицями розмірів. Одна таблиця фактів, оточена таблицею розмірностей, які в свою чергу оточені таблицею розмірностей
У схемі зірки лише одне об’єднання створює взаємозв’язок між таблицею фактів та будь-якими таблицями розмірів. Схема сніжинки вимагає багатьох об'єднань для отримання даних.
Простий дизайн БД. Дуже складний дизайн БД.
Денормалізована структура даних та запити також працюють швидше. Нормалізована структура даних.
Високий рівень надмірності даних Дуже низький рівень надмірності даних
Таблиця єдиного виміру містить зведені дані. Розбиття даних на різні вимірювальні таблиці.
Обробка куба відбувається швидше. Обробка куба може бути повільною через складне з'єднання.
Запропонує ефективніші запити за допомогою оптимізації запитів Star Join Query. Столи можуть бути з'єднані з різними розмірами. Схема Сніжинки представлена ​​централізованою таблицею фактів, яка навряд чи пов'язана з різними вимірами.

Що таке схема галактики?

Схема Galaxy містить дві таблиці фактів, які розділяють між собою таблиці розмірів. Її також називають схемою сузір'я фактів. Схема розглядається як колекція зірок, звідси і назва Галактична схема.

Приклад схеми галактики

Як ви можете бачити у наведеному вище прикладі, є дві таблиці фактів

  1. Дохід
  2. Продукт.

У схемах галактики розміри акцій називаються відповідними розмірами.

Характеристики схеми галактики:

  • Розміри в цій схемі розділені на окремі виміри на основі різних рівнів ієрархії.
  • Наприклад, якщо географія має чотири рівні ієрархії, як регіон, країна, держава та місто, тоді схема Галактики повинна мати чотири виміри.
  • Більше того, можна побудувати такий тип схеми, розділивши схему з однією зіркою на більше схем зірок.
  • Розміри великі в цій схемі, яку потрібно побудувати на основі рівнів ієрархії.
  • Ця схема корисна для узагальнення таблиць фактів для кращого розуміння.

Що таке схема скупчення зірок?

Схема сніжинки містить повністю розширені ієрархії. Однак це може ускладнити схему і вимагає додаткових об'єднань. З іншого боку, схема зірок містить повністю згорнуті ієрархії, що може призвести до надмірності. Отже, найкращим рішенням може бути баланс між цими двома схемами, яким є схема зіркової кластерної схеми.

Приклад схеми скупчення зірок

Розміри, що перекриваються, можна знайти як розгалуження в ієрархіях. Форк трапляється, коли сутність діє як батьківська у двох різних вимірних ієрархіях. Потім форкові сутності ідентифікуються як класифікація з відношеннями один до багатьох.

Короткий зміст:

  • Багатовимірна схема спеціально розроблена для моделювання систем зберігання даних
  • Зіркова схема - це найпростіший тип схеми сховища даних. Вона відома як схема зірок, оскільки її структура нагадує зірку.
  • Схема сніжинки - це продовження зіркової схеми, яка додає додаткові розміри. Його називають сніжинкою, оскільки її схема нагадує сніжинку.
  • У схемі зірки лише єдине з'єднання визначає взаємозв'язок між таблицею фактів та будь-якими таблицями розмірів.
  • Зіркова схема містить таблицю фактів, оточену таблицями розмірностей.
  • Схема сніжинки оточена таблицею розмірностей, які в свою чергу оточені таблицею розмірностей
  • Схема сніжинки вимагає багатьох об'єднань для отримання даних.
  • Схема Galaxy містить дві таблиці фактів, які мають спільні таблиці розмірів. Її також називають схемою сузір'я фактів.
  • Схема скупчення зірок містить атрибути схеми зірок та сніжинок.