Що таке багатовимірна схема?
Багатовимірна схема спеціально розроблена для моделювання систем зберігання даних. Схеми розроблені з урахуванням унікальних потреб дуже великих баз даних, розроблених для аналітичних цілей (OLAP).
Типи схеми сховища даних:
Нижче наведено 3 основні типи багатовимірних схем, кожна з яких має свої унікальні переваги.
- Схема зірок
- Схема сніжинки
- Схема галактики
У цьому підручнику ви дізнаєтесь більше про
- Що таке схема зірок?
- Що таке схема сніжинки?
- Схема зірок проти схеми сніжинки: ключові відмінності
- Що таке схема Galaxy?
- Що таке схема скупчення зірок?
Що таке схема зірок?
Схема зірок у сховищі даних, в якій центр зірки може мати одну таблицю фактів та ряд пов'язаних таблиць розмірностей. Вона відома як схема зірок, оскільки її структура нагадує зірку. Модель даних Star Schema - це найпростіший тип схеми сховища даних. Він також відомий як схема з’єднання зірки та оптимізований для запитів великих наборів даних.
У наступному прикладі зіркової схеми таблиця фактів знаходиться в центрі, де містяться ключі до кожної таблиці вимірів, такі як Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID та інші атрибути, такі як продані одиниці та дохід.
Характеристики зіркової схеми:
- Кожен вимір у схемі зірки представлений єдиною одновимірною таблицею.
- Таблиця розмірів повинна містити набір атрибутів.
- Таблиця розмірностей приєднується до таблиці фактів за допомогою зовнішнього ключа
- Таблиця розмірів не приєднана одна до одної
- Фактична таблиця містила б ключ і міру
- Схема "Зірка" проста для розуміння та забезпечує оптимальне використання диска.
- Таблиці розмірів не нормовані. Наприклад, на наведеному малюнку Country_ID не має таблиці пошуку країни, як це було б у дизайні OLTP.
- Схема широко підтримується BI Tools
Що таке схема сніжинки?
Схема сніжинки у сховищі даних - це логічне розташування таблиць у багатовимірній базі даних, така що діаграма ER нагадує форму сніжинки. Схема сніжинки - це продовження зіркової схеми, яка додає додаткові розміри. Таблиці розмірностей нормалізовані, що розбиває дані на додаткові таблиці.
У наступному прикладі схеми сніжинок країна далі нормалізується в окрему таблицю.
Характеристики схеми сніжинки:
- Основною перевагою схеми сніжинки вона використовує менший простір на диску.
- До схеми додано простіший варіант реалізації виміру
- Через кілька таблиць продуктивність запитів знижується
- Основна проблема, з якою вам доведеться зіткнутися під час використання схеми сніжинок, полягає в тому, що вам потрібно виконати більше зусиль з технічного обслуговування через більшу кількість таблиць пошуку.
Схема зірок проти схеми сніжинки: ключові відмінності
Нижче наведено ключову відмінність схеми зірок від схеми сніжинки:
Схема зірок | Схема сніжинки |
---|---|
Ієрархії розмірів зберігаються у таблиці розмірів. | Ієрархії розділені на окремі таблиці. |
Він містить таблицю фактів, оточену таблицями розмірів. | Одна таблиця фактів, оточена таблицею розмірностей, які в свою чергу оточені таблицею розмірностей |
У схемі зірки лише одне об’єднання створює взаємозв’язок між таблицею фактів та будь-якими таблицями розмірів. | Схема сніжинки вимагає багатьох об'єднань для отримання даних. |
Простий дизайн БД. | Дуже складний дизайн БД. |
Денормалізована структура даних та запити також працюють швидше. | Нормалізована структура даних. |
Високий рівень надмірності даних | Дуже низький рівень надмірності даних |
Таблиця єдиного виміру містить зведені дані. | Розбиття даних на різні вимірювальні таблиці. |
Обробка куба відбувається швидше. | Обробка куба може бути повільною через складне з'єднання. |
Запропонує ефективніші запити за допомогою оптимізації запитів Star Join Query. Столи можуть бути з'єднані з різними розмірами. | Схема Сніжинки представлена централізованою таблицею фактів, яка навряд чи пов'язана з різними вимірами. |
Що таке схема галактики?
Схема Galaxy містить дві таблиці фактів, які розділяють між собою таблиці розмірів. Її також називають схемою сузір'я фактів. Схема розглядається як колекція зірок, звідси і назва Галактична схема.
Як ви можете бачити у наведеному вище прикладі, є дві таблиці фактів
- Дохід
- Продукт.
У схемах галактики розміри акцій називаються відповідними розмірами.
Характеристики схеми галактики:
- Розміри в цій схемі розділені на окремі виміри на основі різних рівнів ієрархії.
- Наприклад, якщо географія має чотири рівні ієрархії, як регіон, країна, держава та місто, тоді схема Галактики повинна мати чотири виміри.
- Більше того, можна побудувати такий тип схеми, розділивши схему з однією зіркою на більше схем зірок.
- Розміри великі в цій схемі, яку потрібно побудувати на основі рівнів ієрархії.
- Ця схема корисна для узагальнення таблиць фактів для кращого розуміння.
Що таке схема скупчення зірок?
Схема сніжинки містить повністю розширені ієрархії. Однак це може ускладнити схему і вимагає додаткових об'єднань. З іншого боку, схема зірок містить повністю згорнуті ієрархії, що може призвести до надмірності. Отже, найкращим рішенням може бути баланс між цими двома схемами, яким є схема зіркової кластерної схеми.
Розміри, що перекриваються, можна знайти як розгалуження в ієрархіях. Форк трапляється, коли сутність діє як батьківська у двох різних вимірних ієрархіях. Потім форкові сутності ідентифікуються як класифікація з відношеннями один до багатьох.
Короткий зміст:
- Багатовимірна схема спеціально розроблена для моделювання систем зберігання даних
- Зіркова схема - це найпростіший тип схеми сховища даних. Вона відома як схема зірок, оскільки її структура нагадує зірку.
- Схема сніжинки - це продовження зіркової схеми, яка додає додаткові розміри. Його називають сніжинкою, оскільки її схема нагадує сніжинку.
- У схемі зірки лише єдине з'єднання визначає взаємозв'язок між таблицею фактів та будь-якими таблицями розмірів.
- Зіркова схема містить таблицю фактів, оточену таблицями розмірностей.
- Схема сніжинки оточена таблицею розмірностей, які в свою чергу оточені таблицею розмірностей
- Схема сніжинки вимагає багатьох об'єднань для отримання даних.
- Схема Galaxy містить дві таблиці фактів, які мають спільні таблиці розмірів. Її також називають схемою сузір'я фактів.
- Схема скупчення зірок містить атрибути схеми зірок та сніжинок.