Що таке OLAP? Куб, Операції & Типи в сховищі даних

Зміст:

Anonim

Що таке OLAP?

Онлайн-аналітична обробка (OLAP) - це категорія програмного забезпечення, що дозволяє користувачам одночасно аналізувати інформацію з декількох систем баз даних. Це технологія, яка дозволяє аналітикам отримувати та переглядати бізнес-дані з різних точок зору.

Аналітикам часто потрібно групувати, агрегувати та об’єднувати дані. Ці операції в реляційних базах даних вимагають великих ресурсів. За допомогою OLAP дані можуть бути попередньо розраховані та попередньо зведені, що робить аналіз швидшим.

Бази даних OLAP розділені на один або кілька кубів. Куби сконструйовані таким чином, що створювати та переглядати звіти стає легко. OLAP розшифровується як Інтернет-аналітична обробка.

У цьому підручнику ви дізнаєтесь-

  • Куб OLAP
  • Основні аналітичні операції OLAP
  • Типи систем OLAP
  • ROLAP
  • MOLAP
  • Гібридний OLAP
  • Переваги OLAP
  • Недоліки OLAP

Куб OLAP:

В основі концепції OLAP лежить куб OLAP. Куб OLAP - це структура даних, оптимізована для дуже швидкого аналізу даних.

Куб OLAP складається з числових фактів, званих мірами, які класифікуються за розмірами. Куб OLAP також називають гіперкубом .

Зазвичай операції та аналіз даних виконуються за допомогою простої електронної таблиці, де значення даних розташовані у форматі рядків та стовпців. Це ідеально підходить для двовимірних даних. Однак OLAP містить багатовимірні дані, причому дані зазвичай отримуються з іншого та не пов'язаного з ними джерела. Використання електронної таблиці не є оптимальним варіантом. Куб може зберігати та аналізувати багатовимірні дані логічно та впорядковано.

Як це працює?

Склад даних витягує інформацію з безлічі джерел даних та форматів, таких як текстові файли, аркуші Excel, мультимедійні файли тощо.

Витягнуті дані очищаються та перетворюються. Дані завантажуються на сервер OLAP (або куб OLAP), де інформація заздалегідь розраховується для подальшого аналізу.

Основні аналітичні операції OLAP

Чотири типи аналітичних операцій в OLAP:

  1. Згорнути
  2. Пробурити
  3. Наріжте і наріжте кубиками
  4. Поворот (обертання)

1) Зведення:

Зведення також відоме як "консолідація" або "агрегування". Операцію згортання можна виконати двома способами

  1. Зменшувальні розміри
  2. Підняття ієрархії концепції. Ієрархія поняття - це система групування речей на основі їх порядку чи рівня.

Розглянемо наступну схему

  • У цьому прикладі міста Нью-Джерсі та Lost Angles і згорнуті до країни США
  • Показники продажів Нью-Джерсі та Лос-Анджелеса становлять 440 та 1560 відповідно. Їх стає 2000 після згортання
  • У цьому процесі агрегування дані про ієрархію розташування переміщуються вгору від міста до країни.
  • У процесі згортання потрібно видалити принаймні один або кілька розмірів. У цьому прикладі вимір Quater видалено.

2) деталізація

У детальному розкритті дані фрагментовані на менші частини. Це протилежність процесу зведення. Це можна зробити через

  • Рухаючись вниз ієрархією концепції
  • Збільшення розмірності

Розглянемо схему вище

  • Квартал Q1 розгорнутий за місяцями січень, лютий та березень. Відповідні продажі - це також реєстри.
  • У цьому прикладі додаються вимірювальні місяці.

3) Фрагмент:

Тут вибирається один вимір, і створюється новий підкуб.

Наступна схема пояснює, як виконувалась операція зрізу:

  • Час вимірювання нарізаний Q1 як фільтр.
  • Взагалі створюється новий куб.

Кістки:

Ця операція схожа на фрагмент. Різниця в кубиках полягає в тому, що ви вибираєте 2 або більше вимірів, що призводять до створення підкуба.

4) Півот

У Pivot ви обертаєте осі даних, щоб забезпечити заміну подання даних.

У наступному прикладі зведення базується на типах елементів.

Типи систем OLAP

Ієрархічна структура OLAP

Тип OLAP Пояснення
Реляційний OLAP (ROLAP): ROLAP - це розширена СУБД разом із багатовимірним відображенням даних для виконання стандартної реляційної операції.
Багатовимірний OLAP (MOLAP) MOLAP реалізує операцію в багатовимірних даних.
Гібридна онлайн-аналітична обробка (HOLAP) У підході HOLAP агреговані підсумки зберігаються в багатовимірній базі даних, тоді як докладні дані зберігаються в реляційній базі даних. Це забезпечує як ефективність даних моделі ROLAP, так і продуктивність моделі MOLAP.
Настільний OLAP (DOLAP) У настільному OLAP користувач завантажує частину даних з бази даних локально або на своєму робочому столі та аналізує їх. DOLAP порівняно дешевший у розгортанні, оскільки він пропонує дуже мало функціональних можливостей порівняно з іншими системами OLAP.
Веб-OLAP (WOLAP) Веб-OLAP, яка є системою OLAP, доступною через веб-браузер. WOLAP - це трирівнева архітектура. Він складається з трьох компонентів: клієнта, проміжного програмного забезпечення та сервера баз даних.
Мобільний OLAP: Мобільний OLAP допомагає користувачам отримувати доступ та аналізувати дані OLAP за допомогою своїх мобільних пристроїв
Просторовий OLAP: SOLAP створений для полегшення управління як просторовими, так і непросторовими даними в геоінформаційній системі (ГІС)

ROLAP

ROLAP працює з даними, які існують у реляційній базі даних. Факти та таблиці вимірів зберігаються як реляційні таблиці. Це також дозволяє багатовимірний аналіз даних і є найбільш швидкозростаючим OLAP.

Переваги моделі ROLAP:

  • Висока ефективність передачі даних. Він пропонує високу ефективність передачі даних, оскільки продуктивність запитів та мова доступу оптимізовані особливо для багатовимірного аналізу даних.
  • Масштабованість. Цей тип системи OLAP пропонує масштабованість для управління великими обсягами даних, навіть коли дані постійно збільшуються.

Недоліки моделі ROLAP:

  • Попит на більш високі ресурси: ROLAP потребує високого використання трудових ресурсів, програмних та апаратних ресурсів.
  • Загалом обмеження даних. Інструменти ROLAP використовують SQL для всіх обчислень сукупних даних. Однак немає встановлених обмежень для обробки обчислень.
  • Повільна продуктивність запитів. Ефективність запитів у цій моделі є повільною у порівнянні з MOLAP

MOLAP

MOLAP використовує багатовимірні механізми зберігання на основі масивів для відображення багатовимірних подань даних. В основному, вони використовують куб OLAP.

Дізнайтеся більше про OLAP тут

Гібридний OLAP

Гібридний OLAP - це суміш як ROLAP, так і MOLAP. Він пропонує швидкі обчислення MOLAP і вищу масштабованість ROLAP. HOLAP використовує дві бази даних.

  1. Агреговані або обчислювані дані зберігаються в багатовимірному кубі OLAP
  2. Детальна інформація зберігається в реляційній базі даних.

Переваги гібридного OLAP:

  • Цей тип OLAP допомагає заощадити місце на диску, а також він залишається компактним, що допомагає уникнути проблем, пов’язаних зі швидкістю доступу та зручністю.
  • Гібридний HOLAP використовує кубову технологію, яка дозволяє пришвидшити роботу всіх типів даних.
  • ROLAP миттєво оновлюється, і користувачі HOLAP мають доступ до цих миттєво оновлюваних даних у режимі реального часу. MOLAP забезпечує очищення та перетворення даних, тим самим покращуючи актуальність даних. Це приносить найкраще з обох світів.

Недоліки гібридного OLAP:

  • Більший рівень складності : Основним недоліком систем HOLAP є те, що вони підтримують як інструменти, так і додатки ROLAP та MOLAP. Таким чином, це дуже складно.
  • Потенційні перекриття : є більші шанси накладання, особливо на їх функціональні можливості.

Переваги OLAP

  • OLAP - це платформа для всіх видів бізнесу, включаючи планування, складання бюджету, звітність та аналіз.
  • Інформація та розрахунки узгоджуються в кубі OLAP. Це вирішальна перевага.
  • Швидко створюйте та аналізуйте сценарії "Що якщо"
  • Легко шукати в базі даних OLAP широкі або конкретні терміни.
  • OLAP надає основи для інструментів бізнес-моделювання, інструментів аналізу даних, інструментів звітності про ефективність.
  • Дозволяє користувачам робити дані нарізки та нарізки кубиків за різними розмірами, мірами та фільтрами.
  • Це добре для аналізу часових рядів.
  • За допомогою OLAP легко знайти деякі кластери та викиди.
  • Це потужна система візуалізації онлайн-аналітичних процесів, яка забезпечує швидший час відгуку

Недоліки OLAP

  • OLAP вимагає упорядкування даних у схему зірок або сніжинок. Ці схеми є складними для впровадження та адміністрування
  • Ви не можете мати велику кількість розмірів в одному кубі OLAP
  • Дані транзакцій не можуть бути доступні за допомогою системи OLAP.
  • Будь-яка модифікація в кубі OLAP потребує повного оновлення куба. Це трудомісткий процес

Короткий зміст:

  • OLAP - це технологія, яка дозволяє аналітикам отримувати та переглядати бізнес-дані з різних точок зору.
  • В основі концепції OLAP лежить куб OLAP.
  • Різні бізнес-додатки та інші операції з даними вимагають використання OLAP Cube.
  • У OLAP існує п’ять основних типів аналітичних операцій 1) Згортання 2) Розгортання 3) Зріз 4) Кістки та 5) Обертання
  • Три типи широко використовуваних систем OLAP - MOLAP, ROLAP та Hybrid OLAP.
  • Настільний OLAP, веб-OLAP та мобільний OLAP - це деякі інші типи OLAP-систем.