ETL проти ELT: Потрібно знати відмінності

Зміст:

Anonim

Що таке ETL?

ETL - це абревіатура Extract, Transform and Load. У цьому процесі інструмент ETL витягує дані з різних вихідних систем СУБД, потім перетворює дані, наприклад, застосовуючи обчислення, конкатенації тощо, а потім завантажує дані в систему сховища даних.

В ETL дані - це потоки від джерела до цілі. У процесі ETL процес перетворення двигуна піклується про будь-які зміни даних.

Що таке ELT?

ELT - це інший метод розгляду інструментального підходу до переміщення даних. Замість того, щоб перетворювати дані до їх запису, ELT дозволяє цільовій системі здійснити перетворення. Дані спочатку копіюються на ціль, а потім перетворюються на місце.

ELT зазвичай використовується з базами даних, що не містять Sql, такими як кластер Hadoop, пристрій передачі даних або хмарна установка.

КЛЮЧОВА РІЗНИЦЯ

  • ETL означає Витяг, Перетворення та Навантаження, тоді як ELT означає Витяг, Навантаження, Перетворення.
  • ETL завантажує дані спочатку на проміжний сервер, а потім у цільову систему, тоді як ELT завантажує дані безпосередньо в цільову систему.
  • Модель ETL використовується для локальних, реляційних та структурованих даних, тоді як ELT використовується для масштабованих хмарних структурованих та неструктурованих джерел даних.
  • ETL в основному використовується для невеликого обсягу даних, тоді як ELT використовується для великих обсягів даних.
  • ETL не надає підтримку озера даних, тоді як ELT забезпечує підтримку озера даних.
  • ETL легко впровадити, тоді як ELT вимагає спеціальних навичок для впровадження та обслуговування.

Різниця між ETL та ELT

Процеси ETL та ELT відрізняються за такими параметрами:

Параметри ETL ELT
Процес Дані трансформуються на проміжному сервері, а потім передаються в БД Datawarehouse. Дані залишаються в БД Datawarehouse.
Використання коду Використовуваний для
  • Інтенсивно обчислювальні перетворення
  • Невеликий обсяг даних
Використовується для великих обсягів даних
Трансформація Трансформації виконуються на сервері ETL / проміжній області. Перетворення виконуються в цільовій системі
Часове навантаження Дані спочатку завантажуються в проміжні, а згодом завантажуються в цільову систему. Інтенсивний час. Дані завантажуються в цільову систему лише один раз. Швидше.
Перетворення часу Процес ETL повинен чекати завершення трансформації. Зі збільшенням розміру даних час трансформації збільшується. У процесі ELT швидкість ніколи не залежить від розміру даних.
Обслуговування часу Він потребує технічного обслуговування, оскільки вам потрібно вибрати дані для завантаження та перетворення. Низький рівень обслуговування, оскільки дані завжди доступні.
Складність реалізації На ранній стадії легше реалізувати. Для впровадження процесу ELT організація повинна мати глибокі знання інструментів та навички експертів.
Підтримка сховища даних Модель ETL, що використовується для локальних, реляційних та структурованих даних. Використовується в масштабованій хмарній інфраструктурі, яка підтримує структуровані, неструктуровані джерела даних.
Підтримка озера даних Не підтримує. Дозволяє використовувати озеро даних з неструктурованими даними.
Складність Процес ETL завантажує лише важливі дані, визначені під час проектування. Цей процес передбачає розробку із зворотним результатом та завантаження лише відповідних даних.
Вартість Високі витрати для малого та середнього бізнесу. Низькі витрати на вхід із використанням Інтернет-програмного забезпечення як сервісних платформ.
Пошук У процесі ETL як факти, так і виміри повинні бути доступними в зоні постановки. Усі дані будуть доступні, оскільки витяг та завантаження відбувається в одній дії.
Агрегації Складність зростає із збільшенням обсягу даних у наборі даних. Потужність цільової платформи може швидко обробити значний обсяг даних.
Розрахунки Перезаписує наявний стовпець або Потрібно додати набір даних і перенести на цільову платформу. Легко додайте обчислений стовпець до існуючої таблиці.
Зрілість Процес використовується більше двох десятиліть. Він добре задокументований, а найкращі практики легко доступні. Порівняно нова концепція і складна для реалізації.
Апаратне забезпечення Більшість інструментів мають унікальні вимоги до обладнання, які є дорогими. Бути витратами на обладнання Saas не є проблемою.
Підтримка неструктурованих даних Переважно підтримує реляційні дані Легко доступна підтримка неструктурованих даних.