30 найкращих запитань щодо інтерв’ю Hbase & Відповіді

Anonim

Завантажте PDF

Нижче наведені запитання, що часто задаються в інтерв’ю для більш свіжих, а також досвідчених розробників HBase.

1) Поясніть, що таке Hbase?

Hbase - це система управління базами даних, орієнтована на стовпці, яка працює поверх HDFS (Hadoop Distribute File System). Hbase не є реляційним сховищем даних, і він не підтримує структуровану мову запитів, як SQL.

У Hbase головний вузол регулює сервери кластера та регіону для зберігання частин таблиць та керує роботою над даними.

2) Поясніть, чому використовувати Hbase?

  • Система зберігання великої ємності
  • Розподілений дизайн для обслуговування великих столів
  • Магазини, орієнтовані на колони
  • Горизонтально масштабований
  • Висока продуктивність та доступність
  • Базова мета Hbase - це мільйони стовпців, тисячі версій і мільярди рядків
  • На відміну від HDFS (Hadoop Distribute File System), він підтримує випадкові CRUD-операції в реальному часі

3) Згадайте, які ключові компоненти Hbase?

  • Зоопарк: Він виконує координаційну роботу між клієнтом та Hbase Maser
  • Hbase Master: Hbase Master відстежує регіональний сервер
  • RegionServer: RegionServer контролює регіон
  • Регіон: він містить у сховищі даних пам'яті (MemStore) та Hfile.
  • Таблиці каталогів: Таблиці каталогів складаються з ROOT та META

4) Поясніть, з чого складається Hbase?

  • Hbase складається з набору таблиць
  • І кожна таблиця містить рядки та стовпці, як традиційні бази даних
  • Кожна таблиця повинна містити елемент, визначений як Первинний ключ
  • Стовпець Hbase позначає атрибут об'єкта

5) Згадайте, скільки оперативних команд у Hbase?

Оперативні команди в Hbases складають близько п'яти типів

  • Отримати
  • Покласти
  • Видалити
  • Сканувати
  • Приріст

6) Поясніть, що таке WAL та Hlog у Hbase?

WAL (Write Ahead Log) подібний до журналу MySQL BIN; він записує всі зміни, що відбуваються в даних. Це стандартний файл послідовності Hadoop, і він зберігає файли HLogkey. Ці ключі складаються з послідовного номера, а також фактичних даних і використовуються для відтворення ще не збережених даних після збою сервера. Отже, у разі відмови сервера WAL працює як рятувальний круг і отримує втрачені дані.

7) Коли слід використовувати Hbase?

  • Обсяг даних величезний: коли у вас є тони і мільйони записів для роботи
  • Повний редизайн: Коли ви переносите СУБД на Hbase, ви вважаєте це повним редизайном, а просто зміною портів
  • Команди без SQL: у вас є кілька функцій, таких як транзакції; внутрішні з’єднання, набрані стовпці тощо.
  • Інвестиції в інфраструктуру: Вам потрібно мати достатньо кластеру, щоб Hbase був справді корисним

8) У Hbase, що таке сімейства стовпців?

Сімейства стовпців складають основну одиницю фізичного зберігання в Hbase, до якої застосовуються такі функції, як стиснення.

9) Поясніть, що таке ключ рядка?

Ключ рядка визначається програмою. Оскільки комбінований ключ попередньо фіксується ключем рядків, це дає змогу програмі визначити бажаний порядок сортування. Це також дозволяє логічне групування комірок та переконатися, що всі комірки з однаковим ключем рядків розташовані спільно на одному сервері.

10) Поясніть видалення в Hbase? Згадайте, які є три типи маркерів для надгробків у Hbase?

Коли ви видаляєте комірку в Hbase, дані насправді не видаляються, а встановлюється маркер надгробки, що робить видалені комірки невидимими. Видалені Hbase фактично видаляються під час ущільнення.

Існують три типи надгробних маркерів:

  • Маркер видалення версії: для видалення він позначає одну версію стовпця
  • Маркер видалення стовпця: для видалення він позначає всі версії стовпця
  • Сімейний маркер видалення: для видалення він позначає всі стовпці для сімейства стовпців

11) Поясніть, як насправді Hbase видаляє рядок?

У Hbase все, що ви пишете, буде зберігатися з оперативної пам'яті на диск, ці записи на диску є незмінним ущільненням заборони. Під час процесу видалення в Hbase основний процес ущільнення видаляє маркер, тоді як незначний - ні. При звичайному видаленні це призводить до видалення надгробного каменю - ці дані видалення, які вони представляють, видаляються під час ущільнення.

Крім того, якщо ви видалите дані та додасте більше даних, але з попередньою позначкою часу, ніж мітка часу надгробок, подальший Gets може бути замаскований маркером delete / tombstone, а отже, ви отримаєте вставлене значення лише після основного ущільнення.

12) Поясніть, що трапиться, якщо ви зміните розмір блоку сімейства стовпців у вже зайнятій базі даних?

Коли ви змінюєте розмір блоку сімейства стовпців, нові дані займають новий розмір блоку, тоді як старі дані залишаються в межах старого розміру блоку. Під час ущільнення даних старі дані приймуть новий розмір блоку. Нові файли при їх очищенні мають новий розмір блоку, тоді як існуючі дані будуть продовжувати читатися правильно. Усі дані слід перетворити на новий розмір блоку після наступного великого ущільнення.

13) Згадайте різницю між Hbase та реляційною базою даних?

Hbase Реляційна база даних
  • Це без схем
  • Це сховище даних, орієнтоване на стовпці
  • Він використовується для зберігання ненормованих даних
  • Він містить рідко заповнені таблиці
  • Автоматизоване розділення здійснюється в Hbase
  • Це база даних на основі схеми
  • Це сховище даних, орієнтоване на рядки
  • Він використовується для зберігання нормалізованих даних
  • Він містить тонкі столи
  • Немає такого забезпечення або вбудованої підтримки для розділення

14) Що таке клас HBaseFsck?

Існує назва інструменту, що називається назад, доступна в HBase, яка реалізована класом HBaseFsck. Він пропонує кілька перемикачів командного рядка, які впливають на його поведінку.

15) Які основні ключові структури HBase?

Ключ рядка та ключ стовпця - дві найважливіші ключові структури, що використовуються в HBase

16) Обговоріть, як можна використовувати фільтри в Apache HBase

Фільтри в оболонці HBase. Він був введений у програмі Apache HBase 0.92, яка допомагає вам проводити фільтрацію на стороні сервера для доступу до HBase через оболонку HBase або економію.

17) Синтаксична структура підтримки HBase, така як SQL, так чи ні?

Ні, на жаль, підтримка SQL для HBase наразі недоступна. Однак, використовуючи Apache Phoenix, ми можемо отримувати дані з HBase за допомогою SQL-запитів.

18) Що означає ущільнення у HBase?

Під час інтенсивних вхідних записів неможливо досягти оптимальної продуктивності, маючи по одному файлу в магазині. HBase допомагає поєднати всі ці файли HFi, щоб зменшити кількість насіннєвих дисків для кожного прочитаного. Цей процес відомий як ущільнення в HBase.

19) Як ви будете реалізовувати об’єднання в HBase?

HBase, не підтримує об'єднання безпосередньо, але використовує завдання MapReduce, запити на об'єднання можуть бути реалізовані шляхом отримання даних за допомогою різних таблиць HBase.

20) Поясніть JMX щодо HBSE

Розширення управління Java або JMX - це стан експорту програм Java, який є стандартним для них.

21) Яка користь MasterServer?

Master sever також допомагає вам призначити регіон для сервера регіону. Це також допоможе вам впоратися з балансуванням навантаження, за допомогою якого ми використовуємо MasterServer.

22) Визначте термін ощадливості

Apache Thrift написаний на C ++. Він забезпечує компілятори схем для різних мов програмування, таких як C ++, Perl, PHP, Python, Ruby та ін.

23) Навіщо використовувати клас HColumnDescriptor?

Деталі щодо сімейства стовпців, такі як налаштування стиснення, Кількість версій, зберігаються .in HColumnDescriptor.

24) Що таке клітина в HBase?

Клітинка в HBase - це найменша одиниця таблиці Hbase. Це допоможе вам зберігати фрагмент даних у вигляді кортежу {рядок, стовпець, версія}

25) Що таке фільтр Блум?

HBase підтримує Bloom Filter, що допомагає покращити загальну пропускну здатність кластера. Фільтр цвітіння HBase - це економічно ефективний механізм для перевірки того, чи містить HFile певний рядок або комірку рядкової комірки.

26) Розкажіть про типи операцій HBase?

Відповідь Два типи операцій HBase:

  • Прочитайте операцію
  • Операція запису

27) Яка користь HBase HMaster?

Основними обов'язками майстра є:

  1. Координація регіональних серверів
  2. Функції адміністратора

28) Який прийом ви можете використовувати у HBase для прямого доступу до HFile без допомоги HBase?

Для прямого доступу до HFile без використання HBase ми використовуємо метод HFile.main ().

29) Чи може регіональний сервер знаходитись на всіх вузлах даних?

Так, регіональні сервери працюють на тих самих серверах, що і DataNodes

30) Назвіть фільтр, який приймає розмір сторінки як параметр у HBase

Фільтр з іменем PageFilter приймає розмір сторінки як параметр.

Цей документ складено за допомогою інструментів швидкого перетворення HTML.