Hive Create, Alter & Падіння таблиці

Зміст:

Anonim

У цьому посібнику можна переглянути такі операції з таблицями, як створення, зміна та скидання таблиць у вулику.

На знімку екрана ми створюємо таблицю зі стовпцями та змінюємо її назву.

1. Створення таблиці guru_sample з двома іменами стовпців, такими як "empid" та "empname"

2. Відображення таблиць, присутніх у базі даних guru99

3. Guru_sample відображення під таблицями

4. Змінення таблиці "guru_sample" як "guru_sampleNew"

5. Знову ж таки, коли ви виконаєте команду "show", вона відобразить нову назву Guru_sampleNew

Dropping table guru_sampleNew:

Типи таблиць та їх використання:

Перехід до таблиць - це подібно до того, як ми створюємо традиційні реляційні бази даних. Такі функції, як фільтрація, об'єднання, можна виконувати на таблицях.

Hive має справу з двома типами структур таблиць, такими як внутрішня та зовнішня таблиці, залежно від завантаження та дизайну схеми у Hive.

Внутрішні таблиці

  • Внутрішня таблиця тісно пов'язана між собою. У цьому типі таблиць спочатку нам потрібно створити таблицю і завантажити дані.
  • Ми можемо назвати це як дані на схемі .
  • Якщо скинути цю таблицю, буде видалено як дані, так і схему.
  • Зберігається місце розташування цієї таблиці буде в / user / hive / warehouse.

Коли вибрати внутрішню таблицю:

  • Якщо обробка даних доступна в локальній файловій системі
  • Якщо ми хочемо, щоб Hive керував повним життєвим циклом даних, включаючи видалення

Зразок фрагмента коду для внутрішньої таблиці

1. Створити внутрішню таблицю

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';

2. Завантажте дані у внутрішню таблицю

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Відобразити зміст таблиці

 Hive>select * from guruhive_internaltable;

4. Опустити внутрішню таблицю

 Hive>DROP TABLE guruhive_internaltable;

Якщо ви випустили guruhive_internaltable, включаючи його метадані та його дані, буде видалено з Hive.

На наступному скріншоті ми можемо спостерігати результат

У наведеному вище коді та на знімку екрану ми робимо наступні речі,

  • Створіть внутрішню таблицю
  • Завантажте дані у внутрішню таблицю
  • Відобразити зміст таблиці
  • Відкинути внутрішню таблицю

Зовнішні столи

  • Зовнішній стіл має нещільну природу. Дані будуть доступні в HDFS. Таблиця буде створена на даних HDFS.
  • Іншим чином, ми можемо сказати, як його схема створення даних .
  • На момент скидання таблиці вона видаляє лише схему, дані все ще будуть доступні у HDFS, як і раніше.
  • Зовнішні таблиці надають можливість створити кілька схем для даних, що зберігаються у HDFS, замість того, щоб видаляти дані щоразу, коли схема оновлюється

Коли вибрати зовнішню таблицю:

  • Якщо обробка даних доступна у HDFS
  • Корисно, коли файли використовуються за межами вулика

Зразок фрагмента коду для зовнішньої таблиці

1. Створіть Зовнішню таблицю

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;

2. Якщо ми не вказуємо місце розташування під час створення таблиці, ми можемо завантажити дані вручну

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Відобразити зміст таблиці

 Hive>select * from guruhive_external;

4. Опустити внутрішню таблицю

 Hive>DROP TABLE guruhive_external;

На наступному знімку екрану ми можемо спостерігати результат

У наведеному вище коді ми робимо наступні речі

  • Створіть Зовнішню таблицю
  • Завантажте дані у Зовнішню таблицю
  • Відобразити зміст таблиці
  • Відкидання зовнішнього столу

Різниця між внутрішніми та зовнішніми таблицями

Особливість Внутрішній Зовнішні
Схема Дані про схему Схема даних
Місце зберігання / usr / вулик / склад Місцезнаходження HDFS
Наявність даних У локальній файловій системі В межах HDFS