У цьому посібнику можна переглянути такі операції з таблицями, як створення, зміна та скидання таблиць у вулику.
На знімку екрана ми створюємо таблицю зі стовпцями та змінюємо її назву.
1. Створення таблиці guru_sample з двома іменами стовпців, такими як "empid" та "empname"
2. Відображення таблиць, присутніх у базі даних guru99
3. Guru_sample відображення під таблицями
4. Змінення таблиці "guru_sample" як "guru_sampleNew"
5. Знову ж таки, коли ви виконаєте команду "show", вона відобразить нову назву Guru_sampleNew
Dropping table guru_sampleNew:
Типи таблиць та їх використання:
Перехід до таблиць - це подібно до того, як ми створюємо традиційні реляційні бази даних. Такі функції, як фільтрація, об'єднання, можна виконувати на таблицях.
Hive має справу з двома типами структур таблиць, такими як внутрішня та зовнішня таблиці, залежно від завантаження та дизайну схеми у Hive.
Внутрішні таблиці
- Внутрішня таблиця тісно пов'язана між собою. У цьому типі таблиць спочатку нам потрібно створити таблицю і завантажити дані.
- Ми можемо назвати це як дані на схемі .
- Якщо скинути цю таблицю, буде видалено як дані, так і схему.
- Зберігається місце розташування цієї таблиці буде в / user / hive / warehouse.
Коли вибрати внутрішню таблицю:
- Якщо обробка даних доступна в локальній файловій системі
- Якщо ми хочемо, щоб Hive керував повним життєвим циклом даних, включаючи видалення
Зразок фрагмента коду для внутрішньої таблиці
1. Створити внутрішню таблицю
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. Завантажте дані у внутрішню таблицю
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Відобразити зміст таблиці
Hive>select * from guruhive_internaltable;
4. Опустити внутрішню таблицю
Hive>DROP TABLE guruhive_internaltable;
Якщо ви випустили guruhive_internaltable, включаючи його метадані та його дані, буде видалено з Hive.
На наступному скріншоті ми можемо спостерігати результат
У наведеному вище коді та на знімку екрану ми робимо наступні речі,
- Створіть внутрішню таблицю
- Завантажте дані у внутрішню таблицю
- Відобразити зміст таблиці
- Відкинути внутрішню таблицю
Зовнішні столи
- Зовнішній стіл має нещільну природу. Дані будуть доступні в HDFS. Таблиця буде створена на даних HDFS.
- Іншим чином, ми можемо сказати, як його схема створення даних .
- На момент скидання таблиці вона видаляє лише схему, дані все ще будуть доступні у HDFS, як і раніше.
- Зовнішні таблиці надають можливість створити кілька схем для даних, що зберігаються у HDFS, замість того, щоб видаляти дані щоразу, коли схема оновлюється
Коли вибрати зовнішню таблицю:
- Якщо обробка даних доступна у HDFS
- Корисно, коли файли використовуються за межами вулика
Зразок фрагмента коду для зовнішньої таблиці
1. Створіть Зовнішню таблицю
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. Якщо ми не вказуємо місце розташування під час створення таблиці, ми можемо завантажити дані вручну
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Відобразити зміст таблиці
Hive>select * from guruhive_external;
4. Опустити внутрішню таблицю
Hive>DROP TABLE guruhive_external;
На наступному знімку екрану ми можемо спостерігати результат
У наведеному вище коді ми робимо наступні речі
- Створіть Зовнішню таблицю
- Завантажте дані у Зовнішню таблицю
- Відобразити зміст таблиці
- Відкидання зовнішнього столу
Різниця між внутрішніми та зовнішніми таблицями
Особливість | Внутрішній | Зовнішні |
---|---|---|
Схема | Дані про схему | Схема даних |
Місце зберігання | / usr / вулик / склад | Місцезнаходження HDFS |
Наявність даних | У локальній файловій системі | В межах HDFS |