Dieses Kapitel nimmt Sie durch die verschiedenen Datentypen in Hive, welche sind beteiligt in Tabellenerstellung. Alle Datentypen in Hive werden klassifiziert in vier Typen gegeben wie folgt:
Spaltentyp sind als Spaltendatentypen von Hive verwendet. Sie sind wie folgt:
Integer-Datentyp kann mit Hilfe der integral Datentypen INT angegeben werden. Wenn der Datenbereich den Bereich der INT übersteigt, Sie müssen Sie verwenden BIGINT und wenn der Datenbereich kleiner ist als der INT, Sie verwenden SMALLINT. TINYINT ist kleiner als SMALLINT.
Die folgende Tabelle zeigt verschiedene INT-Datentypen:
Art | Postfix | Beispiel |
---|---|---|
TINYINT | Y | 10Y |
SMALLINT | S | 10S |
INT | - | 10 |
BIGINT | L | 10L |
Saite Typ Datentypen können werden angegeben mitHilfe einfachen Anführungszeichen (' ') oder doppelte Anführungszeichen (" ") angegeben werden. Es enthält zwei Datentypen: VARCHAR und CHAR. Hive folgt C-Typen Escape-Zeichen.
Die folgende Tabelle zeigt verschiedene CHAR-Datentypen:
Datentypen | Länge |
---|---|
VARCHAR | 1 to 65355 |
CHAR | 255 |
Es unterstützt traditionelle UNIX-Timestamp mit optionaler Nanosekundenpräzision . Es unterstützt java.sql.Timestamp Format “YYYY-MM-DD HH:MM:SS.fffffffff” und format “yyyy-mm-dd hh:mm:ss.ffffffffff”.
DATE Werte werden beschriebenen in Jahr / Monat / Tag-Format in der Form {{YYYY-MM-DD}}.
Der DECIMAL-Typ in Hive ist die gleiche wie Big Dezimal format von Java. Es wird für die Darstellung von unveränderlichen beliebiger Genauigkeit verwendet. Die Syntax und ein Beispiel ist wie folgt:
DECIMAL(precision, scale) decimal(10,0)
Union ist eine Sammlung von heterogenen Datentypen. Sie können eine Instanz erstellen, indem Sie mitHilfe erstellen union . Die Syntax und ein Beispiel ist wie folgt: :
UNIONTYPE<int, double, array<string>, struct<a:int,b:string>> {0:1} {1:2.0} {2:["three","four"]} {3:{"a":5,"b":"five"}} {2:["six","seven"]} {3:{"a":8,"b":"eight"}} {0:9} {1:10.0}
Die folgenden Literale werden in Hive verwendet::
Gleitkomma-Typen sind nichts anderes als Zahlen mit Dezimalpunkt. Im allgemeinen wird diese Art von Daten besteht von den DOUBLE Datentyp.
Fehlende Werte werden durch die besonderen Wert NULL vertreten.
Die Hive komplexen Datentypen sind wie folgt:
Arrays in Hive sind verwendet werden auf die gleiche Art, wie sie in Java werden.
Syntax: ARRAY<data_type>
Karten in Hive sind ähnlich wie Java Maps
Syntax: MAP<primitive_type, data_type>
Structs in Hive ähnelt der Verwendung komplexer Daten mit Komment.
Syntax: STRUCT<col_name : data_type [COMMENT col_comment], ...>