Hive - Datentypen


Advertisements


Dieses Kapitel nimmt Sie durch die verschiedenen Datentypen in Hive, welche sind beteiligt in Tabellenerstellung. Alle Datentypen in Hive werden klassifiziert in vier Typen gegeben wie folgt:

  • Spaltentypen
  • Literale
  • Nullwerte
  • Komplexe Typen

Spaltentypen

Spaltentyp sind als Spaltendatentypen von Hive verwendet. Sie sind wie folgt:

Integral Typen

Integer-Datentyp kann mit Hilfe der integral Datentypen INT angegeben werden. Wenn der Datenbereich den Bereich der INT übersteigt, Sie müssen Sie verwenden BIGINT und wenn der Datenbereich kleiner ist als der INT, Sie verwenden SMALLINT. TINYINT ist kleiner als SMALLINT.

Die folgende Tabelle zeigt verschiedene INT-Datentypen:

Art Postfix Beispiel
TINYINT Y 10Y
SMALLINT S 10S
INT - 10
BIGINT L 10L

Saite Arten

Saite Typ Datentypen können werden angegeben mitHilfe einfachen Anführungszeichen (' ') oder doppelte Anführungszeichen (" ") angegeben werden. Es enthält zwei Datentypen: VARCHAR und CHAR. Hive folgt C-Typen Escape-Zeichen.

Die folgende Tabelle zeigt verschiedene CHAR-Datentypen:

Datentypen Länge
VARCHAR 1 to 65355
CHAR 255

Timestamp

Es unterstützt traditionelle UNIX-Timestamp mit optionaler Nanosekundenpräzision . Es unterstützt java.sql.Timestamp Format “YYYY-MM-DD HH:MM:SS.fffffffff” und format “yyyy-mm-dd hh:mm:ss.ffffffffff”.

Daten

DATE Werte werden beschriebenen in Jahr / Monat / Tag-Format in der Form {{YYYY-MM-DD}}.

Dezimalzahlen

Der DECIMAL-Typ in Hive ist die gleiche wie Big Dezimal format von Java. Es wird für die Darstellung von unveränderlichen beliebiger Genauigkeit verwendet. Die Syntax und ein Beispiel ist wie folgt:

DECIMAL(precision, scale)
decimal(10,0)

Union Typen

Union ist eine Sammlung von heterogenen Datentypen. Sie können eine Instanz erstellen, indem Sie mitHilfe erstellen union . Die Syntax und ein Beispiel ist wie folgt: :

UNIONTYPE<int, double, array<string>, struct<a:int,b:string>>

{0:1} 
{1:2.0} 
{2:["three","four"]} 
{3:{"a":5,"b":"five"}} 
{2:["six","seven"]} 
{3:{"a":8,"b":"eight"}} 
{0:9} 
{1:10.0}

Literale

Die folgenden Literale werden in Hive verwendet::

Gleitkomma- Typen

Gleitkomma-Typen sind nichts anderes als Zahlen mit Dezimalpunkt. Im allgemeinen wird diese Art von Daten besteht von den DOUBLE Datentyp.

Decimal Typ

Dezimal Datentyp ist nichts anderes als Fließkommawert mit höherer Reichweite als DOUBLE-Datentyp. Die Palette der Dezimal-Typ ist ca. -10-308 zu 10308.

Nullwert

Fehlende Werte werden durch die besonderen Wert NULL vertreten.

Komplexe Typen

Die Hive komplexen Datentypen sind wie folgt:

Arrays

Arrays in Hive sind verwendet werden auf die gleiche Art, wie sie in Java werden.

Syntax: ARRAY<data_type>

Karten

Karten in Hive sind ähnlich wie Java Maps

Syntax: MAP<primitive_type, data_type>

Structs

Structs in Hive ähnelt der Verwendung komplexer Daten mit Komment.

Syntax: STRUCT<col_name : data_type [COMMENT col_comment], ...>


Advertisements