Hive - Tipos de datos


Advertisements

Este capítulo le lleva a través de los diferentes tipos de datos en Hive, que están involucrados en la creación de la tabla. Todos los tipos de datos en Hive se clasifican en cuatro tipos, dada de la siguiente manera:

  • Tipos de columna
  • Los literales
  • Valores Null
  • Tipos complejos

Tipos de columna

Tipo de columna se utilizan como tipos de datos de columna de Hive. Como se indica a continuación:

Tipos integrales

Datos tipo Entero puede especificarse con integral data types, INT. Cuando el rango de datos supera el rango de INT, es necesario utilizar BIGINT y si el rango de datos es menor que el INT, SMALLINT que utiliza. Es más pequeño que TINYINT SMALLINT.

La siguiente tabla muestra diferentes tipos de datos: INT.

Tipo Postfix Ejemplo
TINYINT Y 10Y.
SMALLINT S 10S
INT - 10
BIGINT L 10L

Tipos de cadena

Tipos de datos tipo string se puede especificar mediante comillas simples ('') o comillas dobles (" "). Contiene dos tipos de datos: VARCHAR y CHAR. Hive sigue tipos C caracteres de escape.

La siguiente tabla muestra diversas CHAR tipos de datos:

Tipo de datos Longitud
VARCHAR 1 A 65355
CHAR 255

Timestamp

Es compatible con UNIX tradicional marca opcional nanosegundo con precisión. Es compatible con java.sql.Timestamp formato “YYYY-MM-DD HH:MM:SS.fffffffff” y el formato “yyyy-mm-dd hh:mm:ss.ffffffffff”.

Fechas

Valores de fecha se describen en año/mes/día formato de la forma { {AAAA-MM-DD} }.

Los decimales.

El tipo DECIMAL en Hive es igual a gran formato Decimal de Java. Es usado para representar inmutable precisión arbitraria. La sintaxis y el ejemplo es el siguiente:

DECIMAL(precision, scale)
decimal(10,0)

Tipos Unión

Unión es una colección de tipos de datos heterogéneos. Puede crear una instancia de crear la unión. La sintaxis y el ejemplo es el siguiente:

UNIONTYPE<int, double, array<string>, struct<a:int,b:string>>

{0:1} 
{1:2.0} 
{2:["three","four"]} 
{3:{"a":5,"b":"five"}} 
{2:["six","seven"]} 
{3:{"a":8,"b":"eight"}} 
{0:9} 
{1:10.0}

Los literales

Los siguientes valores literales se utilizan en Hive:

Tipos de punto flotante

Tipos de punto flotante no son más que números con decimales. Por lo general, este tipo de datos se compone de un doble tipo de datos.

Tipo Decimal

Datos tipo Decimal no es sino valor de punto flotante con mayor variedad de tipo de datos double. La gama de tipo decimal es aproximadamente-10-308 a 10308.

Valor Null

Falta de valores están representados por el valor especial NULL.

Tipos complejos

La Hive tipos de datos complejos son los siguientes:

Las matrices

Las matrices de Hive son utilizados de la misma forma en que se utilizan en Java.

Syntax: ARRAY<data_type>

Mapas

Mapas en Hive son similares a Java Mapas.

Syntax: MAP<primitive_type, data_type>

Las Estructuras

Las estructuras de Hive es similar a la de usar datos complejos con comentario.

Syntax: STRUCT<col_name : data_type [COMMENT col_comment], ...>
Advertisements