Sección es una infraestructura de almacenamiento de datos de proceso de datos estructurados en Hadoop. Se encuentra en la parte superior de Hadoop para resumir grandes datos y facilita consultar y analizar fácil.
Este es un breve tutorial que proporciona una introducción sobre cómo utilizar Apache Hive HiveQL con Hadoop Distributed File System. Este tutorial puede ser su primer paso para convertirse en un exitoso Hadoop Desarrollador de Hive.
Este tutorial está preparado para los profesionales que aspiran a hacer una carrera en las Grandes Análisis de Datos usando Hadoop Marco. ETL desarrolladores y profesionales que están en análisis en general, pueden también utilizar este tutorial para buen efecto.
Antes de continuar con este tutorial, es necesario un conocimiento básico de Java, conceptos de bases de SQL, Hadoop, sistema de archivos de Linux y cualquier sistema operativo.