Hadoop es un marco de código abierto que permite almacenar y procesar grandes datos en un entorno distribuido en clústeres de ordenadores utilizando modelos de programación simple. Está diseñado para aumentar la escala de servidores individuales de miles de máquinas, cada uno de ellos ofrece computación y almacenamiento local.
Este breve tutorial proporciona una introducción rápida a las grandes Datos, algoritmo MapReduce y Hadoop Distributed File System.
Este tutorial se ha elaborado para que los profesionales que aspiran a aprender los conceptos básicos de análisis de datos con Hadoop Marco Hadoop y convertirse en un desarrollador. Los profesionales del Software, análisis profesionales y ETL los desarrolladores son los principales beneficiarios de este curso.
Antes de comenzar con este tutorial, vamos a asumir que usted tiene antecedentes de exposición a Core Java, conceptos sobre bases de datos, y cualquiera de los tipos de sistema operativo Linux.