Tutorial do Hadoop

O Hadoop é uma estrutura de código-fonte aberto que permite armazenar e processar grandes dados em um ambiente distribuído entre clusters de computadores usando modelos de programação simples. Ele foi projetado para expandir de servidores únicos para milhares de máquinas, cada uma oferecendo computação e armazenamento local.

Este breve tutorial fornece uma rápida introdução ao Big Data, ao algoritmo MapReduce e ao Hadoop Distributed File System.

Público

Este tutorial foi preparado para profissionais que desejam aprender o básico do Big Data Analytics usando o Hadoop Framework e se tornar um desenvolvedor do Hadoop. Profissionais de software, profissionais de análise e desenvolvedores de ETL são os principais beneficiários deste curso.

Pré-requisitos

Antes de começar a prosseguir com este tutorial, presumimos que você tenha exposição prévia ao Core Java, conceitos de banco de dados e qualquer um dos sabores do sistema operacional Linux.