HCatalog Tutorial

HCatalog é uma ferramenta de gerenciamento de armazenamento de tabela para o Hadoop que expõe os dados tabulares do metastore do Hive a outros aplicativos do Hadoop. Ele permite que usuários com diferentes ferramentas de processamento de dados (Pig, MapReduce) gravem facilmente dados em uma grade. O HCatalog garante que os usuários não precisem se preocupar com onde ou em que formato seus dados são armazenados. Este é um pequeno tutorial que explica apenas o básico do HCatalog e como usá-lo.

Público

Este tutorial é destinado a profissionais que desejam fazer carreira no Big Data Analytics usando o Hadoop Framework. Os desenvolvedores e profissionais de ETL que gostam de análises em geral também podem usar este tutorial com bons resultados.

Pré-requisitos

Antes de continuar com este tutorial, você precisa de um conhecimento básico de Core Java, conceitos de banco de dados SQL, sistema de arquivos Hadoop e qualquer um dos sabores do sistema operacional Linux.