Tutorial do Apache Pig

Apache Pig é uma abstração sobre o MapReduce. É uma ferramenta / plataforma usada para analisar conjuntos maiores de dados que os representam como fluxos de dados. O porco é geralmente usado com o Hadoop ; podemos executar todas as operações de manipulação de dados no Hadoop usando o Pig.

Público

Este tutorial é destinado a todos os profissionais que trabalham no Hadoop que desejam executar operações do MapReduce sem precisar digitar códigos complexos em Java.

Pré-requisitos

Para aproveitar ao máximo este tutorial, você deve ter um bom entendimento dos conceitos básicos dos comandos Hadoop e HDFS. Certamente ajudará se você é bom em SQL.