Tutorial do Apache Tajo

Apache Tajo é uma estrutura de armazém de dados distribuídos de código aberto para o Hadoop. O Tajo foi iniciado inicialmente pela Gruter, uma empresa de infraestrutura baseada no Hadoop na Coréia do Sul. Mais tarde, especialistas da Intel, Etsy, NASA, Cloudera, Hortonworks também contribuíram para o projeto. Tajo refere-se a um avestruz no idioma coreano. Em março de 2014, o Tajo recebeu um projeto Apache código aberto de nível superior. Este tutorial explorará os conceitos básicos do Tajo e, adiante, explicará a configuração de cluster, shell Tajo, consultas SQL, integração com outras tecnologias de big data e, finalmente, concluirá com alguns exemplos.

Público

Antes de prosseguir com este tutorial, você deve ter um conhecimento sólido sobre Java principal, qualquer sistema operacional Linux e DBMS.

Pré-requisitos

Este tutorial foi preparado para profissionais que desejam fazer carreira na análise de big data. Este tutorial fornecerá compreensão suficiente sobre o Apache Tajo.