When you enroll through our links, we may earn a small commission—at no extra cost to you. This helps keep our platform free and inspires us to add more value.

Udemy logo

APACHE KAFKA e Databricks: Streaming e Processamento

Aprenda as duas principais ferramentas de streaming e processamento distribuido

     
  • 5
  •  |
  • Reviews ( 97 )
₹519

This Course Includes

  • iconudemy
  • icon5 (97 reviews )
  • icon9h 56m
  • iconenglish
  • iconOnline - Self Paced
  • iconprofessional certificate
  • iconUdemy

About APACHE KAFKA e Databricks: Streaming e Processamento

Venha conhece rum dos principais cursos de mercado que trata dois grandes assuntos e que estão sendo muito utilizados nas empresas de todo o mundo,

APACHE KAFKA e Databricks,

veja como dividiremos este treinamento. O Databricks é mundialmente conhecido no mercado por sua potencialidade em unificar diversos tipos de dados em uma única plataforma. Com sua interface extremamente simples e colocando aos pés dos analistas, cientista, engenheiros e profissionais de dados em geral, um portfólio digno de resolução de quaisquer problemas que envolva dados. O que ele possui de tão importante:

Consultas em suas bases com SQL

: você poderá construir seus Notebooks com a linguagem mais utilizada no mundo para banco de dados o SQL, podendo realizar consultar e analisar seus dados mais recentes com uma velocidade sem precedentes.

Uso nativo do Apache Spark

: Apache Spark é o principal

mecanismo

de análise unificado para Big Data e aprendizado de máquina que existe no mundo, sendo utilizado pelas grandes corporações. Explorando nas suas execuções o uso de memória e outras otimizações. Anteriormente as empresas utilizavam o Hadoop.

Notebooks colaborativos

: é uma plataforma que possui a multilinguagem em seu cerne, você poderá construir Notebooks híbridos, em R, Python, Scala e SQL, podendo explorar rapidamente dados, de acordo com a sua escolha e conhecimento.

Visualização de dados nativo

: De forma a integrar análise de dados em resultados por scripts e gráficos poderosos, o Databricks organiza suas visualizações em painéis ricos para compartilhar insights com os seus gestores, em um ambiente integrado.

Integração com suas ferramentas de BI

: é possível que suas ferramentas de BI possam conectar diretamente com o Databricks na nuvem, permitindo que você leia os dados contidos no seu Data Lake e contando com a otimização do SPARK a todo momento.

APACHE KAFKA é sistema de mensagens usado para criar aplicações de _streaming_

Entenderá que o APACHE KAFKA é baseado em logs, algumas vez chamado _de write-ahead logs_ , _commit logs_ ou até mesmo _transaction logs_ Então venha fazer este super treinamento e esteja pronto para as oportunidades na área de dados.

What You Will Learn?

  • Visualização para explorar resultados de consultas de diferentes perspectivas .
  • Construção de gráficos e Dashboards .
  • Unificação de dados em diversos formatos: texto, JSON, PARQUET, dentre outros .
  • Trabalhada por administrador da plataforma, analista de dados, cientista de dados e engenheiro de dados com diversas funcionalidades .
  • Aprendizado processamento distribuído em SPARK .
  • Entendo o que é Databricks File System (DBFS) seu sistema de arquivos .
  • Entendo sobre Cluster .
  • Aprendendo a gerenciar e criar Notebooks em R, SCALA, Python e SQL .
  • Executando scripts multilinguagens .
  • Gerenciando a ingestão de dados e análise de dados, gerando gráficos e dashboards .
  • Construindo na versão community .
  • Trabalhando com a biblioteca dbutils Python .
  • Integrando o Databricks ao Power BI Show moreShow less.