- A implantação do repositório permite que minha equipe desenvolva colaborativamente contra os recursos do Databricks enquanto ainda usa seu kit de ferramentas de desenvolvimento local, e rapidamente implante quando estiverem prontos.
- As tabelas Delta Live são fáceis de configurar e obter dados de streaming no lakehouse.
- A mistura de linguagens é muito boa; a maior parte do meu trabalho de engenharia de dados é focado em SQL, no entanto, posso utilizar Python ou Scala para manipulação de dados mais complexa, tudo dentro do mesmo notebook. Análise coletada por e hospedada no G2.com.
- O explorador de dados pode ser incrivelmente lento e pesado se seu lago de dados estiver distribuído de forma desigual
- Iniciar clusters a frio pode levar um tempo frustrantemente longo, pelo menos da forma como nossos clusters estão configurados (o tamanho mínimo para nossas opções de cluster é i3.xlarge na AWS)
- Embora desenvolver em notebooks seja agradável, o conceito de executar notebooks em produção onde qualquer pessoa pode editar a partir da interface do usuário é preocupante, gostaria que houvesse mais maneiras de "travar" processos de produção Análise coletada por e hospedada no G2.com.
Estamos entusiasmados em saber que a Plataforma de Inteligência de Dados da Databricks tem sido fundamental para acelerar o desenvolvimento de ETL e a criação de objetos de dados. Obrigado por dedicar seu tempo para deixar uma avaliação!
O avaliador enviou uma captura de tela ou enviou a avaliação no aplicativo, verificando-os como usuário atual.
Validado por meio de uma conta de e-mail empresarial
Avaliação orgânica. Esta avaliação foi escrita inteiramente sem convite ou incentivo do G2, de um vendedor ou de um afiliado.
Esta avaliação foi traduzida de English usando IA.






