O software de análise de big data fornece insights sobre grandes conjuntos de dados que são coletados de clusters de big data. Essas ferramentas ajudam os usuários de negócios a digerir tendências, padrões e anomalias de dados e sintetizar as informações em visualizações de dados compreensíveis, relatórios e painéis. Devido à natureza não estruturada dos clusters de big data, essas soluções de análise frequentemente exigem uma linguagem de consulta para extrair os dados do sistema de arquivos. Algumas soluções podem oferecer recursos de autoatendimento para que funcionários não técnicos possam montar seus próprios gráficos e tabelas a partir de conjuntos de dados de big data.
Algumas soluções de análise de big data oferecem recursos alimentados por aprendizado de máquina, como processamento de linguagem natural, permitindo que o usuário consulte dados da empresa de maneira natural. O software de análise de big data é comumente usado em empresas que executam Hadoop em conjunto com software de processamento e distribuição de big data para coletar e armazenar dados. Além disso, esses produtos normalmente se integram com software de data warehouse, o hub central de armazenamento para os dados integrados de uma empresa.
O software de análise de big data difere das plataformas de análise na medida em que o primeiro é focado exclusivamente na manipulação de clusters de big data complexos e em grande escala em visualizações compreensíveis, enquanto o último é voltado para uma ampla gama de fontes de dados e conectores. As duas categorias são mutuamente exclusivas, e aqueles produtos que são focados exclusivamente em casos de uso de big data são categorizados apenas na categoria de análise de big data.
Para se qualificar para inclusão na categoria de Análise de Big Data, um produto deve:
Consumir dados, consultar sistemas de arquivos e conectar-se diretamente a clusters de big data
Permitir que os usuários preparem conjuntos de dados complexos de big data em visualizações de dados úteis e compreensíveis
Criar relatórios, visualizações e painéis aplicáveis aos negócios com base em descobertas dentro dos conjuntos de dados