Big-Data-Analyse-Software bietet Einblicke in große Datensätze, die aus Big-Data-Clustern gesammelt werden. Diese Tools helfen Geschäftsanwendern, Datentrends, Muster und Anomalien zu verstehen und die Informationen in verständliche Datenvisualisierungen, Berichte und Dashboards zu synthetisieren. Aufgrund der unstrukturierten Natur von Big-Data-Clustern erfordern diese Analyselösungen oft eine Abfragesprache, um die Daten aus dem Dateisystem zu extrahieren. Einige Lösungen können Self-Service-Funktionen bieten, damit nicht-technische Mitarbeiter ihre eigenen Diagramme und Grafiken aus Big-Data-Sätzen erstellen können.
Einige Big-Data-Analyse-Lösungen bieten Funktionen, die durch maschinelles Lernen unterstützt werden, wie z.B. natürliche Sprachverarbeitung, die es dem Benutzer ermöglichen, Unternehmensdaten auf natürliche Weise abzufragen. Big-Data-Analyse-Software wird häufig in Unternehmen verwendet, die Hadoop in Verbindung mit Big-Data-Verarbeitungs- und Verteilungssoftware betreiben, um Daten zu sammeln und zu speichern. Darüber hinaus integrieren sich diese Produkte typischerweise mit Data-Warehouse-Software, dem zentralen Speicherzentrum für die integrierten Daten eines Unternehmens.
Big-Data-Analyse-Software unterscheidet sich von Analyseplattformen insofern, als erstere sich ausschließlich auf die Manipulation komplexer und groß angelegter Big-Data-Cluster in verständliche Visualisierungen konzentrieren, während letztere auf eine breite Palette von Datenquellen und -verbindungen ausgerichtet sind. Die beiden Kategorien sind gegenseitig exklusiv, und jene Produkte, die sich ausschließlich auf Big-Data-Anwendungsfälle konzentrieren, werden nur in der Kategorie Big-Data-Analyse kategorisiert.
Um für die Aufnahme in die Kategorie Big-Data-Analyse qualifiziert zu sein, muss ein Produkt:
Daten konsumieren, Dateisysteme abfragen und direkt mit Big-Data-Clustern verbinden
Benutzern ermöglichen, komplexe Big-Data-Sätze in hilfreiche und verständliche Datenvisualisierungen vorzubereiten
Geschäftsanwendbare Berichte, Visualisierungen und Dashboards basierend auf Entdeckungen innerhalb der Datensätze erstellen