Vektordatenbanken sind eine Art von Datenbank, die Daten als Vektoren speichern. Vektoren sind mathematische Darstellungen von Merkmalen eines Datenpunkts. Abhängig von der Granularität der Daten hat jeder Vektor eine bestimmte Anzahl von Dimensionen. Vektordatenbanken helfen, komplexe oder unstrukturierte Daten zu klassifizieren, indem sie all ihre unterschiedlichen Merkmale oder Eigenschaften als Vektoren darstellen.
Vektordatenbanken unterscheiden sich von traditionellen Datenbanken, da sie nicht darauf ausgelegt sind, komplexe Daten zu speichern und zu verwalten, sondern nur strukturierte Daten. Vektordatenbanken unterscheiden sich von relationalen Datenbanken bei der Ergebnissuche. Relationale Datenbanken rufen Ergebnisse ab, die eine exakte Übereinstimmung sind, während Vektordatenbanken bei komplexen Suchfähigkeiten helfen. Vektordatenbanken indexieren und speichern alle Vektoreinbettungen für die Ähnlichkeitssuche. Einbettung ist die Methode, ähnliche Datenpunkte zusammen zu gruppieren. Sie spielen eine wichtige Rolle bei der Bildung starker Empfehlungssysteme, semantischer Suche, Betrugserkennung oder Ausreißererkennung und so weiter.
Um in die Kategorie der Vektordatenbanken aufgenommen zu werden, muss ein Produkt:
Semantische Suchfähigkeiten bieten.
Metadatenfilterung anbieten, um die Relevanz der Suchergebnisse zu verbessern.
Daten-Sharding bereitstellen, um schnellere und skalierbarere Ergebnisse zu erzielen.