L'outil Extract est conçu pour systématiser les données à partir de documents PDF contenant du contenu de recherche, technique et scientifique. Il extrait des données à partir de texte, de tableaux et de certains graphiques et images, et relie les valeurs à la sortie souhaitée par le client (un ODL, Output Data Layout). Les données peuvent être obtenues dans des fichiers excel/csv, des fichiers JSON ou enregistrées directement dans une base de données. Aucune taxonomie humaine ou formation n'est nécessaire pour configurer le système. Le système peut atteindre une précision et un rappel de 94%/86%, ce qui est meilleur que la précision humaine, et chaque extraction est entièrement automatisée et prend quelques secondes, ce qui signifie que les économies de temps sont immenses.
L'espace de travail pour les chercheurs est conçu pour les chercheurs en R&D d'entreprise et en milieu universitaire afin de mieux gérer de vastes quantités de documentation de recherche. C'est une plateforme centrée sur le contenu qui fournit à l'utilisateur une gamme d'outils intelligents basés sur l'IA pour mieux naviguer, examiner, filtrer et extraire des données de documents de recherche tels que des articles, des brevets et de la documentation interne. Des économies de temps de 75 % ont été démontrées, libérant ainsi du temps pour des tâches à plus forte valeur ajoutée. Les outils incluent un moteur de recommandation exploratoire basé sur le contenu ; un outil d'analyse pour des ensembles complets de documents ; des filtres intelligents basés soit sur l'analyse de la machine, soit sur les descriptions contextuelles de l'utilisateur ; des résumés automatiques de plusieurs documents ; et l'extraction automatique de données de tableaux. La plateforme permet aux utilisateurs de charger tout type de documentation de recherche dans ces outils ; des collections en libre accès ou sous péage, des collections de brevets, leurs propres collections PDF ou des fichiers exportés BibTex/CSV ou similaires à partir de gestionnaires de références.