A ferramenta Extract é construída para sistematizar dados de documentos PDF com conteúdo de pesquisa, técnico e científico. Ela extrai dados de texto, tabelas e alguns gráficos e imagens, e vincula os valores à saída desejada pelo cliente (um ODL, Layout de Dados de Saída). Os dados podem ser obtidos em arquivos excel/csv, arquivos JSON ou gravados diretamente em um banco de dados. Não são necessárias taxonomias feitas por humanos ou treinamento para configurar o sistema. O sistema pode alcançar Precisão e Revocação de 94%/86%, o que é melhor do que a precisão humana, e cada extração é totalmente automatizada e leva segundos, significando que as economias de tempo são imensas.
O Researcher Workspace é desenvolvido para pesquisadores em P&D corporativo e academia para lidar melhor com grandes quantidades de documentação de pesquisa. É uma plataforma centrada em conteúdo que fornece ao usuário uma gama de ferramentas inteligentes baseadas em IA para navegar, revisar, filtrar e extrair dados de documentos de pesquisa como artigos, patentes e documentação interna. Foi demonstrado uma economia de tempo de 75%, liberando o tempo dos pesquisadores para tarefas de criação de valor. As ferramentas incluem um mecanismo de recomendação exploratória baseado em conteúdo; uma ferramenta de análise para conjuntos completos de documentos; filtros inteligentes baseados na análise da máquina ou nas descrições de contexto do próprio usuário; resumos automáticos de múltiplos documentos; e extração automática de dados de tabelas. A plataforma permite que os usuários carreguem qualquer tipo de documentação de pesquisa nessas ferramentas; de coleções de Acesso Aberto ou com Paywall, coleções de patentes, suas próprias coleções de PDF ou arquivos exportados BibTex/CSV ou similares de gerenciadores de referências.