ConvNetJS é uma biblioteca Javascript para treinar modelos de Aprendizado Profundo (Redes Neurais) inteiramente em um navegador.
Stanford CoreNLP fornece um conjunto de ferramentas de análise de linguagem natural que podem fornecer as formas básicas das palavras, suas partes do discurso, se são nomes de empresas, pessoas, etc., normalizar datas, horas e quantidades numéricas, e marcar a estrutura das frases em termos de frases e dependências de palavras, indicar quais frases nominais se referem às mesmas entidades, indicar sentimento, extrair relações de classe aberta entre menções, etc.
O Part-Of-Speech Tagger (POS Tagger) é um software que lê texto em algum idioma e atribui partes do discurso a cada palavra (e outro token), como substantivo, verbo, adjetivo, etc., embora geralmente as aplicações computacionais usem tags de POS mais detalhadas, como 'substantivo-plural'.
Stanford Pattern-based Information Extraction and Diagnostics (SPIED) é uma extração de entidade baseada em padrões e visualização que fornece código para dois componentes, Aprendendo entidades a partir de texto não rotulado começando com conjuntos iniciais usando padrões de forma iterativa e Visualizando e diagnosticando a saída de um a dois sistemas.
O Segmentador de Palavras de Stanford atualmente suporta árabe e chinês, e os esquemas de segmentação fornecidos têm se mostrado eficazes para uma variedade de aplicações. O sistema requer que o Java 1.8+ esteja instalado, e recomenda-se pelo menos 1G de memória para documentos que contêm frases longas. Para arquivos com frases mais curtas (por exemplo, 20 tokens), diminua o requisito de memória alterando a opção java -mx1g nos scripts de execução.
Stanford University Unstructured é uma estrutura de código aberto para simulação de dinâmica de fluidos computacional e design de forma otimizada.