ConvNetJS es una biblioteca de Javascript para entrenar modelos de Aprendizaje Profundo (Redes Neuronales) completamente en un navegador.
Stanford CoreNLP proporciona un conjunto de herramientas de análisis de lenguaje natural que pueden dar las formas base de las palabras, sus partes del discurso, si son nombres de empresas, personas, etc., normalizar fechas, horas y cantidades numéricas, y marcar la estructura de las oraciones en términos de frases y dependencias de palabras, indicar qué frases nominales se refieren a las mismas entidades, indicar el sentimiento, extraer relaciones de clase abierta entre menciones, etc.
El etiquetador de partes del discurso (POS Tagger) es un software que lee texto en algún idioma y asigna partes del discurso a cada palabra (y otro token), como sustantivo, verbo, adjetivo, etc., aunque generalmente las aplicaciones computacionales utilizan etiquetas de partes del discurso más detalladas como 'sustantivo-plural'.
Stanford Pattern-based Information Extraction and Diagnostics (SPIED) es una extracción de entidades basada en patrones y visualización que proporciona código para dos componentes, Aprender entidades a partir de texto no etiquetado comenzando con conjuntos de semillas utilizando patrones de manera iterativa y Visualizar y diagnosticar el resultado de uno a dos sistemas.
El Segmentador de Palabras de Stanford actualmente admite árabe y chino, y se ha encontrado que los esquemas de segmentación proporcionados funcionan bien para una variedad de aplicaciones. El sistema requiere que Java 1.8+ esté instalado, y recomienda al menos 1G de memoria para documentos que contienen oraciones largas. Para archivos con oraciones más cortas (por ejemplo, 20 tokens), disminuya el requisito de memoria cambiando la opción java -mx1g en los scripts de ejecución.
Stanford University Unstructured es un marco de código abierto para la simulación de dinámica de fluidos computacional y el diseño óptimo de formas.