ConvNetJS est une bibliothèque Javascript pour l'entraînement de modèles d'apprentissage profond (réseaux neuronaux) entièrement dans un navigateur.
Stanford CoreNLP fournit un ensemble d'outils d'analyse du langage naturel qui peuvent donner les formes de base des mots, leurs parties du discours, s'ils sont des noms d'entreprises, de personnes, etc., normaliser les dates, les heures et les quantités numériques, et marquer la structure des phrases en termes de phrases et de dépendances de mots, indiquer quelles syntagmes nominaux se réfèrent aux mêmes entités, indiquer le sentiment, extraire des relations de classe ouverte entre les mentions, etc.
Un étiqueteur de parties du discours (POS Tagger) est un logiciel qui lit le texte dans une langue et attribue des parties du discours à chaque mot (et autre jeton), comme le nom, le verbe, l'adjectif, etc., bien que généralement les applications informatiques utilisent des étiquettes de parties du discours plus détaillées comme 'nom-pluriel'.
Stanford Extraction et Diagnostic d'Information Basé sur des Modèles (SPIED) est une extraction d'entités basée sur des modèles et une visualisation qui fournit du code pour deux composants, Apprendre des entités à partir de texte non étiqueté en commençant par des ensembles de départ en utilisant des modèles de manière itérative et Visualiser et diagnostiquer le résultat d'un à deux systèmes.
Le segmentateur de mots de Stanford prend actuellement en charge l'arabe et le chinois, et les schémas de segmentation fournis ont été jugés efficaces pour une variété d'applications. Le système nécessite l'installation de Java 1.8+ et recommande au moins 1 Go de mémoire pour les documents contenant de longues phrases. Pour les fichiers avec des phrases plus courtes (par exemple, 20 tokens), réduisez l'exigence de mémoire en modifiant l'option java -mx1g dans les scripts d'exécution.
Stanford University Unstructured est un cadre open-source pour la simulation de dynamique des fluides computationnelle et la conception de formes optimales.