ConvNetJS ist eine Javascript-Bibliothek zum Trainieren von Deep-Learning-Modellen (neuronale Netzwerke) vollständig in einem Browser.
Stanford CoreNLP bietet eine Reihe von Werkzeugen zur Analyse natürlicher Sprache, die die Grundformen von Wörtern, ihre Wortarten, ob es sich um Namen von Unternehmen, Personen usw. handelt, normalisieren von Daten, Zeiten und numerischen Mengen, und die Struktur von Sätzen in Bezug auf Phrasen und Wortabhängigkeiten markieren, angeben, welche Nominalphrasen sich auf dieselben Entitäten beziehen, Sentiment angeben, offene Klassenbeziehungen zwischen Erwähnungen extrahieren usw.
Part-Of-Speech Tagger (POS Tagger) ist ein Softwareprogramm, das Text in einer Sprache liest und jedem Wort (und anderen Token) Wortarten zuweist, wie z.B. Substantiv, Verb, Adjektiv usw., obwohl rechnerische Anwendungen im Allgemeinen feinere POS-Tags wie 'Substantiv-Plural' verwenden.
Stanford Pattern-based Information Extraction and Diagnostics (SPIED) ist eine musterbasierte Entitätsextraktion und -visualisierung, die Code für zwei Komponenten bereitstellt: Lernen von Entitäten aus unbeschriftetem Text, beginnend mit Seed-Sets unter Verwendung von Mustern in iterativer Weise, und Visualisieren und Diagnostizieren der Ausgabe von einem bis zwei Systemen.
Der Stanford Word Segmenter unterstützt derzeit Arabisch und Chinesisch, wobei die bereitgestellten Segmentierungsschemata sich als gut für eine Vielzahl von Anwendungen erwiesen haben. Das System erfordert, dass Java 1.8+ installiert ist, und empfiehlt mindestens 1G Speicher für Dokumente, die lange Sätze enthalten. Für Dateien mit kürzeren Sätzen (z.B. 20 Token) kann der Speicherbedarf verringert werden, indem die Option java -mx1g in den Ausführungsskripten geändert wird.
Stanford University Unstructured ist ein Open-Source-Framework für die Simulation von Strömungsmechanik und das optimale Formdesign.