stylo-ah-online
Browser-tool für textmining. Pipeline: Normalisierung, Tokenisierung, statistische Profile, Maßberechnung, Clusterung. Die Software bietet ein einfaches interface für exzessive Einstellungsmöglichkeiten. Durch Exportfunktionen und Selbstdokumentation unterstützt sie das replizierbare Arbeiten.
Description
Texte in token zu zerlegen und diese token-Verteilungen statistisch und comparativ auszuwerten, ist ein bekanntes Verfahren der Textanalyse. Die Clusterung von Texten zur Erschließung von Ketegorien, die durch gleiche statistische Eigenschaften der token charkterisert werden, ist nun im Browser verfügbar. Zentrale Funktionen, wie die Darstellung von Zwischenergebnissen, die implizite Dokumentation und die Speicherung von Zwischenergebnissen, die für replizierbares, wissenschaftliches Arbeiten notwendig sind, werden vom tool implementiert. Damit und im Funktionumfang, sowie der Einfachheit der Benutzung, geht das tool über alle tools dieser Art hinaus.
Related projects
replicatio
(Ir)reproducibility of Scientific Research in the Digital Humanities?