Springe direkt zu Inhalt

Digital Humanities Werkzeuge für Daten in nicht-lateinischen Schriften

Eine Liste mit digitalen Werkzeugen, von denen die meisten für Daten in nicht-lateinischen Schriften ausgelegt sein sollen. Die Liste befindet sich in der Entwicklung, sie ist weder vollständig noch wurde jedes Werkzeug überprüft. (Letztes Update: August 2018)

Für Ergänzungen oder Hinweise kontaktieren Sie uns gerne unter fdm@campusbib.fu-berlin.de.


Textanalyse

Alpheios

Nur mit Firefox nutzbar, gibt für einzelne Wortformen (aktuell Latein, Griechisch, Arabisch) Informationen zu Morphologie und Bedeutung (klassisches Chinesisch ist in Planung)

CATMA Computer Assisted Textual Markup and Analysis

unterstützt CJK, Arabisch, Hebräisch etc.

Chunagon (中納言)

Ein webbasiertes Werkzeug, mit dem Korpora untersucht werden können. Es wurde von dem National Institute for Japanese Language and Linguistics (NINJAL) entwickelt. Eine Registrierung ist für die Nutzung erforderlich.

Cuneiform Analyser

JSesh

Juxta Collation Software

Juxta Commons (online Version)

Werkzeug für Textkritik

KH Coder

Quantitative Inhaltsanalyse und Text-Mining (japanisch)

Mallet

Topic Modeling, unterstützt Japanisch

Overview

Untersützt unter anderem Russisch; auf der Webseite wird angeben, dass viele Sprachen auf Anfrage ergänzt werden können. Beinhaltet eine OCR (Optical Character Recognition) und ein Entity-Plugin.

Stanford CoreNLP – Natural language software

Linguistische Analysetools mit NER (Named Entity Recognition), POS Tagger (Part of Speech), Parser (works out the grammatical structure of sentences), Sentiment Analysis, Pattern-based entity extraction and visualization, Open information extraction (open IE = extraction of relation tuples, typically binary relations, from plain text). Unterstützt Arabisch und Chinesisch, weiter Informationen zu Sprachen in diesem Werkzeug hier.

Textométrie

Kann rtl-Schrift darstellen, aber viele Funktionen wie Lemmatisierung sind für einige Sprachen nicht möglich. Die linguistische Analyse ist auf chinesische Texte ausgelegt.

Text Tools

Textanalyse und Visualisierung für Japanisch

iGlyph

für hieroglyphische Texte

Voyant


Annotationstools

ANNIS

Open Source Such- und Visualisierungsarchitektur für komplexe, mehrschichtige linguistische Korpora

ELAN

Annotation von Video- und Audiomaterial.

flat 

Umgebung zur linguistischen Annotation basierend auf dem FoLiA-Format 

Markus

Named-entity recognition (NER), Analyse- und Visualisierungstools für chinesische Texte

mmax2 (github, sourceforge)

GUI basierte Desktop-App 

Recogito von Pelagios Commons

Online-Plattform für kollaboratives Annotieren von Texten, Bildern und Tabellen.

STSAnno

Semantic textual similarity (STS) Annotation.

WebAnno (Clarin-D)


Morphologische Analyse / Tokenizer

Japanisch

Chamame

ChaSen

Kuromoji

Morphologische Analyse von japanischen Texten

MeCab

Tiny Segmenter (Japanisch, Java Script)

Sonnenblume (ひまわり)

Keyword-in-Context, Suchsystem

UniDic

Japanisches Lexikon mit Angaben zur Morphologie und integriertem morphologischen Analysewerkzeug MeCab

Chinesisch

Chinese Word Segmentation System

Mehrere Sprachen

Kyoto Text Analysis Toolkit

Word- und Morphemsegmentierung für Japanisch, Chinesisch „and other languages“

Rakuten MA

Morphologische Analyse (word segmentor + PoS Tagger) für Chinesisch und Japanisch.


GIS und Geo-Normdateien

arcGIS

iDAI.gazetteer  (enthält nicht-lateinische Einträge)

DARIAH-DE Geo-Browser

GeoNames (englisch)

GeoNLP (japanisch)

Palladio  (auch Netzwerkanalyse)

PLATIN (Analyse und Visualisierung von geospatialen und temporalen Daten)

QGIS

Storymap

WorldMap


Netzwerkanalyse

Context

Open Source Software zur Netzwerkanalyse und Visualisierung

Cytoscape

Open Source Software zur Netzwerkanalyse und Visualisierung

Gephi

Open Source Software zur Netzwerkanalyse und Visualisierung

Palladio

Visualisierung von Karten/Koordinaten und Visualisierung von Netzwerke; Tabellen; Galerie


Transkriptionstools

Japanisch:

KAKASI

Konvertierung von Kanji in Hiragana, Katakana und lateinische Schrift

Koreanisch:

Hangul-Konverter nach McCune-Reischauer

K-Romanizer der OAS Bibliothek der Universität Princeton (McCune-Reischauer)

Korean Romanization Converter eines Prof. der Seoul National University (Prof. Lee, Sang-Oak), entwickelt vom AI-LAB der Pusan-Universität und der Nara Info Tech Co.

Chinesisch:

漢字轉拼音工具 Pinyin <> Kurz- und Langzeichen (nur für Microsoft Windows)

Romax Pinyin <> Wade Giles


Visualisierung

https://d3js.org/            

JavaScript-Bibliothek für Datenvisualisierung; (inoffiziell) auch CJK-Sprachen


Zeitangabe/ -analyse/ -visualisierung

Timeline JS

Werkzeug um Zeitleisten zu visualisieren

PeriodO

iDAI Chronontology

Topotime

Datenmodelle, 3D-Layouts und Python-Funktionen, um komplexe oder unbestimmte Zeitabschnitte und Ereignisse darzustellen.