>> danielnaber.de 

 

 

Deutsches Morphologie-Lexikon

   
 
Mit external link to MorphyMorphy gibt es schon seit langem eine Software zur morphologischen Analyse von deutschen Texten. Leider läuft Morphy nur unter Windows. Die Wort-Daten selber aber lassen sich als Textdateien exportieren und ich stelle sie hier zum Download bereit:
  • internal link to Lemmatizer-Daten als MySQL-Dump (3,9MB)Lemmatizer-Daten als MySQL-Dump (3,9MB): eine Tabelle aller Wortformen und eine weitere Tabelle, die die flektierten Formen auf die Grundformen mappt. Beispiele: Aals -> Aal, absahnte -> absahnen, minutiösem -> minutiös
  • internal link to Vollformenlexikon (24MB, Encoding: ISO-8859-1)Vollformenlexikon (24MB, Encoding: ISO-8859-1): der Text-Export aller Wörter aus Morphy, die dann anschließend mit Morphy analysiert wurden. Format-Beispiel:
    <form>Aal</form>
    <lemma wkl=SUB kas=NOM num=SIN gen=MAS>Aal</lemma>
    <lemma wkl=SUB kas=DAT num=SIN gen=MAS>Aal</lemma>
    <lemma wkl=SUB kas=AKK num=SIN gen=MAS>Aal</lemma>
    <lemma wkl=VER form=IMP num=SIN konj=SFT>*aalen</lemma>
    Die Dokumentation der Tags befindet sich auf der external link to Morphy-HomepageMorphy-Homepage im Bereich Download.

Beide Dateien umfassen je ca. 431.000 Wortformen. Von vielen (allen?) Wörtern, deren Schreibweise sich mit der Rechtschreibreform geändert hat, fehlt die aktuelle Schreibweise.

Die Dateien unterliegen einer Creative-Commons-Lizenz (external link to Attribution-Share Alike 3.0Attribution-Share Alike 3.0).

Links zu ähnlichen Daten und Programmen:

 
 
naber (at) danielnaber de, Last updated: 2010-05-14
URL: http://www.danielnaber.de/morphologie/