Linguistisches Wissen zur automatischen Lexikon-Akquisition aus deutschen Textcorpora
Judith Eckle-Kohler
ISBN 978-3-89722-301-1
402 pages, year of publication: 1999
price: 40.00 €
Linguistisches Wissen zur automatischen Lexikon-Akquisition aus deutschen Textcorpora
Automatischen Verfahren zur Lexikon-Akquisition gilt schon seit einigen
Jahren ein besonderes Forschungsinteresse, da lexikalische Ressourcen bei
einer Vielzahl von Systemen zur maschinellen Sprachverarbeitung eine
wichtige Rolle spielen und der Aufwand für den manuellen Aufbau solcher
Ressourcen sehr hoch ist.
Systeme, die beispielsweise für die maschinelle Übersetzung eingesetzt werden, sollten idealerweise den Inhalt eines gegebenen Textes erfassen können. Voraussetzung für die automatische Erfassung des Inhalts eines Textes ist jedoch dessen vollständige syntaktische Analyse, die nur dann durchgeführt werden kann, wenn ein maschinenlesbares syntaktisches Lexikon mit detaillierten Angaben zu Subkategorisierungseigenschaften zur Verfügung steht.
Die vorliegende Arbeit beschreibt linguistisches Wissen und darauf aufbauende Verfahren zur automatischen Akquisition von Subkategorisierungsrahmen deutscher Verben aus Textcorpora, die für den halbautomatischen Aufbau eines Subkategorisierungslexikons mit Angaben zu 6305 Verblemmata und 244 Subkategorisierungsrahmen eingesetzt worden sind.
Für Verben mit satzförmigen Komplementen wird gezeigt, wie fehlende Subkategorisierungsrahmen in einem Subkategorisierungslexikon mit Hilfe automatisch anwendbarer, auf Subkategorisierungsalternationen basierender, linguistischer Regeln ergänzt werden können.








