Wort. Satz. Semantik. – Wie das Lexikon Wissen organisiert

verfasst von: Dr. phil. Florian Reinartz (Forschung & Entwicklung apenio®)

Semantik ist nicht gleich Semantik: Die Sprachwissenschaft trifft in ihrem Teilbereich der Lehre von Bedeutungen eine grundlegende Unterscheidung zwischen Wortsemantik und Satzsemantik. Die Wortsemantik (auch lexikalische Semantik oder Merkmalsemantik) beschäftigt sich mit der Bedeutung einzelner Wörter; sie ist das ältere der beiden Teilgebiete. Die Satzsemantik untersucht dagegen die Bedeutung komplexer sprachlicher Ausdrücke wie Phrasen und Sätze und steht an der Schnittstelle zwischen Syntax (der Lehre von der Struktur der Sätze), Morphologie (der Lehre vom Aufbau der Wörter) und Semantik.

Fachsprachen sind kontrollierte Sprachen

Im Hinblick auf die Wissensdarstellung einer Domäne in einem spracherkennenden, semantischen Netz ist die Frage zu stellen, mit welchen linguistischen Modellen Wissen und Bedeutungen in dieser Domäne am effizientesten erfasst werden können. Eine Fachsprache ist eine konkrete Sprache, die sich in einem Fachgebiet oder einer Branche konstituiert und innerhalb ihrer Domäne vor allem kommunikative und wirklichkeitsbeschreibende Funktionen übernimmt; innerhalb des Fachgebietes möchte man sich möglichst unmissverständlich über das betreffende Thema unterhalten und austauschen können. Medizinische und juristische Fachsprache, Jäger-, Seemanns- und Fliegersprache heben sich beispielsweise durch ein umgrenztes Fachvokublar – oft auch durch aus anderen Sprachen wie dem Lateinischen entlehnte Wörter – von der Umgangssprache ab. Wegen ihres umgrenzten Vokabulars mit festen Begriffen und Phrasen spricht man auch von kontrollierten Sprachen.

Umgrenztes Vokabular

Es liegt nahe, bei einer Fachsprache in erster Linie der lexikalischen Seite, dem Fachvokabular, Aufmerksamkeit zu schenken. Nach dem sogenannten Kompositionalitätsprinzip nach G.Frege ergibt sich die Bedeutung eines komplexen sprachlichen Ausdrucks aus der Bedeutung seiner einzelnen Teile. Versteht man also die Bedeutung der Wörter, so lässt sich die Bedeutung von Wortzusammensetzungen, Phrasen und ganzen Sätzen erschließen. In einer eng umgrenzten Domäne – das Lexikon der Pflegefachsprache apenio® umfasst beispielsweise ca. 11.000 Begriffe, während die deutsche Sprache über 300.000 Wörter kennt – sind die Wortverbindungen, Phrasen und Sätze zudem häufig gleich und somit erwartbar. Sie weisen eine nur geringe Varianz auf. Ganz im Gegensatz dazu steht beispielsweise die sehr variantenreiche literarische oder wissenschaftliche Sprache.

Vom Wortnetz zur Bedeutung

Effizient erscheint dagegen die Möglichkeit, das lexikalisch verankerte Wissen auch auf eben dieser lexikalischen Ebene zu organisieren. Indem die Elemente des Lexikons untereinander in Beziehung gesetzt werden, beschreiben sie sich gegenseitig und ohne weitere strukturgebende Elemente. Da jedes Wort „weiß“, zu welchen anderen Worten es in Beziehung steht, ergibt sich ein enges, semantisches Wort-Netz (s. Bild). Dieser Ansatz wird in der Pflegedokumentationssoftware apenio im Bereich der semantischen Suche und der Vorschlagsheuristik verfolgt und liefert plausible semantische Ergebnisse, wie das Modul „Quick Planning“ in apenio® demonstriert.

Visualisierung eines Wort-Netzes in apenio®:

apenio Visualisierung eines semantischen Netzes

Zurück