Wissen, der neue Rohstoff – Wachstumsmarkt bietet Chancen für Terminologen, technische Redakteure und Übersetzer

„Wissen ist Macht.“ – Dieses geflügelte Wort formulierte der englische Philosoph Francis Bacon vor etwas mehr als 400 Jahren.

Für Unternehmen sind fachkundige Informationen und Wissen ein entscheidender Wettbewerbsfaktor. Wer Entwicklungen am Markt schneller erkennt oder alle Wissensstrukturen innerhalb seines Unternehmens perfekt vernetzt, hat definitiv die Nase vorn. Das ist der Grund, warum im Zeitalter von künstlicher Intelligenz und vom Internet der Dinge Unternehmen zunehmend den Aufbau und die Verwaltung von Wissen zum Bestandteil ihrer Strategie machen.

Wissen zu identifizieren und zu organisieren ist eine große Herausforderung und benötigt viele Ressourcen. Das eigene Wissen ist verstreut in Ordnern, Dateien und in den Köpfen zahlreicher Mitarbeiter. Dazu kommen die Unmengen an Daten, die täglich das Internet oder verschiedene Quellen generieren. In dieser Form ist Wissen ein Rohstoff. Wie lässt er sich zu brauchbarem Wissen veredeln?

Welchen Beitrag zur Wissensorganisation können technische Redakteure und Übersetzer leisten?

In den letzten Jahren sind bei der automatischen bzw. halbautomatischen Wissensextraktion und -organisation dank künstlicher Intelligenz und Lernalgorithmen große Fortschritte erzielt worden.

Die entscheidende Frage für Wissensarbeiter wie Redakteure und Übersetzer ist, welchen Beitrag sie beim Aufbau von Wissen leisten können. Vor allem bei der Verarbeitung von Informationen in natürlicher Sprache können Redakteure oder Übersetzer mitwirken. Und mit natürlicher Sprache ist nicht nur Deutsch, sondern sind auch die üblichen Handelssprachen gemeint.

Wissen: strukturiert verfügbare Informationen mit Metadaten

Zuerst ist es wichtig zu verstehen, was ein Unternehmen eigentlich unter Wissen versteht. Wissen besteht aus Informationen, die strukturiert verfügbar und mit Metadaten (Daten über die Daten) angereichert sind. Damit können nicht nur Menschen das vorhandene Wissen nutzen. Vor allem Programme können es für unterschiedliche Unternehmensprojekte verwenden. Einige Beispiele solcher möglichen Anwendungen sind:

Analyse der Wahrnehmung des Unternehmens in der Öffentlichkeit, z. B. in sozialen Medien, um schneller auf bestimmte Entwicklungen zu reagieren (Sentiment Analysis).
Optimierung der Kundenbetreuung durch automatische Beantwortung von Fragen in Deutsch oder Fremdsprachen (Smart Assistenten, Chatbots. Beispiel: Lufthansa mit „Mildred“ oder Sixt mit seinem „Jobbot“).
Empfehlungssystem für Endkunden bei ihrer Suche nach Produkten oder Leistungen.

Fachübersetzer sind in der Lage, sprach- oder kulturbedingte Unterschiede bei der Organisation von Wissen zu erkennen

Der Aufbau von Wissen ist Teamarbeit, bei der unterschiedliche Spezialisten mitwirken: Ingenieure, Computerlinguisten oder Data Science Spezialisten und einige mehr. Die besondere Kompetenz von Redakteuren liegt darin, dass sie ständig mit Wissensvermittlung zu tun haben. Sie haben ein breites Wissen über Unternehmensprodukte und haben auch ein gutes Netz an Informationsquellen aufgebaut.

Fachübersetzer haben vor allem ein gutes linguistisches Know-how. Sie sind in der Lage, sprach- oder kulturbedingte Unterschiede bei der Organisation von Wissen zu erkennen und zu dokumentieren. Beispiel: Kraftfahrzeuge, die in den USA oder in Japan anders klassifiziert sind als in Deutschland.

Inwiefern ist das für Wissensprojekte von Interesse? Um das nachzuvollziehen, müssen wir grob verstehen, wie Wissen extrahiert und verfügbar gemacht wird.

Am Anfang stehen größere Mengen an Daten in natürlicher Sprache zur Verfügung: Sammlungen von Texten, Webseiten, Beiträgen aus sozialen Medien, etc. Diese Mengen sind zu groß, um sie in einem vernünftigen Zeit- und Kostenrahmen manuell auszuwerten. Künstliche Intelligenz, Verfahren der Computerlinguistik und maschinelles Lernen erkennen Wissenselemente und machen sie sichtbar.

Computerlesbares Wissen in Form von Ontologien

In einem ersten Schritt ist die Verarbeitung der natürlichen Sprache stark statistisch, wenn bereits andere Aspekte (z. B. Syntax) zum Tragen kommen. Damit kann ein System irgendwann lernen, dass zum Thema „Auto“ Elemente wie „Lenkrad“, „Sitz“, „Gaspedal“, „Blinker“ und „Rückspiegel“ gehören. Es wird außerdem einen besonderen Zusammenhang zwischen „Blinker“ und „Rückspiegel“ erkennen und diese Begriffe vielleicht einer Kategorie „Sicherheit“ zuweisen.

Dieses Wissen wurde u. U. nirgendwo ausdrücklich als Wissen formuliert. Wissensspezialisten werten diese Informationen aus, um daraus computerlesbares Wissen zu erzeugen, etwa in Form von Ontologien.

Technische Redakteure und Übersetzer tragen dazu bei, Wissensorganisation zu verbessern

Damit ist der Punkt erreicht, an dem Redakteure oder Übersetzer dazu beitragen können, Lernverfahren und Methoden der Wissensorganisation nachhaltig zu verbessern. Sie können bereits im Vorfeld semantische Informationen bereitstellen, die diese Verfahren deutlich präziser, schneller und effizienter machen.

Seit einigen Jahren entstehen vermehrt Terminologiebestände, die Redakteure oder Übersetzer für ihre tägliche Arbeit anlegen. Bei einigen Großunternehmen erreicht die Zahl der erfassten Termini beeindruckende Größenordnungen, wie bei SAP mit ca. 245.000 Begriffen und 4,6 Millionen Terminologieeinträgen in 48 Sprachen. (Quelle: Präsentation „Terminology Management at SAP“ von Mark Childress auf Frühjahrsschule der FH Anhalt in Köthen im März 2018.)

Erfasste Terminologie große Chance für Wissensarbeit

Während die meisten Wissensspezialisten diese Bestände bisher wenig beachtet haben, stellt die erfasste Terminologie eine große Chance für die Wissensarbeit dar.

Um auf unser Autobeispiel zurückzukommen, stehen in einer professionell aufgebauten Terminologiedatenbank unter dem Begriff „Rückspiegel“ neben der Definition und der Benennung „Rückspiegel“ auch Synonyme wie „Innenspiegel“ oder Fremdsprachenbenennungen wie „rearview mirror“ oder „interior mirror“. Ähnlich bei „Blinker“ mit Synonymen wie „Fahrtrichtungsanzeiger“.

Es sind qualitativ hochwertige und validierte Informationen, mit denen Lernverfahren für die Wissensextraktion optimiert und beschleunigt werden können. Als weiterer Effekt sind dadurch geringere Mengen an Trainingsdaten erforderlich, um gute Lernergebnisse zu erzielen.

Terminologieverwaltungssysteme können Relationen zwischen Begriffen darstellen

Seit wenigen Jahren können manche Terminologieverwaltungssysteme, wie das von der D.O.G. GmbH entwickelte „LookUp„, Relationen zwischen den Begriffen darstellen. Das sind weitere nützliche Elemente, auf die Wissensexperten zurückgreifen können. Mit Relationen wie „A ist Teil von B“ oder „A ist Voraussetzung für B“ liefern wissenshaltige Terminologiesysteme geprüfte Informationen, die sonst anderswo noch mühsam aufgebaut werden müssen. Das schafft bei Wissensprojekten einen wertvollen Zeitvorsprung.

Schließlich können mithilfe von Terminologiedaten Wissensbestände wie Ontologien oder annotierte Dokumente deutlich präziser ausgetauscht werden. Ihre Schwäche ist ja, dass sie oft sprachlich wenig aufbereitet sind. Der Zugang zu oder der Austausch von Informationen erfolgt bisher oft nur über die hinterlegten Klassenbezeichnungen. Das ist natürlich ein Problem, wenn die menschliche oder maschinelle Suche andere Bezeichnungen verwendet. Ferner sind Ontologien meistens in nur einer Sprache definiert.

Wissensextraktion und -management: Neue Chancen für Terminologen, Redakteure und Übersetzer

Künstliche Intelligenz, Big Data, Wissensextraktion und Wissensmanagement sind die Bereiche, die in den nächsten Jahren sehr schnell wachsen werden. Dafür braucht man Ressourcen und gute Trainingsdaten. Das eröffnet neue Chancen für Terminologen, Redakteure und Übersetzer, die über Jahre und mit viel Fleiß Terminologien aufgebaut haben.

[Text: D.O.G. Dokumentation ohne Grenzen GmbH. Quelle: D.O.G. news, 02/2018. Wiedergabe mit freundlicher Genehmigung von Dr. François Massion. Bild: D.O.G. GmbH.]