DERCOM entwickelt CMS-TMS-Schnittstelle COTI (Common Translation Interface)

Lange war das Fehlen eines Standards für den Austausch von Daten zwischen Redaktionssystemen und Translation-Memory-Systemen ein Dorn im Auge vieler Beteiligter am Dokumentationsprozess. Bis vor Kurzem sah die Realität noch so aus: Redaktionssysteme verwalten Informationsmodule und stellen sie je nach Bedarf zu neuen Dokumenten zusammen.

Da Dokumentationen mehrsprachig benötigt werden, exportieren Redaktionssysteme noch nicht übersetzte Module in ein eigenes, meist XML-basiertes Format. Diese Übersetzungspakete importieren dann die jeweiligen Translation-Memory-Systeme, die für jedes einzelne Redaktionssystem individuelle Importeinstellungen konfigurieren müssen.

DERCOM-Gründung im Jahr 2013

Mitte 2013 schlossen sich sieben Hersteller von Redaktionssystemen zum “Verband deutscher Redaktions- und Content Management System Hersteller e.V.” (DERCOM) zusammen. Gründungsmitglieder sind folgende Unternehmen: Acolada GmbH, DOCUFY GmbH, Empolis Information Management GmbH, gds AG, Noxum GmbH, Ovidius GmbH und SCHEMA GmbH.

Ziel: Entwicklung einer herstellerneutralen Schnittstelle – Projektname COTI

Ihr Ziel war zuerst die Entwicklung einer herstellerneutralen Schnittstelle für den Austausch von Übersetzungsprojekten zwischen Redaktionssystemen und Translation-Memory-Systemen. Dieses Projekt trägt den Namen COTI (Common Translation Interface).

Inzwischen hat der Hersteller von Redaktionssystemen, die Fischer Computertechnik FCT AG bekanntgegeben, dass er eine COTI-Schnittstelle für das COTI-Level 1 implementiert hat. Seitens der TMS-Hersteller haben bereits SDL, Across und Kilgray (MemoQ) zugesagt, COTI zu implementieren.

Fehlen von Standards behindert Datenaustausch

Die COTI-Initiative war eigentlich längst überfällig. Das Fehlen von Standards für den Datenaustausch zwischen Redaktionssystemen und TMS stellt eine unnötige Hürde für einen reibungslosen Dokumentationsprozess dar.

Mit dem neuen einheitlichen Standard, der sowohl für Redaktionssysteme als auch für TMS gilt, soll es nun möglich sein, den Datenaustausch zu automatisieren und gleichzeitig eine größere Flexibilität bei der Auswahl von Ressourcen zu erzielen.

Die Version 1.0 von COTI wurde am 28.05.2014 verabschiedet. Die Schnittstellen der DERCOM-Mitglieder werden innerhalb von DERCOM zertifiziert. Alle Mitglieder haben sich vertraglich verpflichtet, diese Schnittstelle zu implementieren, was für Ende des zweiten Quartals 2015 vorgesehen ist.

Die COTI-Beschreibung kann von der Webseite des Verbands heruntergeladen werden.

Was sind die Besonderheiten des COTI-Formats?

Das Basisprinzip von COTI ist eine klare Arbeitsteilung zwischen Redaktionssystem und TMS. Jede Anwendung soll dafür sorgen, dass die erzeugten und ausgetauschten Daten den Vorgaben der Schnittstelle entsprechen.

Das ist insbesondere der Fall, wenn Redaktionssysteme bzw. TMS aufgrund neuer Funktionen bzw. Funktionsänderungen Anpassungen an den Datenformaten vornehmen. Dank der COTI-Schnittstelle bleibt die Austauschbarkeit der Daten und auch der Altdaten gewährleistet.

COTI besteht aus drei aufeinander aufbauenden Integrationsstufen (Levels). Stufe 2 und 3 ermöglichen unterschiedliche Grade der Automatisierung:

  • Definition des Übersetzungspakets (Level 1)
  • Import und Export der Pakete (Level 2)
  • Kommunikations-API zwischen Redaktionssystem und TMS (Level 3)

Bei der ersten Stufe (Level 1) wird vom Redaktionssystem ein Übersetzungspaket definiert. Dieses Übersetzungspaket hat die Endung “coti” und ist die Basiseinheit für den Datenaustausch zwischen Redaktionssystem und TMS.

Übersetzungspakete

Das Übersetzungspaket ist eine ZIP-Datei mit definierter Verzeichnisstruktur, die verschiedene Dateien enthält:

  • Metadaten (die COTI.xml-Datei)
  • Übersetzungsdateien
  • Referenzdateien
  • zusätzliche Dateien

Ein Übersetzungspaket kann durchaus mehrere Zielsprachen enthalten. Die Metadaten sind Informationen, die das Redaktionssystem benötigt, um die übersetzten Module nach dem Übersetzungsprozess korrekt zu importieren. Es sind Informationen wie Projektnummer, Exportdatum, Zielsprache und Sprachstatus usw.

Die Übersetzungsdateien sind zwar meistens XML-Dateien, sind aber im Grunde alle Dateien, die zu übersetzen sind. COTI sorgt für einen Austausch von zu übersetzenden Dateien unabhängig von ihrem Format. Bei den Referenzdateien geht es um das bei Übersetzungsprojekten übliche Referenzmaterial, es können aber auch Anweisungen, Stylesheets, Formatvorlagen usw. sein.

Der Name des Übersetzungspakets und des enthaltenen Übersetzungsprojekts sowie die Verzeichnisstruktur werden von COTI festgeschrieben und können vom TMS nicht geändert werden.

Modalitäten des Austauschs zwischen Redaktionssystem und TMS

Die zweite Stufe (Level 2) beschäftigt sich mit den Modalitäten des Austauschs zwischen Redaktionssystem und TMS. Beide Systeme arbeiten mit einem Verzeichnis in einem gemeinsamen Dateisystem. Grundsätzlich wird der Name der jeweiligen Ordner für übersetzte und nicht übersetzte Dateien standardisiert (“untranslated” und “translated”). Dazu kommen noch Unterverzeichnisse für Fehler-, Archiv- und Protokolldateien.

Typisches Szenario für automatischen Austausch

Ein typisches Szenario für einen automatischen Austausch sieht wie folgt aus: Das Redaktionssystem erzeugt zuerst ein Übersetzungspaket und legt es im gemeinsamen Verzeichnis am Anfang des Projekts ab. Das TMS erkennt, dass dieses Verzeichnis eine neue Datei erhalten hat und importiert das Paket. Danach werden die Übersetzungsdateien übersetzt und anschließend vom TMS in das gemeinsam benutzte Verzeichnis kopiert. Das Redaktionssystem entdeckt das übersetzte Paket und importiert das Ergebnis.

Kommunikation über API-Schnittstelle

Die dritte Stufe (Level 3) regelt die Einzelheiten der Kommunikation über eine API-Schnittstelle. Sie ist für weitgehend vollautomatisierte Prozesse vorgesehen. Die Schnittstelle sorgt über SOAP für den Remote-Zugriff auf das Redaktionssystem bzw. TMS und regelt unter anderem Fragen der Authentifizierung und der Sicherheit beim Austausch von Daten über einen Webserver (u. a. Einloggen und Ausloggen in das / aus dem Redaktionssystem bzw. TMS). Bei der Herstellung einer Verbindung zum TMS fragt z. B. die Kommunikationsschnittstelle bestimmte Informationen vom TMS ab, wie den Projektstatus oder die Metadaten des Projekts. Sie kümmert sich auch um Dienste wie Benachrichtigungen oder das Versenden von Berichten.

COTI: Vorteile für Software-Hersteller und -Nutzer

Für die jeweiligen Programmhersteller bietet COTI viele Vorteile. Vor allem müssen sie sich nicht mehr mit den individuellen Aspekten der Schnittstellen einzelner TMS bzw. Redaktionssysteme beschäftigen und können sich dadurch auf ein Format konzentrieren. Aber auch der Nutzer hat viele Vorteile: Er hat eine Art Plug-and-Play-Lösung, d. h. die Daten sind ohne weitere Einstellungen austauschbar.

[Text: D.O.G. GmbH. Quelle: D.O.G. news 1/2015. Wiedergabe mit freundlicher Genehmigung von Dr. François Massion.]