Die Firma OpenText hat das Karlsruher Institut für Technologie (KIT) für seine aktuellen Entwicklungen im Bereich Web-Content Management und die Integration einer semantischen Analyse mit einem Innovation Award im Bereich Innovative Discovery ausgezeichnet. KIT-Mitarbeiter Ulrich Weiß, der mit seinem Team für das OpenText Website Management am KIT verantwortlich ist, hat auf der globalen Kundenkonferenz "Enterprise World 2013" der Firma im November 2013 die Entwicklungen des SCC präsentiert und nahm den Preis entgegen.
Das KIT betreibt eine der weltweit größten Installationen des OpenText Website Management-Systems zur Pflege der KIT-Seiten. Seit Oktober 2013 ist eine neue Suche basierend auf der OpenText-Technologie Semantic Navigation umgesetzt worden. Damit lassen sich Intranet- und Internetwebseiten mit Hilfe einer facettierten Suche erschließen. Die Facettierung erlaubt, Suchtreffer anhand von Kategorien sukzessive einzuschränken bis die gesuchte Information gefunden ist. Diese Vorgehensweise eröffnet jedem Besucher
individuelle Möglichkeiten, sich den KIT-Internetaufritt mit mehr als 200.000 Seiten zu erschließen.
Die Erstellung des Suchindex erfolgt dabei automatisch ohne manuelle Verschlagwortung und Kategorisierung. Ein Modul, das der semantischen Analyse dient (OpenText Content Analytics), wurde im Rahmen der KIT-Entwicklung integriert und kann nun auch innerhalb des Redaktionssystems verwendet werden. Dieses Analysetool ist in der Lage, aus einem Text kurze Zusammenfassungen zu erstellen und Personen-, Einrichtungs-, Ortsnamen oder Schlagwörter zu extrahieren.
Die KIT-Erweiterung unterstützt die Redakteure der Webseiten bei "lästigen" Alltagstätigkeiten, die häufig vernachlässigt werden: Die Pflege von HTML-Metadaten wie Meta-Keywords und Meta-Description, die auch zur Suchmaschinenoptimierung dienen.
Darüber hinaus werden Redakteure durch die Entwicklung im Redaktionssystem bei der Erstellung von Teasern auf der Homepage aktiv unterstützt: Dazu werden eine Inhaltsseite automatisch analysiert und Elemente für den Teaser extrahiert. Während Überschrift und Bild direkt extrahierbar sind, wird für den Teaser-Text eine Zusammenfassung des Inhalts mit drei Sätzen generiert. Diese extrahierten Informationen dienen als Vorlage für den Teaser, der durch die Redakteure dann auf eine sinnvolle Länge überarbeitet bzw. gekürzt werden muss. Die anschließende Erstellung und Einbindung des Teasers erfolgt wiederum automatisch.