Kristin Oswald

Online-Redakteurin, Kultur & Geisteswissenschaften, Erfurt

8 Abos und 4 Abonnenten
Artikel

Wissen suchen, finden und vernetzen - die Fachtagung "Semantische Technologien" im Rückblick

Unter dem Motto „Verwertungsstrategien und Konvergenz von Metadaten" organisierten das deutsch-österreichische W3C-Büro und die Xinnovations e. V. in Zusammenarbeit mit dem Innovationsforum Semantic Media Web vom 26. bis 27. September in Berlin eine Fachtagung, die sich mit der Nutzbarkeit semantischer Technologien für die Kultur- und Medienbranche befasste. Dabei waren Verlage, Museen und Bibliotheken als Institutionen ebenso Thema, wie Projektdokumentationen oder Werbung und Marketing.


Der Umfang des im Internet verfügbaren Wissens ist in den letzten Jahren immens gewachsen, jedoch zu wenig sortiert und aufbereitet, um gut damit arbeiten zu können. Hier setzen die Technologien des semantischen Internet, genannt Web 3.0, an. Sie sollen Inhalte jeglicher Art durch Metadaten kategorisieren und in Hierarchien einordnen, um eine (möglichst einheitliche) Verknüpfung des verfügbaren Wissens und damit dessen bessere Zugänglichkeit und Anwendbarkeit zu ermöglichen. Zugleich kann die Recherche im Internet verbessert werden, da nicht mehr textuelle Schlagworte gesucht werden, sondern Inhalte selbst. Diese werden von semantischen Suchmaschinen graphisch, tabellarisch oder textuell zusammengestellt und nicht mehr als Liste von Websites präsentiert, ohne den Bezug zu den Quellen oder zu zugehörigen Dokumente, Videos oder Bildern als Links zu verlieren.


Zentrale Fragestellung der Konferenz war es, die Vorteile solcher semantischer Daten und die Möglichkeiten ihrer Umsetzung und Nutzung für Kultur- und Medienbetriebe aufzuzeigen. Notwendig war ein grundlegendes Verständnis für die Funktionsweise des Semantic Web und die dahinter stehenden Programmiersprachen, die Beziehungen, Kontexte und Bedeutungen für Daten erzeugen können. Genutzt wird deren semantische Aufbereitung bereits in verschiedenen Kontexten z.B. für Wikipedia als in sich querverlinkte Datenbank von Texten, Bildern und Literaturverweisen. Die Übersichtsbox jedes Artikels enthält dessen Basisdaten in semantischer Form. Diese werden von Wikipedia-änlichen, semantischen Wissensmanagement-Systemen wie der DBpedia bereits verarbeitet.


Neben Wikipedia nutzen auch Kulturinstitutionen wie die Deutsche Nationalbibliothek und das Bundesarchiv semantische Daten, um ihre Wissensressourcen im Internet zur Verfügung zu stellen und Recherchen zu erleichtern. Die Querverlinkungen helfen, sich Überblick über komplexe Themenfelder und verwandte Beiträge, Bücher oder Dokumente zu verschaffen. Daneben stehen vor allem die Digitalisierung von Museums- oder Archivsammlungen und auch wirtschaftliche Bereiche wie Bestandsaufnahmen, Vertrieb und bei Bibliotheken damit einhergehend die Aufbereitung für die Online-Kataloge. Hier bringt die Nutzung semantischer Metadaten bereits viele Vorteile und Vereinfachungen des Workflows mit sich, wie die Referenten der Fachkonferenz darlegten. Zu ihnen gehörten Alexander Haffner (Deutsche Nationalbibliothek) und Ina Blümel (TIB Hannover) als Bibliotheksvertreter, Dr. Jana Kittelmann (Stiftung Fürst-Pückler-Museum Park & Schloss Branitz) mit dem Schwerpunkt Archiv, Antoine Isaac als Stellvertreter von Europeana sowie Bettina de Keijzer (Verlag de Gruyter), Steffen Meier (Verlag Eugen Ulmer, Arbeitskreis elektronisches Publizieren des Börsenverein des Deutschen Buchhandels) und Ronald Schild (Marketing- und Verlagsservice des Buchhandels GmbH), die sich mit dem Thema Verlag & Buchhandel beschäftigen.


In deren Beiträgen und darauf folgenden Diskussionen wurde deutlich, dass die Idee einer Verknüpfung semantisch aufbereiteter Daten über einzelne Firmen und Institutionen hinaus noch kaum Anwendung findet. Dabei sollen neben Rahmen- oder basic data wie dem Autor oder dem Umfang eines Buches, vorrangig die Inhalte semantisch systematisiert werden. Nach der Idee des Open Knowledge steht hierbei nicht die Veröffentlichung interner Firmendaten im Mittelpunkt, sondern die gesellschaftliche oder zumindest fachliche Nutzung von weiterreichenden, sogenannten enhanced Data, um zum Ausgleich Wissen, Kundensympathie oder wirtschaftlichen Output zurückzubekommen. So machte Roland Schild deutlich, dass Verlage z. b. ihren Service im Social Web mit Semantik verbessern können, um ihren Kunden bei der Suche nach ähnlichen Produkten und auf diese Weise sich selbst bei der Umsatzsteigerung zu helfen. Hierfür wird das Semantic Web bisher aber kaum genutzt. Zugleich gibt es zwischen Verlagen und Bibliotheken nur wenig Zusammenarbeit in Bezug auf die einheitliche Zuordnung von Büchern und deren Inhalten zu festen semantischen Begrifflichkeiten oder Kategoriesystemen.


Gleiches gilt für Archive oder Museen, die ihre Sammlungen digitalisieren und beispielsweise an die europäische Kulturgüter-Datenbank Europeana weiterleiten. Auch sie behandeln die weiteren Kontexte der Exponate meist nur marginal und verwenden keine übergreifenden semantischen Begriffssysteme, obwohl die zugängliche Wissensbasis durch neue, einheitlich strukturierte Daten problemlos vervielfacht werden kann. So könnte eine Vereinheitlichung beispielsweise helfen, passende Stücke für Sonderausstellungen oder Informationen zu Vergleichsbeispielen zu finden. Interessant können auch Metadaten zur Dokumentation von Projektprozessen sein, um die Auswertung und das Vermeiden von Fehlern in der Zukunft zu verbessern und Hilfestellung zu bieten. Beispielhaft präsentierte Prof. Dr.-Ing. Ernesto De Luca hierfür das Projekt SemRes, das Semantic für die tägliche Arbeit von Restauratoren nutzbar macht, um diese zugunsten der späteren Nachvollziehbarkeit dauerhaft zugänglich und leichter austauschbar zu gestalten.


Um diese über Institutionsgrenzen hinausreichenden Benefits besser nutzen zu können, wurden von W3C (World Wide Web Consortium) und anderen bereits grundlegende Systeme entwickelt, die für Projekte jeder Institution zur Verfügung stehen. So kann mit Text-Mining-Verfahren beispielsweise die Aufbereitung bereits digitalisierter Texte automatisiert werden. Jedoch ist die komplizierte semantische Aufbereitung von nicht-textuellen Digitalisaten als ein Grund dafür anzusehen, dass diese im täglichen Geschäft gerade von Kulturinstitutionen ohne zusätzliches Budget noch nicht angekommen ist. Zudem mangelt es trotz der Arbeit des W3C noch vielfach an einheitlichen Thesauri für viele Fachbereiche. Hier können die Erfahrungen und das Fachwissen von Kultureinrichtungen viel zur künftigen Entwicklung beitragen.


Nutzbar ist semantische Aufbereitung auch für die Bereiche Marketing und Medien, die oft eng miteinander einhergehen. Dank Semantik können hier auch Bilder und Videos inhaltlich erschlossen werden. Dies ist für jede Kulturinstitution interessant, die neben Pressemitteilungen auch Videos oder Fotos für Ausstellungen oder Marketing und PR benutzt. Wenn diese nicht nur über den Namen des Bildes oder Videos in eine Datenbank überführt, sondern auch strukturell Ausstellungen, Aufführungen oder Publikationen zugeordnet werden können, erhöht sich ihre Nutzbarkeit und auch Auffindbarkeit im Netz. Beispielhaft präsentierte Felix Daub von Klickfilm die Verknüpfung von Videos und Werbung durch semantische Querverlinkungen zwischen den Inhalten des Videos und zugehörigen Produkten, Onlineshops oder Websites. Dies können Bücher ebenso sein, wie Sehenswürdigkeiten, Institutionen, Kunst oder historischer Background, mit denen interessierte Kunden angesprochen werden können, ohne auf Direktwerbung zurückgreifen zu müssen. Auch die Auffindbarkeit entsprechender Marketing-Materialien, wie sie Rolf Fricke von der Condat AG in Form des Mediamixers vorstellte, kann in diesen Bereich gehören. Nutzbar ist dies für Nachrichtenformate oder auch für Marken- und Konkurrenzanalysen über die Tonalität der untersuchten Inhalte. Auch dafür ist wiederum eine Vereinheitlichung der Metadaten notwendig.


Interessant ist gerade für das Marketing im Bereich Kultur auch eine semantische Website, wie sie Dr. Thomas Hoppe von der Ontonym GmbH in der Theorie und Armin Berger von 3pc GmbH - Neue Kommunikation in der Praxis präsentierten. Hierbei werden die Inhalte über Schlagworte und Kontexte in Erzählsträngen dargestellt und dem Besucher die Möglichkeit gegeben, diese je nach den eigenen Interessen selbst zu erforschen. Dieses sogenannte Storytelling eignet sich für Kulturinstitutionen im Besonderen, die damit ihre eigene Geschichte ebenso wie die Hintergründe einzelner Ausstellungen, Stücke oder Werke anschaulich umsetzen können. Zugleich können mit semantischen Erzählweisen für Webseiten oder auch Apps mehrdimensionale Datenstrukturierungen anschaulich gemacht und Zusammenhänge über mehrere Punkte erklärt werden. Diese Möglichkeiten sind aber noch in der Entwicklung begriffen und vor allem in Bezug auf die zugrunde liegenden Abstraktions- und Strukturierungsmodelle der Daten sowie auf dynamische, regelmäßige befüllte Webseiten noch nicht gänzlich ausgereift. Insgesamt machte die Tagung die Nutzungsmöglichkeiten des Semantic Web für Kultur- und Medienunternehmen zwar deutlich, zeigte aber auch die noch vielfach bestehenden Probleme auf. Dies liegen derzeit primär in der Entwicklung von einheitlichen Hierarchien und Begrifflichkeiten sowie der daran geknüpften automatisierten Aufbereitung semantischer Daten und Verknüpfung der Projekte einzelner Institutionen. Deutlich wurde dies auch an den Teilnehmern und Diskussionen, die sich vorrangig mit Computerlinguistik und Programmierung beschäftigten und den schwierigen Zugang zur Anwendbarkeit des Themas aufzeigten. Gerade in Kombination mit den sozialen und kommunikativen Ansprüchen des Web 2.0 - die Kommunikation mit Kunden und Besuchern, neue Möglichkeiten der Kulturvermittlung und auch SEO - bietet Semantik für die tägliche Arbeit von Kulturinstitutionen viele Vorteile, denen man sich für künftige Vorhaben nicht verschließen sollte.


Das gesamte Programm und die Referenten finden Sie auf der Website des Innovationsforum Semantic Web.

Zum Original