1 subscription and 3 subscribers
Article

Reine Kopfsache

Generell haben die Challenges der DB mindbox die Aufgabe, für Herausforderungen der DB schnelle, innovative oder unkonventionelle Lösungsansätze zu finden. Die zehn teilnehmenden Teams, darunter auch DB Systel, hatten die Aufgabe, anhand von extra für die Challenge aufbereiteten Musterlösungen einen Algorithmus zu entwickeln, mit dem sich die Schriftfelder der TK-Pläne auslesen und automatisch mit den korrekten Schlagworten versehen lassen. Dank der umfangreichen Vorbereitung mussten sich die Teilnehmer nicht mit Details zur Test-Methodik beschäftigen, sondern konnten sich auf das Kernproblem konzentrieren: dem Erkennen von Inhalten.

Gewonnen hat ein Team vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI), das auf eine Open-Source-Lösung setzte und mit seiner Lösung die besten Resultate beim Auslesen der Planköpfe erreichen konnte. DB Systel landete mit ihrer Lösung auf dem dritten Platz. „Wir können äußerst zufrieden sein", sagt Dr. Feldner. Der Abstand zum Siegerteam, das aufgrund kleiner Kniffe in der Vorverarbeitung gewonnen hat, war sehr gering. Bei den Erkennungsraten der Daten gab es dagegen kaum Unterschiede. „Wir konnten beweisen, dass wir auf diesem Sektor mit der Konkurrenz mithalten können." Diese sah eine Massenverarbeitung der Planköpfe mit einer anwenderfreundlichen Benutzeroberfläche vor, wodurch sich erkannte Texte schnell sichten und bearbeiten lassen. Hier zahlte sich aus, im Konzern seit mehr als zehn Jahren eine Inputplattform im Einsatz zu haben. Deren Funktionen werden für die Verarbeitungsschritte der Digitalisierung modular eingesetzt und kombiniert: Die Plattform erfasst Dokumente aus unterschiedlichen Quellen, erkennt sie automatisch, bewertet sie und gibt sie dann nach Bedarf in unterschiedlichen Formaten aus. Qualitätskontrollen zwischen den Einzelschritten sorgen für einen hohen Grad an Zuverlässigkeit. Mit dem Proof of Concept bei der Digital Header Challenge konnte das Team von DB Systel erproben, wie die Erkennungsraten bei Planköpfen sind.

Erfolgreicher Einsatz einer Standardlösung und Entwicklung eines Prototypen

„Uns waren die Anforderungen jenseits der Challenge bewusst", sagt Dr. Feldner. Sein Team nutzte mit Kofax von Lexmark eine kommerzielle Software, die bereits bei der DB Inputplattform verwendet wird. Diese Lösung erlaubte das Einlesen und Auswerten von formbasierten Dokumenten, wie es die Planköpfe sind. Zusätzlich hat das Team von DB Systel auch maschinelles Lernen eingesetzt. Vor allem aber hatte DB Systel eine Antwort auf Punkte, die außerhalb der Challenge lagen. Die Lösung verfügte über eine Endanwender-taugliche Benutzerführung. Auch Dr. Wolter ist zufrieden: „Unsere Hoffnung hat sich erfüllt: Mit der Challenge haben wir für die DB Netz einen funktionierenden innovativen Ansatz und tolle Gewinner gefunden. Es wurde beschlossen, dass das Gewinnerteam vom DFKI gemeinsam mit DB Systel das Projekt umsetzt."

Original