• Software vom Plattner-Institut errechnet S-Bahn-Störungen: Wahrscheinlichkeiten

Software vom Plattner-Institut errechnet S-Bahn-Störungen : Wahrscheinlichkeiten

Mit dem „S-Bahn-Analyzer“ haben Studenten des Potsdamer Hasso-Plattner-Instituts eine Software entwickelt, die Twitternachrichten der Berliner S-Bahn auswertet. Das könnte auch den Fahrgästen helfen.

Eine neue Software des Hasso-Plattner-Instituts kann die Wahrscheinlichkeit für eine Störung auf einer bestimmten S-Bahn-Strecke berechnen.
Eine neue Software des Hasso-Plattner-Instituts kann die Wahrscheinlichkeit für eine Störung auf einer bestimmten S-Bahn-Strecke...Foto: Johanna Bergmann

Potsdam - Eigentlich sollte es nur ein Übungsbeispiel für die Studenten des Potsdamer Hasso-Plattner-Instituts werden. Um ihnen beizubringen, wie man von Menschen geschriebene Texte in computerverständliche Informationen übersetzen kann, legte HPI-Wissenschaftler Matthieu-P. Schapranow seinen Studenten Twitter-Nachrichten vor. Und zwar solche, die den täglichen Uni-Weg der meisten Studenten betreffen, nämlich die Tweets der Berliner S-Bahn. Doch was als Übungsbeispiel begann, könnte nun ganz konkreten Nutzen für alle S-Bahnfahrer haben. Denn der „S-Bahn-Analyzer“ könnte dabei helfen, so manche Schwachstelle im öffentlichen Nahverkehr auszumerzen.

Schapranow forscht eigentlich auf dem Gebiet der Lebenswissenschaften und entwickelt Softwaresysteme, mit dem Daten im Gesundheitswesen in Echtzeit ausgewertet werden können, zum Beispiel Arztbriefe. Doch Arztbriefe kann er seinen Studenten schlecht als Übungsmaterial geben – Stichwort ärztliche Schweigepflicht. So kam der 33-Jährige, der selbst mit der S-Bahn von Berlin nach Babelsberg pendelt, auf die Idee mit den S-Bahn-Tweets.

Die Forscher legten eine Art Wörterbuch mit allen S-Bahn-Stationen an

Schon seit einigen Jahren versorgt die S-Bahn ihre Fahrgäste über Twitter mit aktuellen Meldungen zu Störungen und Fahrplanänderungen. „#S41;#S42: Wegen eines Notarzteinsatzes ist der Zugverkehr zw. #Westend und #Wedding zur Zeit unterbrochen“, lautet so ein Tweet an einem Montagmittag zum Beispiel. Mit der vom HPI-Team entwickelten Software können diese Kurznachrichten nun automatisch analysiert werden.

Zum einen legten die Nachwuchsforscher dafür eine Art Wörterbuch an, etwa mit den Namen der S-Bahn-Stationen – kommt einer davon in einem Tweet vor, wird er sofort erkannt, auch wenn Buchstabendreher oder kleinere Rechtschreibfehler enthalten sind. Außerdem haben die Wissenschaftler der Software bestimmte Regeln beigebracht. Zum Beispiel jene, dass nach Wörtern wie „wegen“, „auf Grund“ oder „nach“ die Ursache der Störung folgt. So kann die Software erfassen, wann es wo zu welcher Störung kommt. Basierend auf der Historie von sogenannten Ereignissen lässt sich daraus auch prognostizieren, wie lange ein solches Ereignis – also zum Beispiel eine Sperrung – aller Wahrscheinlichkeit nach dauern wird.

Polizeieinsätze sind die Ursache Nummer eins für Störungen

Seit Mitte 2013 werden die Kurztexte bereits gesammelt, Schapranow und seine Studenten können also schon eine ganz ordentliche Datenmenge vorweisen. Aufschlussreiche Grafiken lassen sich damit erstellen, zum Beispiel über die häufigsten Störungsursachen in den vergangenen zweieinhalb Jahren. Auf Platz eins landet hierbei der Polizeieinsatz, auf Platz zwei der Notarzteinsatz. Erst auf Platz drei taucht die technische Störung auf. Ebenfalls interessant: Die meisten Störungen treten zwischen 15 und 16 Uhr auf, also nicht, wie mancher vermuten würde, während der Rush-Hour.

Für den einzelnen S-Bahnfahrer wird es hingegen an anderer Stelle interessant: Nämlich dort, wo die Software blitzschnell Alternativrouten ausrechnet oder die Wahrscheinlichkeit für eine Störung auf einer bestimmten Strecke berechnet. In der Theorie könnten beim Routenplaner im Internet künftig also nicht mehr nur die Fahrtdauer und die Umsteigemöglichkeiten, sondern auch die Wahrscheinlichkeit einer Störung auftauchen. Im Zweifel könnten sich Fahrgäste dann für die etwas längere, aber zuverlässigere Route entscheiden.

Eine neue App soll der S-Bahn-Analyzer nicht werden

In der Theorie. Denn bislang gibt es für Fahrgäste noch keinen Zugang zum „S-Bahn-Analyzer“. Als solches wird er auch gar nicht auf den Markt kommen, sagt Schapranow. „Wir wollen nicht die x-te App entwickeln, sondern hoffen eher auf eine Integration der Daten in bestehende Systeme.“ Mit der S-Bahn gebe es bereits Gespräche, diese sei sehr an den Forschungsergebnissen interessiert. Zwar würden schon jetzt alle möglichen Daten bei der S-Bahn erfasst – zum Beispiel für jeden Zug die Ist- und Soll-Ankunftszeit. Mit den HPI-Forschungsergebnissen könnten Schwachstellen aber noch gezielter und schneller erfasst werden – so lässt sich mit dem Programm zum Beispiel auch eine interaktive Karte mit den aufgetretenen Störungen über einen bestimmten Zeitraum anzeigen. So könnte sich etwa herausstellen, dass ein bestimmter Streckenabschnitt oder ein bestimmter Zug häufiger als andere betroffen ist – und im Idealfall frühzeitig Abhilfe geschaffen werden. Erst recht, wenn der „S-Bahn-Analyzer“ nicht nur mit Twitter-Meldungen, sondern mit den detaillierten Daten der Deutschen Bahn gefüttert wird.

Die Studenten am HPI haben von ihrer Datenanalyse selbst übrigens herzlich wenig: Denn vom Bahnhof Griebnitzsee aus gibt es praktisch keine Ausweichroute nach Berlin. Gibt es hier eine Störung, heißt es also warten. Wahrscheinlichkeit hin oder her.