Hasso-Plattner-Institut

Twitter macht künftig die Berliner S-Bahn schneller

Die Analyse von Tweets soll Zeitverluste für Berliner Fahrgäste minimieren. Häufigster Anlass sind Polizei- und Notarzteinsätze.

Fahrgäste sollen künftig schneller mit der S-Bahn unterwegs sein - dank der Auswertung von Tweets

Fahrgäste sollen künftig schneller mit der S-Bahn unterwegs sein - dank der Auswertung von Tweets

Foto: dpa Picture-Alliance / McPHOTO / picture alliance / blickwinkel/M

Forscher des Potsdamer Hasso-Plattner-Instituts (HPI) arbeiten an einer Software, die jede S-Bahn-Fahrt "smart" machen soll. Künftig sollen Fahrgäste mithilfe der blitzschnellen Auswertung von Twitter-Einträgen schneller an ihr Ziel kommen und sich besser auf Unregelmäßigkeiten einstellen können.

Ziel ist es, Zeitverluste und Unannehmlichkeiten zu vermindern, wenn plötzliche Störungen im Ablauf des öffentlichen Nahverkehrs Reisepläne aus dem Takt zu bringen drohen. Auf der kommenden Hightech-Messe Cebit im März wird das Institut die Softwareanwendung erstmals vorstellen. Sie wird derzeit am Beispiel der Berliner S-Bahn getestet.

Dabei setzt das Institut zur Analyse von aktuellen Betriebsstörungen der S-Bahn seine Technologie für Höchstgeschwindigkeitsdatenbanken beim Kurznachrichtendienst Twitter ein - das sogenannte In-Memory Data Management.

Riesige Datenmengen blitzschnell ausgewertet

Damit können riesige Datenmengen in kürzester Zeit ausgewertet werden, sagte ein Sprecher des Instituts. Aus den Twitter-Einträgen, Tweets genannt, holen die HPI-Wissenschaftler so viele Informationen wie möglich über betroffene Linien und Bahnhöfe heraus, verknüpfen diese und errechnen Prognosen zu wahrscheinlich bevorstehenden Ereignissen.

Die HPI-Software kann zudem jederzeit in Live-Statistiken anzeigen, was die häufigsten Vorfälle sind und zu welchen Tageszeiten welche Ereignisse für welche Linien besonders oft gemeldet werden.

"Nutzt ein Anwender unsere Lösung, wird ihm also sofort klar, wie er sich angesichts der jeweiligen Situation auf die Wahl der Route und des Verkehrsmittels einstellen sollte, um mit möglichst geringem Zeitverlust ans Ziel zu kommen", so der Institutssprecher. Fahrgäste, die sich zwischen zwei gleich lange dauernden S-Bahn-Fahrten entscheiden müssten, könnten dann zum Beispiel diejenige Verbindung wählen, auf der es in der Vergangenheit die wenigsten Verspätungen oder Behinderungen gegeben hat.

Zehntausende S-Bahn-Tweets analysiert

Die Analyse einiger zehntausend Tweets der Berliner S-Bahn in der Zeit seit Mitte 2013 ergab bisher: Gut die Hälfte gibt Hinweise auf Ereignisse im Betriebsablauf. Meistens handelt es sich um Ausfälle oder Verspätungen von Zügen. Am häufigsten genannter Grund ist der "Polizeieinsatz", gefolgt von "Notarzteinsatz".

Die HPI-Wissenschaftler, deren Institut in unmittelbarer Nähe des S-Bahnhofs Griebnitzsee liegt, brachten ihrer Softwareanwendung bei, bei der Erkennung von Stichwörtern auch mit verschiedenen Deklinationsformen, Abkürzungen und Umlautschreibweisen zurecht zu kommen.

Auch Rechtschreibfehler in Tweets werfen die Potsdamer Analyse-Software nicht aus der Bahn, denn sie nutzt die "fuzzy search", die unscharfe Suche. Diese Methode vergleicht zwei Wörter buchstabenweise, berechnet einen Ähnlichkeitswert und beurteilt danach, ob es sich tatsächlich um das relevante Stichwort handelt.

© Berliner Morgenpost 2018 – Alle Rechte vorbehalten.