apa.at
blog / Freitag 26.03.21

Wie aus Daten lokale Geschichten werden: ein Blick auf das Projekt „Wiener Dateng’schichten“

Mit „Wiener Dateng’schichten“ will die APA – Austria Presse Agentur automatisch generierte, journalistische Texte aus statistischen Daten der Stadt Wien liefern.
Giorgio Fochesato / Westend61 / picturedesk.com

Dank Open Data Österreich ist bereits eine große Menge an Landes-Statistiken öffentlich verfügbar, die – stark vereinfacht ausgedrückt – mittels NLG (Natural Language Generation)-Software in Bezirks- und Grätzl-Stories umgewandelt werden. Und das in einer Vielzahl und Aktualität, die die APA bisher nicht liefern konnte. Die Software soll Arbeitserleichterung für Journalistinnen und Journalisten bringen, die trockene Daten in die immer gleiche Texte verpacken müssen.

Ein Projekt mit Potenzial

Laut Projektleiterin Katharina Schell (Mitglied der APA-Chefredaktion) steigt das Nachrichteninteresse in Österreich kontinuierlich. Das Projekt zielt auf diese verstärkte Nachfrage ab, macht sich die emotionale Bindung der Menschen zu ihrer Nachbarschaft zunutze und setzt das Potenzial für Abnehmermärkte sowie Data Storytelling optimal ein.

Aus Daten werden Texte

Die öffentlich verfügbaren Daten werden aus dem Web extrahiert („gescraped“) und so aufbereitet, dass sie für die Verarbeitung durch die NLG-Software geeignet sind. Der größte gemeinsame Nenner an Quellen ist hier data.gv.at, der zentrale Katalog für öffentlich verfügbare Verwaltungsdaten in Österreich. Aus über 32.000 Datensätzen von über 1.280 Organisationen entstand ein umfassender Datenstrom mit verschiedenen thematischen Zuordnungen. Aus dieser riesigen Datenmenge wurden drei Themencluster definiert, die potenziell regelmäßig interessante Stories liefern und laufend aktuell sind: Tiere, Verkehr und Natur.

Content-Design und -Produktion der „Wiener Dateng’schichten“

Aktuell wird am Design der Texte gearbeitet, wobei auch Format und Tonalität festgelegt werden, bevor es in die tatsächliche Textproduktion geht. Bereits hier kommt die NLG-Software zum Einsatz.

Starkes Zusammenspiel von Mensch und Maschine

In der APA-Redaktion wird für die Erstellung von Automated Content die Software AX Semantics bereits erfolgreich eingesetzt. Das Programm verarbeitet strukturierte Daten per Knopfdruck zu Texten. Von Roboterjournalismus kann aber nicht die Rede sein: Die Redakteurin bzw. der Redakteur muss eine Art Lückentext für das Tool erstellen und alle Eventualitäten im Text vorhersehen (z.B. Ausnahmen und Unregelmäßigkeiten), damit das Tool „dazulernen“ kann. Dieses Training der Software wird neben dem Storytelling in Menschenhand bleiben, die Verarbeitung großer Datenmengen wird aber vom Programm unterstützt.

Und so geht es weiter

In den kommenden Monaten wird sich das Projektteam weiter der Produktion von automatisierten Texten und Data Storytelling widmen und mehrere Piloten entwickeln, die mit ausgewählten Testkunden überprüft werden.

Ende 2021 sollen mit einem fertigen Produktdesign regelmäßig „Wiener Dateng’schichten“ ausgeliefert werden.

Hinweis: Das Projekt wird von der Stadt Wien initiierten Förderschiene „Wiener Medieninitiative“ unterstützt.