apa.at
blog / Freitag 09.08.24

G39 Agencies Exchange Platform (AEP) – ein Meilenstein in der Nachrichtenbranche

Nachrichtenagenturen müssen zusammenarbeiten, um mit der schnelllebigen Medienwelt Schritt halten zu können. Mit dem G39-Projekt soll die Nachrichtenbranche neu definiert werden.
Uwe Umstätter / Westend61 / picturedesk.com

In einer Ära, in der Nachrichten in Sekundenschnelle um die Welt gehen, ist es unerlässlich, dass nationale Nachrichtenagenturen effizient und kollaborativ arbeiten, um qualitativ hochwertige und aktuelle Informationen zu liefern. Genau hier setzt das G39-Projekt an: Ziel ist es, eine innovative Plattform zu entwickeln, die die Nachrichtenproduktion von elf Agenturen bündelt und mittels Künstlicher Intelligenz (KI) nutzbar macht.

Wer ist überhaupt G39?
Die G39, ursprünglich als Hell Commune im Jahr 1939 gegründet, ist eine Allianz unabhängiger nationaler Nachrichtenagenturen aus den Oslo-Staaten und der Schweiz. Sie entstand als Antwort auf die manipulierte Nachrichtenübermittlung durch internationale Agenturen während der politischen Unruhen der 1930er Jahre und des Zweiten Weltkriegs. Nach dem Krieg, im November 1945, beschlossen die Agenturen, die Vereinigung wieder zu aktivieren, ihr eine formalere Gestalt zu geben und sie nach dem Gründungsjahr Gruppe 39 zu benennen. Die Gruppe, die nun elf Mitglieder zählt, fokussiert sich auf einen einheitlichen Auftritt gegenüber internationalen Agenturen und fördert den Austausch über Themen wie Technologie und Urheberrecht.

Die Herausforderungen einer multilingualen Content-Plattform

Vor diesen komplexen Aufgaben steht die Agencies Exchange Platform (AEP):

Mehrsprachige Verarbeitung und Übersetzung

Die am Projekt beteiligten Nachrichtenagenturen liefern Inhalte in neun verschiedenen Sprachen. Die neue Plattform muss in der Lage sein, diese Inhalte effizient durchsuchbar zu machen und bei Bedarf präzise zu übersetzen. Dies erfordert die Entwicklung fortschrittlicher KI-Modelle, die mit Mehrsprachigkeit umgehen können.

Datenintegration und Metadaten-Management

Um die unterschiedlichen Formate und Standards der Agenturen (z.B. verschiedene Metadaten für die Beschlagwortung von Artikeln) zu vereinheitlichen, müssen die Metadaten im Rahmen der Plattform vereinheitlicht und verwaltet werden. Beispielsweise durch die Nutzung von internationalen Standards wie den IPTC-MediaTopics.

Echtzeit-Suche und -Abruf

Das Ziel der Plattform: Große Mengen an Nachrichteninhalten in Echtzeit durchsuchbar und relevante Informationen schnell abrufbar machen. All das funktioniert nur mit KI-gestützten semantischen Suchtechnologien (den sogenannten Embedding-Modellen). Dabei wird nicht mehr nur nach dem Wortlaut, sondern nach dem konkreten Kontext des Artikels gesucht.

Skalierbarkeit und Infrastruktur

Eine flexible und skalierbare Infrastruktur ist bei der Plattform notwendig, um den wachsenden Anforderungen der Agenturen und der Nachrichtenflut gerecht zu werden. Möglich wird das durch eine leistungsfähige API (Programmierschnittstelle) sowie diverse Speicher- und Suchfunktionen.

 

Die Rolle der Austria Presse Agentur (APA) im G39-Projekt

Wir als APA spielen eine zentrale Rolle im G39-Projekt: Unser Fokus liegt auf der Entwicklung und Lokalisierung von Suchmodellen für eine multilinguale semantische Suche in den gesamten Nachrichteninhalten. Wir gehen dabei anhand von diesen drei Schritten vor:

  • Training: Ein Suchmodell wird für die einzelnen Agenturen in ihrer jeweiligen Sprache trainiert. (bspw. in schwedisch, holländisch, italienisch, deutsch, usw.)
  • Beurteilung: Sobald wir die Modelle ausreichend trainiert haben, evaluieren die jeweiligen Agenturen das Ergebnis. Dabei wird mit einem standardisierten Fragebogen der Unterschied zu einem untrainierten, multilingualen Modell bewertet.
  • Integration: Nachdem alle Schritte erledigt sind und die Agenturen ihr Modell ausgiebig getestet haben, erstellen wir aus allen elf Suchmodellen ein gesamtes, multilingual trainiertes Modell. Der letzte Schritt ist dann die Integration in die Gesamtinfrastruktur der Plattform.

Eine besondere Herausforderung stellt die Minimierung von sprachlichen Bias in den Suchergebnissen dar, um eine ausgewogene Darstellung aller Agenturinhalte zu gewährleisten. Ist das nicht der Fall, können Ergebnisse einzelner Nachrichtenagenturen überrepräsentiert werden, was ein unausgewogenes sowie qualitativ schlechteres Suchergebnis liefert. Mit der G39 Exchange Platform ist eine effiziente und sprachübergreifende Zusammenarbeit möglich, wodurch der Zugang zu qualitativ hochwertigen Nachrichten verbessert wird. Wie die Austria Presse Agentur das gemeinsam mit ihrem Umsetzungspartner Cloudflight bewerkstelligt, erfahren Sie im nächsten Blogbeitrag zu diesem Projekt.

Business Icons
Vorteile der Semantischen Suche gegenüber der Lexikalischen Suche
Kontextverständnis

Semantische Suche erfasst die Bedeutung hinter den Wörtern und Phrasen, wodurch sie relevantere Ergebnisse liefert, die den Kontext der Anfrage berücksichtigen.

Natürliche Sprachanfragen

Sie ermöglicht es Nutzer:innen, Anfragen in natürlicher Sprache zu stellen, ähnlich einer Konversation mit einem Menschen.

Präzision und Relevanz

Durch das Verständnis von Synonymen und thematischen Zusammenhängen kann die semantische Suche präzisere und thematisch relevantere Ergebnisse liefern.

Benutzerintention

Sie ist in der Lage, die Absicht hinter der Suche zu interpretieren, was zu einer verbesserten Benutzererfahrung führt.

Sprachübergreifende Suche

Semantische Suchtechnologien können sprachübergreifend eingesetzt werden, da sie die Bedeutung und nicht die spezifischen Wörter analysieren.