direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Inhalt des Dokuments

ProvDS - Uncertain Provenance Management over Incomplete & Heterogeneous Linked Stream Data

ProvDS
Laufzeit
01.01.2018-31.12.2020
Förderprogramm
DFG D-A-CH

In heterogenen Umgebungen werden Operationen an Daten von mehreren und verschiedenen unkoordinierten Teilnehmern (z. B. Produzenten, Prozessoren, Konsumenten) durchgeführt, von denen jeder Fehler verbreitet und einführt.
Diese Fehler führen zu einer Unsicherheit des Prozesses, die weiter verstärkt wird, wenn viele Datenquellen kombiniert und Fehler über eine Vielzahl von Akteuren verteilt werden. Die Fähigkeit zu erkennen, wie solche Fehler die Ergebnisse beeinflussen, ist entscheidend, um die Qualität der Ergebnisse zu beurteilen und so das Vertrauen der Benutzer zu gewinnen. Das Problem der Fehlerausbreitung wird im Bereich des Internets der Dinge, einer mehrstufigen
heterogenen Plattform, auf der viele Teilnehmer Daten verbreiten, noch verschärft.

In einer solchen Plattform hat keiner der Teilnehmer einen vollständigen Überblick über die Verbreitung von Daten. Genauer gesagt gibt es in keiner der Ausbreitungsstufen ein vollständiges Wissen darüber, wie ein bestimmtes Datenstück erzeugt wird, wie es verarbeitet wird oder wie die Ergebnisse abgeleitet werden. Um das Benutzervertrauen auf der Plattform zu erhöhen, werden wir in diesem Projekt Methoden entwickeln, um den gesamten Prozessablauf zu verstehen, d.h. wie Ergebnisse von Datenquellen, Kuration, Wiederherstellung, Zwischenverarbeitung bis zu einem Endpunkt der Ausgabe abgeleitet werden. Wir schlagen vor, eine Provenance-Spur der Ergebnisse zu finden, d.h. Informationen darüber, wie sich Daten zur Ableitung der Ergebnisse verbreiten. Wir werden es ermöglichen, genau zu bestimmen, wie bestimmte Daten die Ergebnisse beeinflussen, wodurch Transparenz geschaffen wird und das Vertrauen der Benutzer steigt.

Auf technischer Ebene werden wir Methoden zur Verwaltung unsicherer Herkunft über unvollständige und heterogene Linked Stream-Daten untersuchen. Genauer gesagt wird das ProvDS-Projekt Provenance- und Recovery-bewusste Datenmanagementtechniken einführen. Im Gegensatz zu traditionellen Provenance-Management-Techniken, die auf vollständige und statische Daten angewendet werden, konzentriert sich die folgende Forschungsagenda auf dynamische
und unvollständige heterogene Daten. Die Genauigkeit und Effizienz der entwickelten Techniken wird unter Verwendung von offenen Linked-Data-Sammlungen und offenen Sammlungen von Zeitreihen, die heterogene unstrukturierte Daten enthalten, evaluiert und getestet.

Zusatzinformationen / Extras

Direktzugang

Schnellnavigation zur Seite über Nummerneingabe