Data Decisions PL

Śledzenie pochodzenia danych (data lineage)

Praktyka dokumentowania drogi, jaką dane przechodzą od źródła do momentu wykorzystania w raporcie lub modelu decyzyjnym.

Definicja data lineage

Śledzenie pochodzenia danych (data lineage) to praktyka dokumentowania drogi, jaką dane przechodzą od momentu pozyskania w źródle, przez kolejne etapy przetwarzania, aż do wykorzystania w raporcie lub modelu decyzyjnym.

Znaczenie praktyczne

Znajomość pochodzenia danych pozwala zrozumieć, w jaki sposób powstała konkretna wartość widoczna w raporcie, oraz ułatwia identyfikację źródła błędu w przypadku wykrycia nieprawidłowości w danych wykorzystywanych do decyzji.

Audyt procesów decyzyjnych

W organizacjach z rozbudowanym governance analityki dokumentacja data lineage stanowi podstawę audytu procesów decyzyjnych opartych na danych.

Sposoby dokumentowania

Dokumentowanie pochodzenia danych może odbywać się ręcznie, za pomocą opisowej dokumentacji procesów, lub automatycznie, przy wykorzystaniu narzędzi rejestrujących przepływ danych pomiędzy systemami.

Powiązanie z jakością danych

Śledzenie pochodzenia danych jest ściśle powiązane z zagadnieniem jakości danych — znajomość źródła i historii przetwarzania danych ułatwia ocenę ich wiarygodności przed wykorzystaniem w procesie decyzyjnym.