Data Decisions PL

Jakość danych

Zbiór cech determinujących przydatność danych do celów analitycznych i decyzyjnych — kompletność, spójność, aktualność i dokładność.

Wymiary jakości danych

Jakość danych opisywana jest zwykle za pomocą kilku wymiarów: kompletności (czy zbiór zawiera wszystkie wymagane pola), spójności (czy dane nie zawierają sprzeczności wewnętrznych), aktualności (czy dane odzwierciedlają stan bieżący) oraz dokładności (czy wartości są zgodne ze stanem faktycznym).

Kompletność i spójność

Brakujące wartości lub niespójności pomiędzy różnymi źródłami danych mogą prowadzić do błędnych wniosków, nawet jeśli metody analityczne zastosowane do przetworzenia danych są poprawne.

Przyczyny niskiej jakości danych

Niska jakość danych wynika najczęściej z błędów podczas wprowadzania danych ręcznie, braku standaryzacji formatów pomiędzy systemami oraz braku regularnych procesów weryfikacji i czyszczenia danych.

Ocena jakości danych

Organizacje stosują różne metody oceny jakości danych, od prostych list kontrolnych po zautomatyzowane reguły walidacyjne wbudowane w systemy przetwarzania danych. Wybór metody zależy od skali i krytyczności danych dla procesów decyzyjnych.

Znaczenie dla decyzji

Jakość danych wejściowych bezpośrednio wpływa na wiarygodność wniosków wyciąganych w procesie data-driven decision making. Dane niskiej jakości mogą prowadzić do zjawiska opisanego w haśle Ryzyko błędnej interpretacji danych.