Jakość danych
Zbiór cech determinujących przydatność danych do celów analitycznych i decyzyjnych — kompletność, spójność, aktualność i dokładność.
Wymiary jakości danych
Jakość danych opisywana jest zwykle za pomocą kilku wymiarów: kompletności (czy zbiór zawiera wszystkie wymagane pola), spójności (czy dane nie zawierają sprzeczności wewnętrznych), aktualności (czy dane odzwierciedlają stan bieżący) oraz dokładności (czy wartości są zgodne ze stanem faktycznym).
Kompletność i spójność
Brakujące wartości lub niespójności pomiędzy różnymi źródłami danych mogą prowadzić do błędnych wniosków, nawet jeśli metody analityczne zastosowane do przetworzenia danych są poprawne.
Przyczyny niskiej jakości danych
Niska jakość danych wynika najczęściej z błędów podczas wprowadzania danych ręcznie, braku standaryzacji formatów pomiędzy systemami oraz braku regularnych procesów weryfikacji i czyszczenia danych.
Ocena jakości danych
Organizacje stosują różne metody oceny jakości danych, od prostych list kontrolnych po zautomatyzowane reguły walidacyjne wbudowane w systemy przetwarzania danych. Wybór metody zależy od skali i krytyczności danych dla procesów decyzyjnych.
Znaczenie dla decyzji
Jakość danych wejściowych bezpośrednio wpływa na wiarygodność wniosków wyciąganych w procesie data-driven decision making. Dane niskiej jakości mogą prowadzić do zjawiska opisanego w haśle Ryzyko błędnej interpretacji danych.