Jakość danych i jej wartość w biznesie
16 marca 2023 (Last updated: 20 maja 2024)
Każdej wielkości firma działa w oparciu o dane – czasem “czyste”, wysokiej jakości, czasem “brudne”. Według szacunków, przyjmuje się, że opieranie decyzji przedsiębiorstwa na tych drugich potrafi zmniejszyć przychody o 20% w skali roku[1]. Ma więc biznesowy sens dbać o jakość danych.
Jakość danych – dlaczego jest ważna w biznesie?
Odpowiedź na to pytanie może być szybka i prosta lub długa i skomplikowana.
Szybka i prosta brzmi następująco: jeśli jakość danych w Twojej firmie jest niska, to istnieje wysokie prawdopodobieństwo, że podejmujesz błędne decyzje. To trochę jak z dojechaniem w wyznaczone miejsce w oparciu o błędnie działający GPS – bez jakościowych, poprawnych informacji, cel nie zostanie osiągnięty.
Istnieje też druga, znacznie bardziej skomplikowana odpowiedź a jej problematyczność wynika zarówno z tego, że większość firm nie mierzy kosztów korzystania z nieprawdziwych, niepełnych czy zdezaktualizowanych informacji, jak i z tego, że przedsiębiorstwa działają w oparciu o bardzo różne dane w różnych procesach – wrzucanie wszystkich do jednego worka niesamowicie zamazuje obraz. Istotnymi dla efektywnego prowadzenia biznesu mogą być zarówno kody EAN z naszej bazy danych GS1 Polska, jak i dla przykładu informacje gospodarcze typu numery rejestrowe NIP i KRS, adres firmy czy dane finansowe dostarczane przez profesjonalnych dostawców danych, takich jak Transparent Data. Wartość wysokiej jakości danych należy zatem rozpatrywać przez pryzmat konkretnych przykładów – ile Twoja firma może zyskać a ile stracić.
Dlaczego brudne dane, czyli dane niskiej jakości to potencjalny koszt dla firmy?
Po pierwsze, kosztem może być realna strata pieniędzy z kontraktu. Jako przykład weźmy brak weryfikacji kontrahenta pod kątem potencjalnego ryzyka biznesowego współpracy. Jeśli sprzedasz kontrahentowi towar za 200 tys. zł w oparciu o jego sprawozdanie finansowe z 2010 roku, nie sprawdzając w ogóle wiarygodności informacji o przedsiębiorstwie (w KRS, Wykazie Podatników VAT itp.) to może się okazać, że kontrahent nie zapłaci Ci za towar, bo:
- jego firma nie istnieje (podał fałszywe numery rejestrowe, fałszywy adres firmy)
- nie ma z czego Ci zapłacić (gdybyś zajrzał do ostatniego, najbardziej aktualnego sprawozdania finansowego, to zauważyłbyś w bilansie zysków i strat, że przedsiębiorstwo zakończyło rok na minusie i praktycznie nie ma przychodów, a w MSiG z łatwością sprawdziłbyś, że firma ma otwarte postępowanie upadłościowe).
W tym przykładzie, wysoka jakość danych jest jak polisa ubezpieczeniowa – minimalizuje tzw. ryzyko biznesowe.
Po drugie, kosztem braku wysokiej jakości danych w firmie jest czas – czas Twoich pracowników potrzebny zarówno na zebranie rzetelnych informacji, jak i sprawdzenie czy dane, która posiada organizacja rzeczywiście są aktualne i można na ich podstawie podjąć trafną decyzję. Według jednego z najbardziej rozpoznawalnych sondaży[2] z ostatnich lat, szacuje się, że analitycy danych spędzają ok. 19,2% swojego czasu na zbieraniu danych, a 60% na ich czyszczeniu i przygotowywaniu. Nawet jeżeli Twoja organizacja nie posiada wyspecjalizowanego działu analityki biznesowej, to warto zastanowić się ile swojego czasu poświęcają poszczególne zespoły i pracownicy na takie codzienne, manualne czynności, jak np. wpisywanie danych kontrahentów do CRM czy sprawdzanie czy informacje w systemie są ważne na dany dzień.
Po trzecie, brak czystych, wysokojakościowych danych często spowalnia lub utrudnia cyfryzację firmy. Jak wynika z publikacji The costs of poor data quality[3], 88% wszystkich projektów integracji danych kończy się niepowodzeniem lub znacznie przekracza budżet z powodu niskiej jakości danych, a 33% organizacji opóźniło lub anulowało nowe systemy IT z tego samego powodu.
Jak ocenić jakość danych?
Żeby można było powiedzieć, że dane mają wysoką jakość spełniać one muszą przede wszystkim 3 podstawowe warunki. Muszą być:
- aktualne
- wiarygodne
- i kompletne.
Świetnie to obrazuje przykład weryfikacji kontrahenta, który opisaliśmy wyżej – interesują nas tylko aktualne informacje (z ostatniego sprawozdania finansowego a nie tego sprzed kilku lat), wiarygodne (czyli z rzetelnych źródeł typu oficjalne rejestry handlowe Polski) i kompletne (np. w odpisie KRS może brakować informacji o upadłości, ale jeśli sprawdzimy kontrahenta w różnych źródłach, czyli również w biuletynie MSiG, to od razu trafimy na dane, które ochronią naszą firmę przed współpracą z niewypłacalnym partnerem).
Jak zadbać o wysoką jakość danych w firmie?
Na początku warto zmapować:
- Jakie konkretnie dane w jakich procesach są potrzebne (które działy czego potrzebują);
- Z jakich źródeł danych korzysta Twoja organizacja (czy na pewno z tych wiarygodnych?);
- W jaki sposób dane są gromadzone (ręcznie na podstawie deklaracji klientów, w wyniku manualnego wyszukiwania pracowników czy automatycznie od profesjonalnych dostawców danych);
- Kiedy, jak i czy w ogóle dane są aktualizowane (czy i kto dba o higienę danych).
Na tej podstawie diagnozuje się, które obszary wymagają poprawy i zastanowić się, w jaki sposób można usprawnić zarządzanie danymi w przedsiębiorstwie.
Popularną praktyką dbania o wysoką jakość danych w biznesie jest pozyskiwanie ich od profesjonalnych dostawców – firmy wyspecjalizowane w swoich obszarach. Czynić to można zarówno poprzez automatyzację procesów poprzez API z informacją biznesową, która bezpośrednio zasila firmowy CRM czy inny wewnętrzny system, jak i poprzez regularną aktualizację i higienę baz danych tudzież korzystanie ze sprawdzonych platform danych online.
GS1 Polska również dba o wysoką jakość danych
Nasza organizacja, GS1 Polska, jako jedyny oficjalny podmiot uprawniony do nadawania numerów GTIN , stanowi wiarygodne źródło danych o produktach – nasz katalog jest zawsze aktualny.
Jesteśmy wszak pierwszym źródłem – to my prowadzimy rejestrów numerów GTIN i dbamy o brak duplikatów.
Gdy jednak sami potrzebujemy sprawdzić naszych kontrahentów biznesowych pod kątem innych informacji, pozyskujemy je bezpośrednio od profesjonalnych dostawców, wyspecjalizowanych w swoich branżach. Dla przykładu, regularnie weryfikujemy współpracujące z nami firmy pod kątem prawdziwości zgłaszanych danych.
Niedawno zleciliśmy Transparent Data masową weryfikację kilkunastu tysięcy naszych partnerów pod kątem wiarygodności aktualnych przychodów, które deklarują zamawiając dostęp do Systemu GS1.
Ręczne pobranie takiej ilości sprawozdań finansowych zajęłoby naszym pracownikom minimum kilka tygodni – korzystając z automatycznej usługi, wyniki otrzymaliśmy w niespełna tydzień.
Jaki efekt przyniosły rzetelne, wysokiej jakości dane? Istotny wzrost przychodów.
Dobra, tj. aktualna baza pozwoliła nam zauważyć, iż kilkanaście procent naszych własnych kontrahentów należy zmigrować w wyższe pakiety cennikowe – ich realne przychody z ostatniego roku są bowiem wyższe niż te zadeklarowane.
Brak najlepszych praktyk i zasad może mieć negatywny wpływ na wykorzystanie danych i zarządzanie nimi.
Jeśli w firmie istnieją różne sposoby definiowania, przeglądania i zarządzania danymi – bez żadnych standardów – może to stanowić przeszkodę w dzieleniu się spostrzeżeniami między działami i podejmowaniu decyzji.
Kiedy przychodzi czas na procesy takie jak migracja i integracja danych, standardy te stają się jeszcze bardziej mgliste, co sprawia, że dane są mniej wiarygodne, a ich format i jakość są niespójne. Twój zespół powinien mieć jasne zrozumienie, jak wygląda zarządzanie danymi i jak pracować z danymi, aby spełnić standardy i cele biznesowe.
[1] https://www.ataccama.com/blog/the-cost-of-poor-data-quality#:~:text=There%20are%20many%20ways%20to,or%2020%25%20of%20their%20revenue.
[2] https://www.dataversity.net/survey-shows-data-scientists-spend-time-cleaning-data/#
[3] https://www.researchgate.net/publication/277237089_The_costs_of_poor_data_quality