Wij horen het vaker vanuit onze opdrachtgevers: “onze datakwaliteit is nog niet op het niveau dat we zouden willen”. We verzamelen veel data, maar vaak weten we niet exact te benoemen wat datakwaliteit is en wat ervoor nodig is om deze te verbeteren.
Nut en noodzaak van datakwaliteit zijn vaak wel duidelijk, want men wenst de data te gebruiken voor aansturing van de bedrijfsprocessen, het verantwoorden van informatie naar toezichthouders of voor het meten van voortgang op de ondernemingsdoelstellingen. Daarnaast wil men met de data ook voorspellingen kunnen doen om bijvoorbeeld te weten of een product/dienst twee jaar later nog zoveel rendement oplevert als op de dag van vandaag. Op basis van dit soort feitelijke inzichten wil een organisatie vanuit de data een besluit kunnen nemen om haar ondernemingsdoelstellingen voor de langere termijn bij te stellen.
Denk bijvoorbeeld aan mobiele telefonie versus vaste telefonie. Als provider van telecommunicatie is het goed om te weten hoe lang het voor hen nog interessant is om vaste telefonie als product of dienst aan te bieden. Door de steeds goedkoper wordende mobiele abonnementen is het aannemelijk dat de klantbehoefte voor vaste telefonie afneemt. Echter wil je deze aanname niet zomaar opvolgen, maar juist onderbouwen vanuit de data. Om vervolgens vanuit door de data onderbouwde inzichten in dit geval je product strategie bij te stellen.
Voordat we de data naar een hoger kwaliteitsniveau willen brengen is het van belang eerst met elkaar te definiëren wat datakwaliteit is en vervolgens vast te stellen welke elementen van datakwaliteit voor jouw organisatie belangrijk zijn. Als deze basis is gelegd is het zorgdragen voor focus, oftewel het inzichtelijk maken welke data voor de organisatie de grootste toegevoegde waarde en impact heeft, een volgende stap.
Een marketingbureau bijvoorbeeld heeft voor haar marketingcampagne adresgegevens nodig, het is dus van belang dat met name deze adresgegevens actueel, volledig en juist zijn. In het geval dat een organisatie haar financiële jaarcijfers rapporteert, dan zullen met name de financiële gegevens accuraat en volledig moeten zijn.
Een definitie, waar wij ons in kunnen vinden is: de mate waarin de gegevens geschikt zijn voor het doel waarvoor je ze wilt gebruiken. Hoe bepaal je dan die mate en wanneer zijn de gegevens geschikt en toepasbaar voor gebruik voor het doel waarvoor je deze wilt inzetten?
Om dit te bepalen is het goed om te kijken naar de zes criteria waarmee datakwaliteit gemeten kan worden. Dat zijn:
Daarnaast moet de motivatie voor een datakwaliteit-initiatief altijd in de business gezocht worden. Dat is tenslotte ook de plaats waar de toegevoegde waarde moet worden gerealiseerd. Hiervoor is het noodzakelijk om kennis te hebben van de businessprocessen en het businessdomein waarbinnen de data gebruikt wordt. Dit begrip bepaalt voor welke data-elementen kwaliteit echt belangrijk is en wat die kwaliteit dan moet zijn.
Zoals we net al aangaven is het voor elk datakwaliteit-initiatief belangrijk dat er eerst bepaald wordt wat het doel is van het initiatief en voor welke gegevens we het initiatief starten. Door al vroeg te bepalen welke gegevens we belangrijk vinden, kunnen we ons daar specifiek op richten en verdwalen we niet in de zee van gegevens die verzameld worden.
Als we dan de criteria meenemen om te kijken waar we datakwaliteit kunnen verbeteren, zijn er nog een paar tips die we mee kunnen geven.
Allereerst kan het nooit kwaad om de mensen die de data in moeten vullen te ondersteunen met de invoer van data. Het verplicht maken van bepaalde velden die nodig zijn, of het formaat van bepaalde velden van tevoren vaststellen zijn enkele voorbeelden van hoe je preventief kan zorgen dat mensen de juiste en complete data invullen.
Daarnaast kan een interne controle van recent ingevoerde data helpen om te zorgen dat de gegevens accuraat in het systeem komen. Een plus hieraan is dat er dan meteen gecheckt kan worden of deze gegevens niet al eerder in het systeem stonden. Op deze manier voorkom je ook dubbele gegevens.
Naast een controle op recent ingevoerde data is het ook nodig om te zorgen voor continue verbetering van datakwaliteit. Hiervoor kan er bij verschillende personen binnen de organisatie een mate van verantwoordelijkheid belegd worden. Deze personen kunnen het belang van data(kwaliteit) vervolgens ook uitdragen naar de rest van de organisatie. Voorbeelden hiervan zijn het formeren van data-eigenaarschap en het aanstellen van een data steward (medewerker binnen de organisatie die verantwoordelijk is voor de datakwaliteit van (een deel van) de data).
Ook kan het helpen om koppelingen te laten maken tussen systemen, waardoor data consistent in beide systemen terecht komt en ook meteen gekoppeld is aan de juiste bijbehorende data. Hierbij is het wel belangrijk dat je gezamenlijk tot een beslissing komt welk systeem de leidende bron is voor specifieke gegevens.
De laatste tip die we nog mee willen geven is dat de gebruikers binnen je eigen organisatie meegenomen moeten worden in het correct invoeren van de data (bijv. via handleidingen) en de nut en noodzaak van goede datakwaliteit. Op het moment dat datakwaliteit voor je gebruikers ook gaat leven, wordt het bijhouden van de datakwaliteit een gezamenlijk project.
Heb je vragen? Laat het ons weten! Ook kun je altijd vrijblijvend contact met ons opnemen.