Artikel

Datakwaliteit en gegevensbeheer

Er is in onze moderne samenleving onmiskenbaar een toenemende informatiebehoefte. Bij iedere belangrijke gebeurtenis worden wij overspoeld met informatie door de diverse media. Deze informatie komt natuurlijk niet zomaar tot stand aangezien er aanzienlijke grote hoeveelheden data (gegevens) voor nodig zijn. Deze data dient echter van goede kwaliteit te zijn om hoge informatieve waarde te bezitten en dient dus daarom goed beheerd te worden. Dit artikel behandelt de mogelijke relatie tussen datakwaliteit en gegevensbeheer.

“Datakwaliteit en Databeheer” zou eigenlijk een betere titel voor dit artikel zijn. De huidige titel suggereert dat er een verschil bestaat tussen data en gegevens, maar in dit artikel ga ik uit van het feit dat beide begrippen hetzelfde betekenen. In de literatuur wordt namelijk vaak het begrip “data” gebruikt als alternatief voor “gegevens”. Het Nederlandse begrip “gegevens” komt veelal overeen met het Engelse “data”. “Data (gegevens) zijn de objectief waarneembare neerslag van feiten of kennis op een bepaald medium, zodanig dat deze uitgewisseld kunnen worden” [1].

Het behandelen van beide begrippen in één artikel suggereert ook een relatie. De vraag is of er daadwerkelijk een relatie bestaat? Een bevestigend antwoord leidt dan direct tot de volgende vraag; wat is dan de relatie? Een ontkennend antwoord leidt ook tot een vraag, namelijk; is het mogelijk om gegevensbeheer goed uit te voeren zonder datakwaliteit? Ik zal beginnen met een duidelijke uitleg van de begrippen datakwaliteit en gegevensbeheer.

Datakwaliteit

“Datakwaliteit is de mate waarin data geschikt is voor het doel waarvoor ze gebruikt wordt” [2]. Een andere definitie is: “Datakwaliteit is de mate waarin het geheel van eigenschappen en kenmerken van de gegevens voldoen aan het doel van het gebruik en de verwachting van de ontvanger” [3].

Beide definities geven aan dat de data geschikt moet zijn als informatiebron voor operationele, tactische en strategische beslissingsprocessen. Dit houdt in dat datakwaliteit gebaseerd moet zijn op het gebruiksdoel. Als men weet dat een databron een bepaald percentage correcte data bevat, zou men kunnen besluiten dat dit voldoende is om op basis van deze gegevens bepaalde conclusies te trekken. Bij datakwaliteit gaat het echter om meer dan de aan- of afwezigheid van fouten.

Nader onderzoek naar een aantal aspecten van datakwaliteit levert het volgende op:

  1. Inhoudelijk moet data voldoen aan actualiteit, compleetheid, correctheid en uniekheid;
  2. Systeemtechnisch dient data te voldoen aan toegankelijkheid, integriteit en performance;
  3. Verder moet data voldoen aan betrouwbaarheid, tijdigheid, onderhoudbaarheid, begrijpbaarheid, bruikbaarheid, controleerbaarheid, relevantie en vertrouwelijkheid.

Gegevensbeheer

Gegevensbeheer is het beheren van het gebruik en de toepassing van de in (informatie)systemen voorkomende gegevens. Hieronder valt ook het actueel houden van datamodellen en doorvoeren van aanpassingen volgens afgesproken procedures en richtlijnen, het zorg dragen voor de toepassing van richtlijnen en modellen bij het projectmatig implementeren en onderhouden van systemen en ten slotte het ontwikkelen, onderhouden en aanscherpen van te hanteren procedures en richtlijnen voor gebruik en beheer van gegevens. Gegevensbeheer is altijd noodzakelijk, maar vooral op het moment dat er veel data is opgeslagen dient hier de nodige aandacht naar uit te gaan.

Op basis van nader onderzoek zijn een aantal aspecten van gegevensbeheer te onderkennen:

  1. Normalisatie: Welke gegevens moet men opslaan en welke niet?
  2. Gegevensstructuur: Op welke wijze selecteren, wijzigen en slaan wij gegevens op?
  3. Datamodel: Hoe zit het met de relatie tussen de entiteiten en hoe wordt data gestructureerd?
  4. Database: In welke DBMS heeft de implementatie plaatsgevonden?
  5. Beveiliging: Wie mag welke gegevens bekijken, wijzigen of verwijderen?
  6. Privacy: Hoe wordt de privacy van de respondenten gewaarborgd?
  7. Gegevensherstel: Hoe kan bij calamiteiten zo snel mogelijk de gegevens hersteld worden?
  8. Verantwoordelijkheid: Wie is de eigenaar van de data en wie is verantwoordelijk voor de data?

Is er een relatie?

Uitgaande van de definities en aspecten van datakwaliteit en gegevensbeheer, lijkt er een relatie tussen de twee begrippen te bestaan. Dit leidt mij direct naar de volgende vraag: wat is dan de relatie? Naar mijn mening is de relatie zichtbaar in de volgende additionele definitie van gegevensbeheer die ik zelf graag hanteer: “Gegevensbeheer is het proces waarmee datakwaliteit aspecten structureel aangepakt wordt.”

Stel dat de relatie tussen gegevensbeheer en datakwaliteit met bovenstaande definitie niet duidelijk aangetoond is, dan leidt dit tot de volgende vraag: is het mogelijk om gegevensbeheer goed uit te voeren zonder datakwaliteit?

Door de aspecten van gegevensbeheer naast de aspec-ten van datakwaliteit te leggen probeer ik het antwoord op bovenstaande vraag te verkrijgen:

  1. Het ontbreken van datanormalisatie kan leiden tot niet-unieke data en foutieve informatie wat gevolgen heeft voor uniekheid en betrouwbaarheid van data;
  2. Het ontbreken van een goede gegevensstructuur kan leiden tot het niet correct kunnen selecteren van de gegevens en het niet op efficiënte wijze kunnen selecteren, opslaan of wijzigen van gegevens. Dit heeft gevolgen voor compleetheid en correctheid van data;
  3. De keuze voor een bepaald datamodel bepaalt hoe de data gestructureerd wordt en dit heeft dus gevolgen voor de systeemtechnische aspecten van datakwaliteit;
  4. Het gebruik van een database waarin beveiliging en privacy geregeld is kan leiden tot accuraatheid, toegankelijkheid, integriteit, onderhoudbaarheid en controleerbaarheid van data;
  5. De aanwezigheid van mogelijkheden voor gegevensherstel kan leiden tot tijdigheid, compleetheid, controleerbaarheid en vertrouwelijkheid van data;
  6. Een goede organisatie rondom gegevensbeheer, eigenaarschap en afstemming van verantwoordelijkheden kan leiden tot betrouwbaarheid, begrijpbaarheid, bruikbaarheid, controleerbaarheid, relevantie en vertrouwelijkheid van data;

Op basis van bovenstaande beweringen is het naar mijn mening bijna onmogelijk om te voldoen aan de eisen van goed gegevensbeheer zonder de aspecten van datakwaliteit in acht te nemen.

Categorie:   
Auteur(s)
afbeelding van leenderthinds
Leendert Hinds
Hints Company B.V. - Applicatie en database specialist

Drs. Leendert R.E. Hinds is als applicatie en database specialist werkzaam bij Hints Company B.V. Hij heeft meer dan 25 jaar ervaring in de ICT als docent, specialist en consultant op het gebied van infrastructuur, applicatie- en database beheer. Tevens is de heer Hinds DGA van Hints company, bestuurslid van de Interexperience, de HP gebruikersvereniging en expert van Computable.

 
Reacties
Jan Hendrik Fleury op dinsdag 21 juni 2011 10:20

Ik sluit aan bij Leendert Hinds dat het bijna onmogelijk is om te voldoen aan de eisen van goed gegevensbeheer zonder de aspecten van datakwaliteit in acht te nemen. Het totaal moet zeer sterk samen met de business worden ingericht en gemanaged op continue basis. Als het probleem, beter gezegd KANS, alleen bij ICT wordt belegd wordt geen optimaal resultaat behaald. Als samen goed wordt opgepakt dan komt elke organisatie echt verder en zal zelfs de waarde van een bedrijf voor klanten, medewerkers en daardoor de financiele waarde stijgen.

Coen Crum op dinsdag 21 juni 2011 22:08

Kan me volledig aansluiten, dataQ blijft een uitdaging.

Nieuwe reactie inzenden

De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.
Indien het niet lukt om een reactie te plaatsen, stuur dan uw reactie naar redactie@xr-magazine.nl.
Alle inzendingen dienen correct, professioneel en beschaafd te zijn. IP-adressen worden gelogd, maar niet gepubliceerd. De redactie van XR Magazine behoudt zich het recht voor om anonieme reacties (niet op naam) of zonder geldig e-mailadres, te verwijderen zonder kennisgeving. Ook reacties waarin commerciële uitingen worden gedaan en/of commerciële producten en diensten worden aangeboden worden door de redactie verwijderd of ontdaan van commerciële uitingen zonder kennisgeving.