Data dictionary en business glossery - ICTinformatiecentrum.nl

Data dictionary en business glossery

Een data dictionary bevat informatie over data. Deze betreft bijvoorbeeld de relatie die data heeft met andere data, de betekenis van die data, de herkomst ervan, de indeling of het gebruik. Een data dictionary zorgt voor de centrale opslag van deze informatie. Met een dictionary (letterlijk: woordenboek) wordt het gemakkelijker om over de definities en inhoud van data te communiceren. Het gebruik, verzamelen en opslaan van data verbetert hierdoor. Lees hier over de toegevoegde waarde van een data dictionary voor uw organisatie en u hoe deze u helpt om meer datagedreven te worden.

Wie kan u helpen?
Vind hier oplossingen en leveranciers.

 

“Een data dictionary zorgt voor nauwkeurigheid en consistentie in het gebruik van data”

 

Bij het omzetten van data in meerdere formaten is het nodig om te weten hoe deze data is opgebouwd, wat deze betekent en hoe u de data kunt gebruiken. Als dit een probleem is, bestaat de oplossing uit drie onderdelen:

  • Maak een data dictionary om uw data te rubriceren en te beschrijven.
  • Stel een business glossary samen om uw bedrijfsterminologie te definiëren.
  • Voeg beide samen, zodat u over goede data kunt beschikken voor analyses en rapportages.

Wat is een data dictionary?

Een data dictionary bevat gedetailleerde informatie over uw bedrijfsdata. Het definieert de gegevenstypen (zoals tekst, gehele of gebroken getallen, tijd en datum) en legt de relaties daartussen uit. Hierbij worden beschrijvingen van elk attribuut in uw datamodel (zie ook data modeling) gerubriceerd. Door een gemeenschappelijke vocabulaire te ontwikkelen voor de communicatie over data in uw organisatie, voorkomt u dat belangrijke aan data gekoppelde acties verloren gaan bij de vertaling ervan.

Een data dictionary wordt hierdoor de basis voor nauwkeurigheid en consistentie in technische documentatie, communicatie over projecten, systeemanalyse, data-integratie en besluitvorming. U voorkomt miscommunicatie en tijdverspilling en bevordert werkrelaties en bedrijfsresultaten.

Door het ordenen van informatie over data en zeker als die data op meerdere locaties is verspreid, stelt een data dictionary u in staat om één ‘bron van de waarheid’ te creëren. Deze duidelijkheid vergemakkelijkt het werk van analisten, omdat zij beter kunnen begrijpen wat er in uw onderliggende databases staat, zonder in elk onderdeel daarvan te hoeven graven. Vaak is dat erg tijdrovend en is de kans op fouten groot.

 

“Spreadsheets zijn bruikbaar als data dictionary, maar hebben beperkingen”

 

Data dictionary opzetten

Een gemakkelijke manier om een data dictionary op te zetten is het maken van een spreadsheet. U maakt dan van elk attribuut (veld) in uw datamodel een rij en wijst elke kolom toe aan data die nuttig is om te weten over die attributen. Voorbeelden zijn:

  • Attribuutnaam – Identificeert het kenmerk op unieke wijze, normaal gesproken in de voertaal van de organisatie.
  • Optioneel/vereist – Laat zien of een attribuut specifieke informatie nodig heeft voordat het opgeslagen kan worden.
  • Attribuuttype – Bevestigt welke datatypen zijn toegestaan voor elk attribuut (bijvoorbeeld hele getallen, tekst, tijd en datum).
  • Informatiebron – Bronreferentie voor de informatie is toegevoegd over elk attribuut.
  • Attribuutlocatie – Bronlocatie voor de attributen binnen de database van uw organisatie.

Een spreadsheet kan dus een begin zijn van een data dictionary, maar heeft ook beperkingen. Zo is het moeilijk om samen te werken in een spreadsheet en het is lastig om ervoor te zorgen dat deze de actuele versie van uw doorlopend veranderende datamodel goed representeert.

Wat is een business glossary?

Een business glossary definieert uw zakelijke terminologie en zorgt er daarmee voor dat iedereen binnen uw organisatie hetzelfde bedoelt wanneer zij zakelijke termen gebruiken. Het ene team kan bijvoorbeeld ‘klantgegevens’ met een B2B-focus interpreteren als de bedrijfsnaam of het KVK-nummer van een organisatie. Een ander team zou ‘klantgegevens’ kunnen interpreteren vanuit een B2C-hoek, zoals de gebruikersnaam, het wachtwoord en bankrekening van een persoon. Dergelijke problemen kunnen zich gemakkelijk voordoen als verschillende teams het begrip ‘klant’ anders interpreteren.

Een business glossary zorgt ervoor dat dit niet gebeurt. De glossary voorkomt verkeerde interpretaties, zorgt voor nauwkeurige analyses en kan de samenwerking tussen uw medewerkers bevorderen. Daarnaast is deze ook essentieel voor databeheer en de naleving van regelgeving (compliance). De business glossery ondersteunt zodoende het verzamelen, verwerken en rapporteren van uw data op een coherente en uitgebreide manier.

 

“Om datagedreven te kunnen werken en is nauwkeurige en bruikbare data essentieel”

 

Business glossary opzetten

Een spreadsheet is een praktisch tool voor het samenstellen van uw business glossary. Door uw business terminologie naast hun definities op te sommen, genereert u een gedeeld vocabulaire dat het denken en de communicatie binnen de gehele organisatie op één lijn houdt.

Samenbrengen data dictionary en business glossary

Om datagedreven te kunnen werken en is nauwkeurige en bruikbare data essentieel. Om dit te kunnen bereiken moeten uw data dictionary met uw business glossary worden samengevoegd.

Medewerkers op hoog niveau in de organisatie zijn meestal niet erg bekend met de technische ins en outs van de datasets. Datagedreven besluitvorming betekent echter dat zij het totale databeeld correct moeten kunnen interpreteren. Een data dictionary helpt daarbij. Voor ontwikkelaars is dat juist omgekeerd. Om de tabellen, kolommen en functies waarmee zij werken een context te geven, moeten zij de bedrijfsprocessen erachter kunnen begrijpen. Een business glossary stelt hen daartoe in staat. Daartussen zitten bedrijfsanalisten die werken met de entiteiten en relaties tussen bedrijfsprocessen. De combinatie van data dictionary en de business glossary creëert een dynamische link tussen businessdata en -ontwikkeling. Die verbinding is noodzakelijk om als organisatie echt datagedreven te kunnen werken.

Een voorbeeld uit de luchtvaartindustrie zal dit verduidelijken. Bij het analyseren van een log met vluchtstatistieken, kan de kolom ‘vluchten’ gebroken getallen bevatten. Dat is vreemd, want hoe kunnen 1,5 vluchten plaatsvinden? Op basis van logica kan een ontwikkelaar of analist dan uitgaan van een fout in het datamodel. Een business glossary kan verklaren dat met ‘één vlucht’ één aankomst en één vertrek met hetzelfde vliegtuig in een periode van 24 uur wordt bedoeld. Een halve vlucht betekent alleen een aankomst of een vertrek. Een data dictionary kan de mogelijkheid van gebroken getallen voor dat attribuut bevestigen. Verwijzingen naar de relevantie secties in zowel de data dictionary als de data glossary, verduidelijken dan direct de betekenissen. Als er afwijkingen zijn, kunnen deze snel worden opgelost.

 

“Ook voor data compliance is de combinatie van een data dictionary en business glossary belangrijk”

 

Toekomst van data dictionary en business glossary

Bij steeds meer organisaties werken medewerkers decentraal en op afstand. Daarnaast wordt data steeds belangrijker en staat het centraal in steeds meer bedrijfsprocessen. Beide ontwikkelingen maken het voor organisaties steeds noodzakelijker om hun data te structureren en te begrijpen, met het doel er effectief over te kunnen communiceren. Een goedwerkende combinatie van data dictionary en business glossary helpt daarbij en wordt steeds belangrijker.

Ook voor de naleving van steeds strengere privacyregels, zoals in de AVG is vastgelegd, is de combinatie van een data dictionary en business glossary van belang. Met een data dictionary kan elk onderdeel in het datamodel worden geclassificeerd als AVG-gevoelig of niet. Hierdoor kan de juiste beveiliging voor het attribuut in de database worden ingesteld. De business glossary zorgt ervoor dat iedereen in de organisatie de wie, waar en hoe van de bedrijfsprocessen kan verifiëren, zodat data op de beste en meeste veilige manier gedeeld kan worden. De combinatie van dictionary en glossary is daarmee de snelste route naar data compliance (het voldoen aan wettelijke bepalingen en regelgeving). Hiermee wordt aan een belangrijke voorwaarde voldaan om een datagedreven organisatie te worden.

Meer weten? Kijk welke oplossingen en leveranciers u kunnen helpen en gebruik de informatie van de DATA kennisbank

Bron: Cohelion, kennispartner van het ICT informatiecentrum en specialist voor dit thema.