Data mining | Wat is het? - ICTinformatiecentrum.nl

Data mining

  • Wat is data mining en hoe helpt het u bij het vinden van verbanden tussen datasets?
  • Hoe vindt en selecteert u de juiste oplossing en de specialist die u daarbij helpt?

Data mining is een specifieke vorm van data analyse en business intelligence. Het richt zich op het zoeken naar verbanden tussen verschillende dataverzamelingen. Door het ‘graven’ in grote datasets kunnen statische verbanden gevonden worden die inzicht geven in de relatie tussen gebeurtenissen, gedragingen of andere meetgegevens. Nadeel kan zijn dat er verbanden worden gelegd die er niet zijn. Voor het proces van data mining zijn diverse softwaretools beschikbaar.

Wat is data mining?

Data mining is het zoeken naar statische verbanden tussen gebeurtenissen, verschijnselen, gedragingen en andere meetgegevens die op het eerste oog niet direct een relatie met elkaar hoeven te hebben. De data hiervoor is opgeslagen in verschillende databases. Via data mining kan bijvoorbeeld door te zoeken naar een relatie tussen weersomstandigheden (database met meetwaarden van het weer) en koopgedrag (database met klant- en aankoopgegevens) een uitspraak gedaan worden over hoe weersomstandigheden van invloed zijn op wat mensen kopen. Profielen en patronen die hieruit volgen kunnen gebruikt worden om te voorspellen wat mensen zullen gaan kopen op basis van de weersverwachting. Juist het kunnen voorspellen en beschrijven van wat systemen of mensen onder bepaalde omstandigheden en situaties doen, is het belangrijkste doel om gebruik te maken van deze technologie.

Toepassingen

Data mining wordt toegepast in een groot aantal werkgebieden. In het bovenstaande voorbeeld ging het om een commerciële toepassing in de detailhandel. Maar het kan ook toegepast worden in alle andere commerciële branches en voor wetenschappelijke, medische, journalistieke, financiële, logistieke, productietechnische, economische of zelf militaire doeleinden. Voorwaarde is in alle gevallen dat de hoeveelheid data waarop de analyse gericht is, groot genoeg is om er een algemene uitspraak over te kunnen doen.

Gevaar van data mining

Bij data mining wordt er dus gezocht naar verbanden in grote hoeveelheden data. Het gevaar bestaat dat er relaties worden gelegd die er niet zijn. Dit kan ontstaan als er een deel van de data niet gezien of bewust genegeerd wordt. Zo kan – in een eenvoudig voorbeeld – een winkelketen willen onderzoeken of het feit dat het buiten donker is van invloed is op het koopgedrag van klanten. Als de analyse gebaseerd wordt op alle tijden op de dag dat het buiten donker is, geeft dat een onjuist beeld. Er wordt dan geen rekening gehouden met het feit dat vanaf ’s avonds laat klanten sowieso niet naar winkels gaan, omdat deze gesloten zijn. De uitspraak had uiteraard gebaseerd moeten zijn op tijden dat het buiten donker is en de winkels open zijn.

Data mining software

Voor het vinden van patronen in data uit verschillende bronnen en het leggen van verbanden daartussen is data mining software beschikbaar. Dankzij speciale zoekmethodes ontdekt deze software de patronen en verbanden. Is het verband eenmaal ontdekt, dan kan daar een model van gemaakt worden. Door nieuwe data met dat model te analyseren kunnen afwijkingen snel gesignaleerd worden. Op basis daarvan kan worden ingegrepen. Voor een goede werking van de software moet voldoende duidelijk zijn wat gewenste en ongewenste conclusies zijn. Ook kennis over de data die in de analyse betrokken wordt, is belangrijk. Duidelijk moet zijn hoe belangrijk die data is en wat de kwaliteit ervan is. Op basis van beschikbare data en welke daarvan met elkaar in verband kan worden gebracht, ontstaat met hulp van de software het model. Door dit model telkens te voeden met nieuwe data, is er doorlopend inzicht in processen en de afwijkingen daarin.

Expertise

Data mining kent een eenvoudig principe, maar een goede implementatie ervan is complex. U zult data analisten nodig hebben om een goede oplossing te kiezen en in uw organisatie te implementeren. Hun ervaring en kennisniveau zal uiteindelijk van invloed zijn op het succes dat u kunt bereiken met data mining.