Database | Uitleg en definitie - ICTinformatiecentrum.nl

Database

  • Wat is een database en hoe gebruikt u deze voor data management?
  • Welke soorten zijn er en hoe beheert u een database?

Databases komen voor rondom alle soorten bedrijfssoftware en een groot deel van de bestaande IT oplossingen. Zodra er met software of IT oplossingen gegevens worden verwerkt en bewaard, is een database noodzakelijk. Deze bevat namelijk de informatie waar de systemen gebruik van maken.

Wat is een database?

Een database is een systeem waar data geordend en overzichtelijk verzameld wordt. Dat gebeurt meestal in omvangrijke tabellen, waardoor informatie snel en via een vaste structuur van kolommen en rijen opgeslagen en teruggevonden kan worden. Door de sterke groei van de hoeveelheid beschikbare data stijgt de vraag naar flexibelere opslagtechnieken die organisaties ook in staat stellen grote hoeveelheden ongestructureerde data op te slaan. Er bestaan daarom meerdere soorten databases. Vanuit een database is informatie snel bruikbaar door het eraan gekoppelde computersysteem.

Voor het definiëren ervan zijn vier aspecten van belang. Zo moet nieuwe informatie makkelijk bewaard kunnen worden (create), de beheerder in staat gesteld worden al bestaande informatie makkelijk te doorzoeken (read) en te onderhouden (update). Tenslotte moet informatie kunnen worden verwijderd (Delete), zonder negatieve operationele gevolgen voor het systeem. Voor het hebben van een betrouwbare en solide database is het noodzakelijk dat alle gegevens correct en eenduidig zijn opgeslagen. Daarnaast mag de inhoud uitsluitend door bevoegden worden uitgebreid, onderhouden of verwijderd.

Ontwikkelingen

De database en de bijbehorende technieken hebben grote ontwikkelingen doorgemaakt sinds de introductie van databases in de jaren zestig. Waar de eerste databases nog erg eenvoudig en statisch waren, zijn deze door de jaren heen steeds groter en flexibeler geworden. Door de snelle ontwikkeling van het internet en de daarbij behorende datastroom, steeg de vraag naar snelle verwerking van grote hoeveelheden, veelal ongestructureerde data. Moderne databases voorzien in die mogelijkheid en onderhouden zichzelf grotendeels autonoom door gebruik te maken van machine learning.

Databases versus datawarehouses en data lakes

Binnen het thema data management zijn er veel termen die op elkaar lijken. De begrippen database, datawarehouse en data lake zijn daarvan voorbeelden. Het betreft alle drie technieken om data op te slaan, maar toch zijn er wezenlijke verschillen. Zo is een database een plaats om geordend informatie op te slaan, meestal gekoppeld aan een separaat IT systeem. Data van verschillende databases van verschillende systemen kunnen worden samengevoegd in een datawarehouse. Met een datawarehouse krijgt u een volledig en eenduidig beeld van uw data. De structuur en omvang van een datawarehouse biedt voordelen bij data analyses, dat u antwoord geeft op businessvraagstukken. Voor de analyses maakt u gebruik van business intelligence tools.

Een data lake werkt anders. Waar databases en datawarehouses gebaseerd zijn op structuur en gestructureerde data, is dat bij een data lake niet het geval. In een data lake worden grote hoeveelheden informatie in ruwe en onbewerkte vorm opgeslagen. De ongestructureerde vorm maakt een data lake zeer geschikt voor data mining en machine learning. Veel organisaties willen de enorme hoeveelheid data die ze genereren en tot hun beschikking hebben ergens opslaan, zonder dat daar direct een doel voor geldt. Over het algemeen geldt hoe meer data, hoe betrouwbaarder analyses worden. In theorie kunt u dus betere managementbeslissingen nemen als u beschikt over meer informatie. Een data lake gebruikt u als opslagmedium voor een enorme hoeveelheid aan data die ogenschijnlijk niet directe waarde heeft.

Soorten databases

Er is een grote variëteit aan oplossingen. Wat de beste keuze voor u is hangt af welk doel uw organisatie ermee heeft. Databases kunnen op verschillende aspecten worden gecategoriseerd. Dat kan op basis de opslagtechniek die ze gebruiken of andere onderscheidende eigenschappen. Enkele van de meest gangbare databasetechnieken worden hieronder kort besproken.

  • Een relationele database (SQL) is opgebouwd uit rijen en kolommen. Het is de meest effectieve vorm voor het opslaan en aanspreken van (grotere hoeveelheden) geordende informatie.
  • In een flat file database worden gegevens in pure tekst opgeslagen, in een soort versimpelde vorm van een relationele database. Omdat het zo simpel is, is het voor geringe uitwisseling van informatie erg doeltreffend. Bij grote hoeveelheden data wordt het al snel onoverzichtelijk.
  • Een objectgeoriënteerde database bestaat uit vaste pakketjes data (objecten). Denk bij een object aan een schematische opsomming van informatie over een onderwerp, zoals accountinformatie van een enkele gebruiker. In dit geval zal het object bijvoorbeeld informatie bevatten, zoals de gebruikersnaam, het e-mailadres en het klantnummer.
  • Een JSON database of documentdatabase slaat in verschillende documenten data in een standaardformaat op. Bij elk document hoort een unieke sleutel, waarmee de data opgeroepen kan worden.
  • Een NoSQL database is een niet-rationele database die ervoor zorgt dat niet- en semi-geordende data samen opgeslagen en verwerkt kunnen worden.
  • Een OLTP database is een database waaruit in een hoog tempo tussen meerdere gebruikers veel informatie-uitwisselingen gedaan kunnen worden. Voorbeelden van zulke uitwisselingen zijn het plaatsen van een bestelling en het versturen van een bericht.
  • Een OLAP database is bedoeld voor analytische doeleinden. Het verzorgt snelle informatie-uitwisselingen tussen verschillende databases en de analysesoftware.
  • Een multi-model database koppelt verschillende databasetechnieken aan elkaar tot één geïntegreerde backend, zodat één informatiebron verschillende datasoorten kan ondersteunen.
  • Een datawarehouse is een centrale verzamel- en verwerkplek voor informatie uit verschillende databases. Het heeft als taak om op een overzichtelijke manier te voorzien in de vraag naar data binnen een organisatie. Een datawarehouse biedt grote voordelen bij het gebruik van business intelligence (BI).

Ook zitten er verschillen in bepaalde vormen van een database, zonder te kijken naar welke opslagmethode er wordt gebruikt. Het gaat dan bijvoorbeeld over de manier waarop de database bereikbaar is of hoe het systeem wordt onderhouden.

  • In een gedistribueerde database staan verschillende bestanden op diverse opslaglocaties. Door via een netwerk computers te verbinden kunnen bestanden uitgewisseld worden. Er is dus niet één centrale plek waar alle data opgeslagen is, maar alle data kan wel vanuit verschillende plekken worden aangesproken.
  • Een cloud database bevindt zich op een externe locatie die via het internet wordt bereikt. Het bevat uw data, maar wordt onderhouden door de cloudaanbieder (DataBase-as-a-Service).
  • Een open source database is een variant waarvan de onderliggende broncodes openbaar zijn. Dit geeft als voordeel dat de databasesoftware naar wens van de gebruiker kan worden aangepast.

Databases kunnen meerdere van bovenstaande benamingen hebben. Zo bestaan er relationele cloud databases (opgebouwd uit rijen en kolommen die door een cloudaanbieder gehost wordt) en open source object georiënteerde databases (databases die werken op basis van pakketjes schematische opsommingen en waarvan de broncode openbaar is).

Wat zijn zelfsturende databases?

Een zelfsturende database beheert zich grotendeels zelf met behulp van machine learning. Het tijdrovende en kostbare routinewerk dat voorheen werd uitgevoerd door een databasebeheerder, wordt hierbij overgenomen door computers. Taken zoals beveiligen, updaten en backups maken zij geautomatiseerd. Zelfsturende databases gaan naar verwachting grote invloed krijgen op de manier waarop organisaties hun informatie exploiteren. Terwijl de kosten afnemen worden de beveiliging en algemene prestaties sterk verbeterd.

Hoe beheert u een database?

Wanneer een database in omvang toeneemt, wordt het steeds moeilijker en duurder om het systeem te beheren. Onderhoud is enorm van belang om prestaties en de betrouwbaarheid van de database te waarborgen. Daarom wordt het beheer en onderhoud van een database gedaan met een database management system (DBMS). Deze geeft de beheerder inzicht in de status van de database. Vanuit een DBMS kunnen onderwerpen zoals beveiliging (security), schadeherstel (recovery), prestatiemonitoring en updates geregeld worden.