Data in onderzoek

Data zijn voor onderzoekers en auditors een steeds belangrijker hulpmiddel. Doordat de overheid de afgelopen jaren in sterke mate is gedigitaliseerd, zijn er steeds meer data beschikbaar die bruikbaar zijn voor ons onderzoek. Deze digitalisering en bijkomende dataficering zorgt voor nieuwe mogelijkheden én uitdagingen. Dit geldt voor zowel ‘wat’ we onderzoeken als voor ‘hoe’ we onderzoek doen.

Waarom gebruiken we deze methode?

Data stellen ons in staat om andere en meer complexe vragen te beantwoorden. Voor onderzoek naar de besteding van publiek geld is het bovendien vaak noodzakelijk om data te gebruiken, aangezien veel van de benodigde informatie in digitale systemen zit en zonder data-aanpak lastig onderzoekbaar is. Meer gebruik van data in beleid betekent dat data en het gebruik van data door de overheid vaker onderwerp van onderzoek zijn. Daarom onderzoeken we bijvoorbeeld IT-systemen van de overheid, hoe de overheid data beheert en het gebruik van algoritmes door de overheid.

Werken met data vereist specifieke deskundigheid en specifieke voorzieningen. De Algemene Rekenkamer heeft met de Data Hub hiervoor een gespecialiseerd team opgezet. De Data Hub bestaat uit onderzoekers met een overwegend kwantitatieve of statistische achtergrond. Daarnaast investeren we via opleidingen en on-the-job-training organisatiebreed in datavaardigheden.

Wat houdt de methode in?

Een groot deel van ons onderzoek waarbij we werken met data is gebaseerd op meerdere complexe datasets. Dat betekent dat je de volgende datavaardigheden nodig hebt:

  • het identificeren van de juiste databronnen;
  • het opschonen van de data;
  • het analyseren van de data;
  • het visualiseren van de data;
  • rapporteren met data.

Voor ons onderzoek gebruiken we vooral data van de overheid. Deze data kunnen we meestal niet delen omdat we niet de eigenaar zijn van de data. Gegevens die we zelf verzamelen stellen we bij voorkeur beschikbaar als open data (zie bijvoorbeeld: coronarekening.rekenkamer.nl). Door met scripts te werken zorgen we ervoor dat ons werk reproduceerbaar en controleerbaar is. Waar mogelijk delen we deze met externen (zie bijvoorbeeld onze GitLab-pagina).

Wat zijn de resultaten