Naar Synthetische data aanvragen

Synthetische data aanvragen

Onderzoek doen naar het onderwijssysteem en de onderwijsvolgers in Nederland? Vraag synthetische data aan.

Wilt u synthetische data aanvragen? Vul dan het aanvraagformulier en de leveringsovereenkomst in en mail deze naar informatieproducten@duo.nl. Er zijn geen kosten voor het aanvragen en leveren van synthetische data.

Heeft u vragen of bent u niet zeker over de (onderzoek)vraag? We denken graag met u mee. Stuur uw mail naar informatieproducten@duo.nl.

Wat is synthetische data?

Synthetische data gebruikt echte gegevens als basis en neemt de patronen over. DUO kan u synthetische data sturen gebaseerd op registerdata. Het is een realistische en betrouwbare versie van data. De informatie hiervan is onherkenbaar en niet te herleiden naar bijvoorbeeld specifieke leerlingen. Het aanvragen van synthetische data gaat daarom sneller dan originele gegevens (door privacywetgeving).

Waar kunt u synthetische data voor gebruiken?
Synthetische data van DUO kunt u gebruiken voor statistisch onderzoek met data over de onderwijsvolgers binnen het Nederlandse systeem. Wij hebben data van leerlingen uit het primair onderwijs tot en met het hoger onderwijs. Het gaat onder meer om:
  • achtergrondkenmerken van de leerlingen; 
  • gegevens over leerprestaties; 
  • algemene persoonsgegevens en onderwijslocaties op alle niveaus;
  • eindtoetsscores in het po;
  • profiel, richting en examengemiddeldes in het vo;
  • studies in het mbo en ho, enzovoort. 
De statistische verbanden uit de echte data bootsen we zo goed mogelijk na in de synthetische data. Afhankelijk van toegepaste methodes kunnen gevonden effecten wel afwijken. Daarom bieden wij aan om de resultaten op de echte data te controleren. Hierdoor loopt u geen risico op ongeldige onderzoeksresultaten.
Zijn er beperkingen?

Afhankelijk van het onderzoek kunnen er beperkingen aan de synthetische dataset zijn. Het is niet voor elke onderzoeksvraag mogelijk om een synthetische dataset aan te vragen. Zo komen exacte aantallen niet overeen tussen de echte en de synthetische data. Een studie wiskunde heeft bijvoorbeeld in werkelijkheid 40% vrouwelijke studenten en 41% in de synthetische data.