FAIR data management voor alle NWO-instituten
Reinder Radersma over het nieuwe NWO-I Digital Compentence Center (DCC)
Binnen de NWO-instituten is open access publiceren van artikelen al bijna een vaste routine geworden. Maar hoe zit het met het beschikbaar maken van je onderzoeksdata en -software? Ook dat is een stap waar NWO-I haar onderzoekers bewust van wil maken. Afgelopen september is Reinder Radersma bij NWO-I in dienst gekomen om het zojuist opgerichte NWO-I Digital Competence Center (DCC), ingebed in instituut CWI, te leiden. Het DCC wil laagdrempelig advies, expertise en praktische ondersteuning leveren aan de onderzoekers van de NWO-instituten om hun resultaten, onderzoeksdata en onderzoekssoftware geschikt te maken voor hergebruik in het kader van Open Science.
Sinds 2016 werkt NWO-I aan de implementatie van het FAIR datamanagement beleid bij de NWO-instituten. Onder leiding van coördinator Miriam Roelofs van de afdeling Strategische Ondersteuning van bureau NWO-I, heeft de werkgroep Datamanagement in 2021 het NWO-I DCC opgericht. Deze werkgroep deelt de expertise niet alleen binnen NWO-I maar ook daar buiten in een landelijk netwerk of als input voor bijvoorbeeld beleidsontwikkelingen. FAIR data, als onderdeel van Open Science, is een ingrijpende systeemverandering die naast tijd en inzet van de onderzoekers ook om investeringen vraagt. Sleutel daarbij is dat deze inspanningen van de onderzoeker ook erkend en gewaardeerd worden.
Hoe kwam je op deze positie terecht?
‘Ik was onderzoeker in de biologie en wilde graag eens op een andere manier actief worden in de academische wereld. Tijdens mijn onderzoek werkte ik met veel grote datasets en ontwikkelde ik ook software voor analyses. Zo was ik drie jaar geleden bezig met meta-analyses van data die al gepubliceerd zijn. Daar ondervond ik in de praktijk hoe data worden opgeslagen en welke informatie collega-onderzoekers weggeven. Ook heb ik ervaring met het verloren gaan van gegevens. Toen ik zelf promoveerde verhuisde mijn faculteit naar een ander gebouw. Grote hoeveelheden papieren kaartenbakken werden toen weggegooid. Niemand wilde die data toen digitaliseren en alles ging zo verloren. Dat zette mij aan het denken hoe mensen data opslaan en hoe ‘open’ dat is. Ik werd steeds enthousiaster over het idee dat data voor iedereen beschikbaar moest zijn. En toen kwam deze functie op mijn pad.’
Wat is FAIR data management?
Binnen het DCC gebruiken we de term ‘FAIR’ datamanagement, die staat voor Findable, Accessible, Interoperable en Reusable. Daarmee bedoelen we dat data vindbaar, toegankelijk, interoperabel (zonder beperkingen toepasbaar zijn) en herbruikbaar moeten zijn voor andere onderzoekers en geïnteresseerden. En vooral dat het functioneel is: dat je de data makkelijk kunt vinden, dat onderzoekers snappen waarvoor de data zijn gemaakt, waarvoor ze gebruikt zijn en hoe je ze opnieuw kunt gebruiken en combineren. En voor software geldt dat het goed onderhouden blijft en continu updates krijgt. Ook is het bijvoorbeeld verstandig gebruik te maken van gecertificeerde databases. Het voordeel daarvan is dat de data ook langere tijd worden opgeslagen. Terugkomend op ‘fair’; deze term gebruiken we binnen het DCC ook in de letterlijke zin van het woord.’
Hoe is het NWO-I Digital Competence Center (DCC) samengesteld?
‘Het NWO-I Digital Competence Center (DCC) organiseert en coördineert de expertise op gebied van FAIR data- en software management voor alle NWO-instituten. Bij het DCC zijn vanuit elk NWO-instituut een of meerdere datastewards en research software engineers aangesloten, specialisten die de onderzoekers op locatie kunnen adviseren en ondersteunen als het gaat om data- en softwaremanagement. Deze personen hebben veel expertise op dit thema, vanwege hun betrokkenheid bij open science projecten. Expertisecentra DANS en SURF zijn officieel geen deel van het DCC, maar sluiten wel aan vanwege hun expertise. Ik ben aangesteld als coördinator om het DCC in zijn geheel te managen en te begeleiden. Het NWO-I DCC maakt deel uit van het landelijk DCC-implementatienetwerk, waarbij alle universiteiten, instituten, Hogescholen en UMC’s in Nederland zijn aangesloten. Gezamenlijk wisselen we best practices uit en ontwikkelen we kennis. Sommige universiteiten hebben al sinds een jaar of vijf een competence center voor fair data management. Wij hebben als NWO-I het voordeel dat we kunnen aansluiten bij deze ervaringen en voorbeelden. Bij alle betrokken partijen is veel enthousiasme om samen te werken en ik merk dat er veel goodwill is.’
Wat is jouw opdracht als Coördinator Data stewardship voor NWO-I?
‘Ik ben aangesteld om het DCC te coördineren. Ik leg contacten met universiteiten en andere kennisinstellingen die hiermee bezig zijn, ik houd in de gaten wat er landelijk speelt en probeer verbanden te leggen tussen de instituten. Als coördinator breng ik de belanghebbenden van alle instituten bij elkaar en probeer ze met elkaar te verbinden. We hebben frequent mailcontact en komen een aantal keer per jaar bij elkaar. Wat we vanuit het DCC écht willen is dat NWO-I-onderzoekers via de FAIR-principes gaan werken en hun data, software en code geschikt maken voor hergebruik. Wij geven ze vanuit het DCC advies hoe ze dat het beste kunnen aanpakken. Dat doen we door ze te informeren, te helpen, te adviseren en te ondersteunen in de uitvoering. We proberen daarbij de praktische problemen weg te nemen en de angst dat het veel extra werk oplevert. Mijn taak is ook om de onderzoekers ervan te overtuigen dat fair data management belangrijk is voor de wetenschap en drempels weg te nemen.’
Zijn er verschillen per vakgebied en per instituut?
‘Per instituut verschilt de manier waarop data worden verzameld. Veel instituten werken bijvoorbeeld samen met andere onderzoeksinstellingen en beheren niet alle data zelf. Denk aan Nikhef. Zij werken intensief samen met CERN in Genève, de Europese organisatie die fundamenteel onderzoek doet naar elementaire deeltjes. Een klassiek voorbeeld waar grote hoeveelheden data op een goede wijze worden opgeslagen en waar ook veel in wordt geïnvesteerd. Ook bij de instituten ASTRON, NIOZ en SRON wordt in een groter internationaal verband data verzameld en uitgewisseld. Er zit natuurlijk wel variatie in het type data per vakgebied. Zo werkt instituut NSCR met zeer gevoelige data en daarom werken zij op een heel andere manier dan het Centrum Wiskunde & Informatica (CWI). Maar met alleen het online beschikbaar stellen van je data ben je er niet. Het is vooral belangrijk dat data vindbaar zijn en goed herbruikbaar zijn en dus dat er goede metadata toegevoegd wordt: een goede beschrijving van wat het is en wat je ermee kunt. Daar zit met name de grote uitdaging: is daar is een slag te halen? Gelukkig is bij de meeste instituten het beschikbaar maken van data al een vaste werkwijze.’
Over Reinder Radersma
Reinder (41) is in september 2021 bij NWO-I gestart als Coördinator Data stewardship NWO-I. Het DCC is ondergebracht bij instituut CWI in Amsterdam, waar hij zijn werkplek heeft. Reinder studeerde Bos- en Natuurbeheer en is vervolgens de evolutionaire biologie kant op gegaan. Daarna is hij gepromoveerd in Groningen en deed vervolgens onderzoek in Oxford (UK), Lund (Zweden) en Wageningen. In zijn vrije tijd houdt hij van hardlopen en kanoën. Zijn opvouwbare kano kan hij meenemen naar elk gewenst natuurgebied. Hij woont samen in de binnenstad van Utrecht in een oud opknaphuis, waar nog flink in geklust wordt.
‘Alleen open access publiceren is nog niet perse fair, je moet ook nog je data en software beschikbaar stellen.’
CWI-onderzoeker Stefan Manegold nauw betrokken bij DCC
Stefan Manegold is groepsleider Database Architectures bij CWI en doet onderzoek naar het technisch beheren en opslaan van data. Zijn groep bouwt zelf de open-source dataverwerkingssystemen en maakt daardoor hun onderzoeksresultaten (met name algoritmes en datastructuren) “gebruiksklaar” beschikbaar voor “iedereen”. Op de vraag voor welke wetenschapsgebieden zij systemen bouwen, schetst Stefan een duidelijk voorbeeld: ‘Wij bouwen de motor, in welke auto je deze inbouwt maakt niet uit.’ Niet alleen werkt hij met veel verschillende wetenschapsgebieden samen, ook is er een link met het bedrijfsleven. Zo zijn onder meer de startups MonetDB Solutions en DuckDB Labs uit zijn onderzoeksgroep naar voren gekomen. Het project DCC kan dan ook goed gebruik maken van Stefans kennis op het gebied van datamanagement.
‘Ruim dertien jaar geleden keken we in onze community al naar reproduceerbaarheid van onderzoekresultaten, waaruit de huidige “Artifact Review and Badging policy” van de “Association for Computing Machinery” (ACM) naar voren is gekomen, om het openstellen van data en software gebruikelijk te maken. Maar elke wetenschap community is anders. In de astronomie lopen ze ver vooruit en wordt er bij het doen van een aanvraag voor bijvoorbeeld een telescoop al rekening gehouden met een budget voor de infrastructuur (hardware, software, mankracht) om de verzamelde data op te slaan, te bewerken, te analyseren en te delen. En binnen ons instituut CWI is het niet eens onderwerp van gesprek, want we doen al aan open data opslag en hebben hier al veel in geïnvesteerd. Wij delen deze ervaring en kennis graag met de andere NWO-instituten die nog niet zo ver zijn.
Het zou mooi zijn als NWO-I een nulmeting doet om te kijken waar we nu staan op het gebied van FAIR datamanagement. Dan kunnen we over anderhalf jaar laten zien welke voortuitgang we hebben geboekt en hoe goed de impulsfinanciering van NWO gebruikt is voor dit project. En dat er natuurlijk structureel geld vrijgemaakt moet worden voor het opleiden van onderzoekers, advisering, het maken van procedures en het creëren van bewustwording. Wat ik heel belangrijk vind is dat onderzoekers zich bewust moeten worden van FAIR data en software publicatie, dat er waardering voor komt en dat het op termijn ook beloond wordt. Wat dat betreft past het helemaal bij open access publiceren. Want alleen open access publiceren is nog niet perse fair, je moet ook nog je data en software beschikbaar stellen. En ja, het is zeker een investering qua tijd en geld en niet iedereen ziet meteen de meerwaarde. Het is daarom vooral belangrijk dat men weet hoe je data en software herbruikbaar maakt. En zelfs als iedereen bij jouw data kan ben je er nog niet, je collega-onderzoekers moeten ook begrijpen wat er in je data zit en vooral hoe ze het moeten gebruiken!’
Hoe is het NWO-I DCC tot stand gekomen?
De minister van Onderwijs, Cultuur en Wetenschap heeft NWO in 2018 gevraagd te adviseren over de groeiende digitalisering in de wetenschap en de benodigdheden met betrekking tot digitale infrastructuur en expertise om hiermee tevens bij te dragen aan de open science-ambities zoals deze omschreven staan in het Nationaal Plan Open Science (NPOS). In 2019 is er een Uitvoeringsplan investeringen digitale onderzoeksinfrastructuur gelanceerd. Het oprichten van lokale Digitale Competentie Centra bij universiteiten, onderzoeksinstellingen en UMC’s is een onderdeel van dat plan. Lokale DCC’s hebben als functie het faciliteren van datamanagement van wetenschappelijke data, data-opslag, -analyse, delen etc. zodat onderzoeksgroepen aan de Open Science/FAIR-uitgangspunten kunnen voldoen. Voor de oprichting en versterking van lokale DCC’s heeft NWO een impulsfinanciering beschikbaar gesteld om de transitie naar Open Science te ondersteunen. Hiermee wordt voorzien in de versterking van de capaciteit van datastewards en research software engineers (zij vervullen een op het gebied van FAIR datamanagement een vergelijkbare rol als datastewards, maar dan voor software) aan kennisinstellingen, waarbij deze kennis en expertise vindbaar en laagdrempelig toegankelijk wordt voor onderzoekers. Reinder legt als Coördinator Data stewardship direct verantwoording af aan Lieke Schultze, de manager van de afdeling Informatie en Documentatie van CWI. Per instituut is de instituutsdirecteur verantwoordelijk voor het opstellen, de implementatie, monitoring en evaluatie van het datamanagementbeleid.
Meer weten?
Kijk voor meer informatie over het NWO-I DCC op de NWO-I website. Of stuur een mail naar Reinder via nwo-i-dcc@cwi.nl.
BUW-onderzoekers en FAIR datamanagement
Als je onderzoeker bent bij de BUW volg je de richtlijnen van de universiteit waar je werkt. Elke universiteit in Nederland heeft een eigen Digital Competence Center. Zoek contact met je lokale DCC voor meer informatie.
Tekst: Melissa Vianen
Nieuwsbrief Inside NWO-I oktober/november 2021