Hvordan kan vi øge værdien af vores data?
AGROs strategi har bl.a. fokus på øget samarbejde internationalt og med andre institutter om udviklingen af bæredygtige løsninger på samfundets behov for fødevaresikkerhed og grøn omstilling. Data er omdrejningspunktet. Data er vores fælles vidensgrundlag, som skal kunne deles, genfindes, forstås og genbruges af kollegaer, samarbejdspartnere, og os selv — nu og om fem, ti eller tyve år. Det sætter i særdeleshed interoperabilitet — både i snæver og bred forstand — på dagsordnen.
I snæver forstand handler interoperabilitet om at vores data er velbeskrevne, repræsenteret og dokumenteret på en struktureret og standardbaseret måde, og er entydigt forståelige, så de kan bruges i sammenhæng med andre og nye data, applikationer og formål — og forstås af såvel mennesker som maskiner (software). Det er I’et i FAIR. Lidt enklere formuleret handler det om, at data kan forstås og bruges på tværs af systemer og fagområder.
Jo mere interoperable data er, desto højere er deres (gen)anvendelighed.
Interoperabilitet er derfor ikke bare vigtigt ift. de data vi skaber fremover, men også for vores eksisterende data, fx data fra vores langtidsforsøg. Ved at gøre en indsats for at gøre dem interoperable, øger vi deres potentiale for genbrug og dermed deres værdi.
I AGRO står vi midt i et generationsskifte, både blandt forskere og teknikere. Det er en vigtig anledning til at se på, hvordan vi organiserer og dokumenterer data. Det handler selvfølgelig mest umiddelbart om at undgå, at data og viden går tabt, men også om at gøre det nemmere at samarbejde om data fremover, ved bl.a. at arbejde med at øge interoperabiliteten.
Et eksempel er udbygningen og renoveringen af VirkN databasen. En Access database etableret i 2015 til ét langtidsforsøg, Virk-N, og som sidenhen -med diverse krumspring- er blevet brugt til at holde data fra efterfølgende projekter. Motiveret af et generationsskifte på VIP og teknikerside er databasen nu blevet udbygget, så den kan holde data fra andre projekter på fornuftig vis, og data blevet ”ensrettet”. Fremover vil der blive arbejdet med at øge interoperabiliteten, fx ved at tilføje feltbeskrivelser og —hvor det er muligt— referere til fx internationalt definerede terminologier (fx sorter og behandlinger). På sigt skal dataene over i en anden databasestruktur som forhåbentligt kan holde AGRO’s langtidsforsøg, og dermed udgøre en fælles datainfrastruktur.
At vælge et ordforråd, som også andre kan forstå og genkende — dvs. at bruge fælles, veldefinerede faglige betegnelser, kategorier og enheder, som man kan referere (evt. linke til), og som ikke forsvinder, når personen bag datasættet forlader AGRO — er et godt sted at begynde rejsen mod FAIR. Det er en vej til bedre datakvalitet, øget forståelighed og højere genbrugsværdi — uanset om data findes i en database eller et regneark.
I en bredere forstand handler interoperabillitet om evnen for forskellige systemer og dele af organisationen til at arbejde sammen og udveksle information. Også her gælder det — des bedre brug af struktur, dokumentation og standarder, des nemmere bliver det.
I den sammenhæng bliver de fælles samtaler om bl.a. standarder og strukturer, der fremmer interoperabilitet i AGRO vigtig. Hvor det giver mening, skal vi tænke i hvad der kan generaliseres og bruges på tværs af sektionen, enhederne eller instituttet — fx ved at vi én gang for alle bliver enige om, hvordan vi benævner og forstår centrale begreber (fx field, block, plot og sub-plot mv.), indfører autoritative lister (fx over maskinel) eller noget helt tredje (der er rige muligheder) — så vi kan bruge dem konsistent og opnå ”semantisk interoperabilitet”, om ikke andet i AGRO.
Det er samtaler som vi skal have i Data Management Komiteen, og over kaffen i pausen, i forskningsgrupperne, i komiteerne, på forsøgsstationerne, i laboratorierne, og på tværs af instituttet. Samtaler, der bl.a. hjælpes på vej ved at vi inspirerer hinanden med eksempler.
Diba & Jens