Forskningsdata
Med forskningsdata avses information som samlas in eller genereras under forskningsprocessen och som ligger till grund för de resultat och slutsatser som forskningen genererar. Att publicera och göra forskningsdata öppet tillgängliga ger ökad transparens och tillförlitlighet för presenterade resultat och publikationer. Det ger även andra möjlighet att hitta och återanvända befintliga data i ny forskning.
Här ges en introduktion till publicering och citering av forskningsdata. På Medarbetarportalen finns utförlig information om universitetets stöd vid hantering av forskningsdata under hela forskningsprocessen – insamling, analys, lagring, publicering och arkivering med mera.
Publicera och tillgängliggöra forskningsdata
Genom att publicera och tillgängliggöra data kan andra återanvända och citera forskningsdata. Därigenom kan de ursprungliga upphovsmännen få erkännande och akademisk meritering för data som genererats i ett projekt.
I 2016 års forskningspolitiska proposition (2016/17:50) presenterade regeringen målbilden att en omställning till öppen tillgång till forskningsresultat - vetenskapliga publikationer, konstnärliga verk och forskningsdata - bör vara genomförd fullt ut senast inom tio år, det vill säga 2026. Det ligger i linje med EU:s strävan efter ökad öppenhet för forskningen.
Det finns flera sätt att publicera forskningsdata och göra data öppet tillgängliga:
- De data som en vetenskaplig publikation bygger på kan publiceras som kompletterande material, antingen på förlagets webbplats eller i ett öppet datarepositorium.
- Man kan deponera forskningsdata i ett öppet datarepositorium och även publicera ett så kallat data paper som beskriver dessa data. Den typen av artiklar omfattar inte analys av data utan fokuserar på att beskriva ett dataset när det gäller innehåll, ursprung, och struktur.
- Man kan publicera ett dataset i ett öppet datarepositorium utan tillhörande publikation. Det finns en mängd datarepositorier - ämnesspecifika, institutionella och generella - som kan användas för att tillgängliggöra forskningsdata. Välj gärna etablerade ämnesspecifika datarepositorier i första hand. Hos re3data.org finns en utförlig förteckning.
Tänk på att vid publicering av ett dataset kan angivna upphovsmän och roller vara andra än de som anges i publikationer vars analys och resultat bygger på dessa data. För exempel på roller se CRediT – Contributor Roles Taxonomy
För att underlätta för andra att återanvända publicerade data kan man ange eventuella villkor för användning, exempelvis med hjälp av Creative Commons licenser. För licenser för kod och mjukvara se Choose a licence.
All data kan inte delas eller publiceras
Det kan finnas juridiska och/eller etiska skäl att inte dela eller publicera forskningsdata. Det gäller exempelvis data som innehåller känsliga personuppgifter och som då omfattas av dataskyddsförordningen (GDPR) eller annan lagstiftning. Det kan även gälla material som är sekretessbelagt enligt OSL (SFS 2009:400), som innehåller företagshemligheter, är upphovsrättsskyddat av någon annan eller som innehåller annan information som av juridiska eller etiska skäl inte bör spridas. Även om vissa data inte direkt kan delas, publiceras eller göras öppet tillgängligt kan de ändå registreras och bli sökbara i kataloger över forskningsdata. Då kan man även ange de förutsättningar och villkor som finns för att få tillgång till data.
Fördelar med att publicera forskningsdata
Ökat genomslag: att publicera data ger fler möjligheter till genomslag och meritering tack vare andra forskares citeringar av och registrerade nedladdningar av data. Därigenom kan man som forskare få erkännande för andra bidrag än publikationer.
Ökat samarbete: om dina data publiceras och görs tillgängliga blir du som forskare mer synlig. Sannolikheten att andra forskare får kännedom om din forskning och dina resultat ökar. Resultaten kan bli nya kontakter och samarbetsmöjligheter, både nationellt och internationellt.
Minskat dubbelarbete: genom att dela data kan forskarsamhället fokusera på att ta fram nya data istället för att återupprepa redan gjorda datainsamlingar och analyser.
Forskningens integritet och transparens: att tillgängliggöra data ökar möjligheten att kunna verifiera och reproducera publicerade forskningsresultat.
Samhällsnytta: det är värdefullt att offentligt finansierade forskningsresultat – både publikationer och data - i så hög grad som möjligt görs öppet tillgängliga för resten av samhället.
Tillgodose krav och följa rekommendationer: finansiärer, förlag, lärosäten och andra aktörer har ofta krav på att forskningsdata ska publiceras.
Citera forskningsdata
Precis som vetenskapliga publikationer kan även forskningsdata och kod citeras. För att forskningsdata ska kunna citeras bör ett datasetet tilldelas en permanent identifierare, t.ex. ett DOI- (Digital Object Identifier) eller ett urn:nbn-nummer.
Citering av ett dataset ska innehålla tillräcklig information för att den korrekta versionen ska kunna identifieras. Följande uppgifter bör ingå i en referens för ett dataset:
- Upphovsperson
- Publiceringsår
- Titel
- Version
- Datarepositorium
- Resurstyp
- DOI eller annan unik identifikator
Riktlinjer för utformning av citering och referens för ett dataset kan skilja sig mellan förlag och olika bibliografiska stilar. Se även Referensguiden för allmän information om referenshantering.
DataCite är en organisation som arbetar med att göra forskningsdata sökbara och möjliga att citera, bland annat genom att ge datarepositorier via DataCite kan tilldela dataset DOI-nummer. DataCite har i samarbete med CrossRef och andra organisationer utvecklat tjänsten DOI Citation Formatter där man kan skapa referenser i ett stort antal bibliografiska stilar för dataset med DOI-nummer.
"Fler citeringar med återbruk av data", artikel i Vetenskapsrådets tidning Curie.
"Tillgängliggöra data i forskningsprocessen", Svensk Nationell Datatjänst
Öppen tillgång till forskningsdata
Forskningsdata är en värdefull resurs som ofta kräver mycket tid och pengar att producera. Därför ställer allt fler forskningsfinansiärer krav på att forskare som får anslag tänker över hur insamlade data ska tas om hand, dokumenteras och i vilken form de kan göras tillgängliga för framtida forskning.
Med utgångspunkt i EU-kommissionens rekommendationer till medlemsstaterna lämnade Vetenskapsrådet 2015 ett förslag om nationella riktlinjer om öppen tillgång till vetenskaplig information till regeringen. Målbilden för 2015-2020 är att all forskningsdata som tas fram med offentliga medel görs öppet tillgänglig. Under dessa år genomförs pilotutlysningar med krav på att forskningsdata görs öppet tillgänglig.
Det är möjligt att ladda upp dataset i DiVA för att göra det öppet tillgängligt, eller för att enbart arkivera det. Datasetet får ett unikt id (urn:nbn) och en beständig länk som man exempelvis kan använda för att hänvisa till materialet i en publikation. För att göra det lättare att hitta forskningsdata kan man även länka från publikationer i DiVA till dataset som finns öppet tillgängliga i andra databaser.
I registret re3data.org kan du söka efter dataarkiv inom olika ämnesområden.
Förutom i DiVA kan du även tillgängliggöra data i:
Datahantering
Med datahantering menas hur forskningsmaterialet hanteras, organiseras och bevaras under forskningsprocessen. Flera forskningsfinansiärer ställer idag krav på att en datahanteringsplan finns med i ansökningar om finansiering, t.ex. Wellcome trust och EU:s forskningsprogram Horizon 2020. Från och med våren 2019 måste alla som beviljas bidrag från Vetenskapsrådet ha en datahanteringsplan. Planen behöver inte skickas in med ansökan, men planen ska finnas när projektet påbörjas och underhållas under projektets gång.
En datahanteringsplan (DHP eller DMP, data management plan) är ett effektivt sätt att få kontroll över sin datahantering. Datahanteringsplanen är ett formellt dokument som bör innehålla uppgifter om hur data samlas in och hanteras under forskningsprojektet, och hur den tas om hand efteråt. En DHP kan underlätta samarbeten och åtkomst till data och också tydliggöra säkerhetsaspekter. Hos Svensk Nationell Datatjänst (SND) finns mer information om datahantering.
Sammanslutningen av europeiska forskningsfinansiärer, Science Europe, lanserade 2018 ett ramverk för datahanteringsprotokoll, för att underlätta för forskare att administrera sina forskningsdata.
SHERPA/JULIET är en databas som listar och informerar om forskningsfinansiärer.
Checklista för datahanteringsplan (Svensk Nationell Datatjänst, SND)
Rekommendation för datahanteringsplan (SUHF)
Data management (Horizon 2020)
Data Management Plans (Digital Curation Centre, DCC)