PID: wat is een persistente identifier voor publicaties en datasets?

Wat is een persistente identifier?

Een persistente identifier of PID, zoals een DOI of een Handle, is een permanente, unieke referentie naar een digitaal object. Niet alle identifiers verzekeren persistentie en uniekheid zoals een PID dat doet (zie voorbeelden hieronder). Bovendien zal, wanneer een PID voor een digitaal object aangemaakt wordt, een beschrijving van dit objet (i.e. metadata) geregistreerd worden. Daarom zijn PIDs essentieel in het genereren van FAIR onderzoeksoutput.

  • Een PID verzekert persistente toegang tot een digitaal object. PIDs vermijden gebroken links en moeilijkheiden met het lokaliseren van een digitaal object (bv. een dataset, een publicatie), zelfs wanneer het webadres (URL) verandert. Een centraal registratiesysteem verzekert that de PID je steeds naar de huidige locatie van het digitale object zal leiden.
  • Een PID identificeert een digital object op een unieke manier. Naast de persistentie zal een PID meestal ook globaal of universeel uniek (ook guid of uuid genaamd) zijn, i.e. verzekeren dat er geen twee identieke identifiers zijn die naar verschillende digitale objecten leiden noch dat er meerdere identifiers van hetzelfde type zijn die naar hetzelfde digitale object leiden.

In deze onderzoektip geven we voorbeelden van PIDs voor publicaties en datasets, alsook enkele voorbeelden van andere identifiers relevant voor publicaties (i.e. tijdschriften en boeken). Daarnaast bestaan er ook PIDs voor de identificatie van bv. onderzoekers (ORCID) en onderzoeksorganisaties (ROR).

 

Wat is een Digital Object Identifier (DOI)?

De Digital Object Identifier of DOI is een vaak gebruikte identifier voor onderzoeksoutput. De DOI wordt aangemaakt door de centrale registratiesystemen DataCite of CrossRef.

Een DOI is steeds samengesteld uit:

  • De prefix '10.'
  • 4 of meer cijfers, kenmerkend voor de organisatie die de DOI heeft geregistreerd bij DataCite of CrossRef.
  • Een suffix dat het digitale object identificeert.

Door de DOI toe te voegen aan het resolutiesysteem https://doi.org word je naar de lokatie of landingspagina van het digitale object geleid. Een voorbeeld van een dataset in het Dryad data repository is https://doi.org/10.5061/dryad.4h16331. Een voorbeeld van een publicatie is https://doi.org/10.1371/journal.pbio.3002114.

 

Alternatieve (persistente) identifiers

Naast DOIs bestaan verscheidene andere (persistente) identifiers voor publicaties en datasets. Bovendien worden accessienummers gebruikt voor het uniek identificeren van digitale objecten. Het type (persistente) identifier zal afhangen van de organisatie of het platform dat de identifiers aanmaakt. Enkele voorbeelden van (persistente) identifiers worden hieronder beschreven.

Handle

  • Een Handle is een unieke en persistente identifier met een centraal registratiesysteem dat URLs zal resolven naar de huidige locatie.
  • Handles worden voor zowel publicaties als datasets gebruikt en zijn wijd verspreid in, onder andere, de cultureel erfgoedsector en de geesteswetenschappen (bv. CLARIN).
  • Handle identifiers bestaan uit een prefix uitgegeven door het Handle.net register en een suffix dat het digitale object op een unieke manier identificeert onder de gekozen prefix (bv. 11509/142).

WoS

  • Een Web of Science (WoS) id is een unieke identifier toegekend aan publicaties die deel uitmaken van de Web of Science collectie.
  • Een voorbeeld identifier is WOS:000334976000012 welke je zal vinden in de URL van de publicatie op Web of Science.

arXiv

  • Een arXiv id wordt aangemaakt door het gecureerde onderzoeksdeelplatform arXiv data open is voor iedereen en gebruikt wordt voor de publicaties van artikels.
  • De canonieke vorm van arXiv identifiers is arXiv:YYMM.NNNNN, met 5 cijfers voor het sequentienummer in een bepaalde maand (sinds January 2015). Een voorbeeld van een arXiv id is arXiv:1501.00001.

PubMed ID

  • PubMed omhelst citaties van biomedische literatuur. De citaties bevatten links naar de full text inhoud van PubMed Central en uitgeverwebsites.
  • A PMID of PubMed ID is een unieke identifier samengesteld uit enkel cijfers. Een voorbeeld van een PubMed ID is 26360422.

ISSN

  • Een ISSN is een Internationaal Standaard Serie Nummer en refereert op een unieke manier naar een serie publicatie, zoals een tijdschrift, magazine of krant.
  • Het is een 8-cijferige id. Een voorbeeld is ISSN:1360-1385, de ISSN voor het tijdschrift Trends in Plant Science.
  • Naast ISSN is er ook een eISSN voor de elektronische (online) versie van de serie (bv. eISSN:1878-4372).

ISBN

  • Een ISBN of Internationaal Standaard Boek Nummer is een code die refereert naar een monografie of boek. Dit kan een digitaal of een fysiek object zijn.
  • Het bestaat ui 10 of 13 cijfers (bv. 9789463939447).
  • Merk op dat er meerdere ISBN kunnen bestaan voor eenzelfde object.
  • Een ISBN wordt aangevraagd door de uitgever van een monografie. Wil je een ISBN aanvragen? Ga naar de onderzoektip over ISBN voor meer informatie.

ARK

  • Een Archival Resource Key (ARK) is een identifier schema ontwikkeld door de California Digital Library om een digitaal object op een persistente manier te identificeren.
  • In tegenstelling tot andere PIDs zijn ARKs gedecentraliseerd (i.e. elke organisatie die ARKs aanmaakt is verantwoordelijk voor inhoudelijk beheer, hosting, monitoring en forwarding).
  • Bovendien werken zij niet noodzakelijk met landingspagina's die je naar het digitale object doorverwijzen maar kunnen ze rechtstreeks naar het object leiden. ARKs hebben geen metadatavereisten.
  • Een voorbeeld van een ARK identifier is http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29.

PIDs en accessienummers voor Life Sciences data

  • Heel wat databanken en repositories in life sciences werken met hun eigen identifiersysteem. Aangezien deze databanken als betrouwbare data repositories beschouwd worden door veel instanties, worden accessienummers algemeen aangenomen voor gebruik in citaties.
  • Het European Nucleotide Archive (ENA) kent accessienummers toe aan digitale entiteiten op verschillende niveaus van granulariteit. Voorbeeld ENA accessienummers zijn PRJEB1788 (BioProject) en LR796137 (Sequence).
  • Het European Genome-Phenome Archive (EGA) kent IDs toe aan studies en datasets. Voorbeeld dataset ID is EGAD00000000001.
  • EMBL-EBI's BioStudies databases linkt en beheert diverse biologische data van EMBL-EBI databanken en data die niet past in de gestructureerde EMBL-EBI databanken. Wanneer de data succesvol ingediend is, wordt automatisch een accessienummer toegewezen. Voorbeeld accessienummers zijn S-BSST7 (BioStudies), S-BIAD712 (BioImage Archive), E-MTAB-12919 (ArrayExpress).

PIDs in Biblio

Zowel DOIs als alternatieve (persistente) identifiers kunnen gebruikt worden tijdens het Biblio registratieproces van publicaties (DOI, arXiv, PubMed ID, WoS exports) en datasets (DOI, Handle, ENA, BioProject, BioStudies). Een overzicht van de identifiers gebruikt in Biblio wordt in de onderstaande tabel gegeven.

Identifier type Identifier voorbeeld Link Digital object
DOI 10.5061/dryad.4h16331 https://doi.org/10.5061/dryad.4h16331 publicatie, dataset
Handle 11509/142 https://hdl.handle.net/11509/142 publicatie, dataset
WoS 000334976000012 https://www.webofscience.com/wos/woscc/full-record/WOS:000334976000012 publicatie
PubMed ID 26360422 https://pubmed.ncbi/nlm.nih.gov/26360422 publicatie
arXiv 1501.00001 https://arxiv.org/1501.00001 publicatie
ENA LR796137 https://www.ebi.ac.uk/ena/browser/view/LR796137 dataset
EGA EGAD00000000001 https://ega-archive.org/datasets/EGAD00000000001 dataset
BioProject PRJEB1788 https://www.ebi.ac.uk/ena/browser/view/PRJEB1788 dataset
BioStudies S-BSST7 https://www.ebi.ac.uk/biostudies/studies/S-BSST7 dataset

 

Hoe verkrijg je een persistente identifier voor je onderzoeksoutput?

Publicaties

Een PID voor je publicatie wordt doorgaans verkregen wanneer je je publicatie indient voor publicatie bij een uitgeverij of repository. De uitgever of repository zal een PID voor de publicatie aanmaken. De meest gebruikte PID voor publicaties is de Digital Object Identifier (DOI). Meestal wordt de DOI geregistreerd bij CrossRef, het belangrijkste centrale registratiesysteem voor publicaties.

Datasets

Een PID voor je dataset wordt doorgaans aangemaakt wanneer je je dataset in een data repository deponeert. De meest gebruikte PID voor datasets is de Digital Object Identifier (DOI).

Merk op dat bepaalde, door de wetenschappelijke gemeeschap aanvaarde databanken of repositories geen DOIs aanmaken, maar dat ze eerder gebruik maken van alternatieve PIDs of accessienummers (zie voorbeelden hierboven).

Hoe citeer je publicaties en datasets?

Onderzoeksdata kunnen op dezelfde manier als publicaties geciteerd worden. Door het toevoegen van de persistente identifier in de referentie kan je verzekeren dat de publicatie of dataset makkelijk gelokaliseerd kan worden. Terwijl een referentie naar een publicatie naast de PID ook het tijdschrift en/of uitgever vermeld, zal een referentie naar een dataset het data repository vermelden. Uitgeverwebsites en data repositories bieden vaak de functionaliteit aan om een kopij of export van de citatie aan te maken die gebruikt kan worden in een referentielijst. Door onderzoeksresultaten correct te citeren worden de auteurs van een publicatie of de creators van een dataset erkend en kunnen citaties gemonitored worden.

Wil je meer weten?

Voor verdere informatie over PIDs en data citatie, check deze video. Voor meer informatie en richtlijnen rond identifier types, check https://rdmkit.elixir-europe.org/identifiers en https://www.pidwijzer.nl/en.

Bronvermelding

 

 

Meer tips

Vertaalde tips


Laatst aangepast 4 april 2024 16:00