Publicering i öppna arkiv

May 5, 2008 – 1:33 pm

Se även powerpoint presentation kopplad till denna text!

Utarbetat med stöd av KB:s utvecklingsprogram OpenAccess.se

Tomas Lundén, 2007 (Uppdaterad 2010-04-07)
http://creativecommons.org/licenses/by-nc-sa/2.5/se/

Beskrivning
Det här avsnittet behandlar publicering av forskningspublikationer i öppna arkiv. Det är ett sätt för forskaren att göra sina publikationer fritt tillgängliga (Open Access). Först kommer en bakgrund till fenomenet, därefter en del som på ett praktiskt sätt förklarar vilka problem man kan stöta på och hur dessa kan lösas eller undvikas. Det gäller t.ex. författarens rättigheter, förlagens policies och andra praktiska spörsmål.

Mål med avsnittet: att förklara innebörden av att publicera i öppna arkiv och ge praktiska råd kring det.

Inledning
I följande text används termen parallellpublicering för artiklar som genomgått kvalitetsgranskning och publicerats i en vetenskaplig tidskrift (postprints) och prepublicering för artiklar som ännu inte antagits och genomgått granskning (preprints). När jag diskuterar andra dokumenttyper använder jag helt enkelt termerna publicering eller deponering.

Ett sätt för forskare att göra sina publikationer fritt tillgängliga är genom s.k. parallellpublicering (ibland används även uttrycken egenpublicering eller egenarkivering – på engelska self-archiving). Det brukar kallas den ”gröna vägen” till Open Access, i förhållande till den ”gyllene”, som innebär att publicera sig i Open Access-tidskrifter. Parallellpublicering innebär att forskaren deponerar en kopia av ett av honom/henne författat och i annat sammanhang (vanligen i en vetenskaplig tidskrift) publicerat digitalt dokument på en fritt tillgänglig webbsida (Self-Archiving FAQ). Företrädesvis görs detta i det egna lärosätets öppna arkiv (även benämnt institutionellt arkiv – på engelska open archive eller institutional repository). De flesta svenska universitet och högskolor har idag ett öppet arkiv av detta slag.

I vissa ämnesområden har forskare parallellpublicerat ganska länge, t.ex. inom datavetenskap och fysik. Redan 1991 etablerade Paul Ginsparg vid Los Alamos National Laboratory ett digitalt arkiv vid namn ArXiv för fysik, där forskare deponerar sina artiklar för att kollegor ska kunna ta del av dem innan de antas och ges ut i en vetenskaplig tidskrift. ArXiv är alltså ett ämnesbaserat öppet arkiv och det finns flera sådana, som t.ex. RePEc (ekonomi), CogPrints (kognitionsvetenskap), CiteSeer (datavetenskap) och E-LIS (biblioteks- och informationsvetenskap).

En av de tidigaste förespråkarna för parallellpublicering var kognitionsforskaren Stevan Harnad, som redan 1994 publicerade vad han kallade ”The subversive proposal” (Harnad 1995, s.13-14), där han influerad av etableringen av ArXiv propagerade för att forskare världen över i alla discipliner, skulle göra sina publikationer fritt tillgängliga via ”public ftp”, som då var den rådande tekniken.

Den tekniska utvecklingen har gått vidare sedan dess, men grundidén kvarstår. Vid sidan av ämnesarkiven har individuella forskare också (med eller utan direkt påverkan) hörsammat Harnads uppmaning genom att göra sina publikationer fritt tillgängliga, på egna hemsidor eller sidor som tillhör forskargruppen, avdelningen eller institutionen. Omfattningen av denna parallellpublicering har dock hittills inte nått den nivå som Harnad propagerade för.

De senaste åren har många universitet, högskolor och andra forskningsinstitutioner inom och utom Sverige etablerat egna öppna arkiv. Det är främst dessa, snarare än ämnesarkiv, som man numera brukar tala om när det gäller parallellpublicering (Harnad 2006). En lämplig definition av ett öppet arkiv i dessa sammanhang är Raym Crows: ”…a digital archive of the intellectual product created by the faculty, research staff, and students of an institution and accessible to end users both within and outside of the institution.” (Crow 2002, s. 16). Vidare menar Crow att ett öppet arkiv ska vara interoperabelt och dess innehåll av vetenskaplig karaktär. Med interoperabelt menas här att systemet ska kunna tillgängliggöra sitt innehåll (metadata och fulltexter) för sökmotorer och andra tjänster på Internet. Det standardprotokoll som används för detta är OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting).

Det finns olika programvaror för de öppna arkiven. En del är s.k. open source och är gratis att ladda ned och börja använda som t.ex. Eprints och DSpace. DiVA är utvecklat vid Uppsala universitetsbibliotek och universitet och högskolor kan mot avgift ansluta sig till systemet. Flera lärosäten har utvecklat egna system för elektronisk publicering. För en översikt över system som används i Sverige (per 2005) se Holmqvist & Johansson 2005.

OpenDOAR - The Directory of Open Access Repositories som drivs av University of Nottingham, registrerar alla öppna arkiv inom akademiska institutioner över hela världen och för statistik kring arkivens tillväxt. Av totalt 1621 registrerade arkiv är 40 stycken från Sverige (2010-04-07).

Rättigheter, förlagspolicies och annat praktiskt

Vetenskapliga artiklar
När man talar om Open Access genom parallellpublicering menar man som nämnts i första hand artiklar som har genomgått sakkunnigbedömning (peer review) och publicerats i en vetenskaplig tidskrift, s.k. postprints. Detta angavs i Budapest Open Access Initiative 2002 (se även Harnad 2001 och Harnad 2006). För att göra en artikel som publicerats i en vetenskaplig tidskrift fritt tillgänglig krävs att tidskriftsförlaget tillåter detta. Uppgifter om de flesta förlags regler finns i tjänsten Sherpa/Romeo, som även den drivs av University of Nottingham.

En postprint definieras i Sherpa som en artikel som antagits för publicering och genomgått sakkunnigbedömning, samt att eventuella ändringar föranledda av granskningen är införda i artikeln. En preprint å andra sidan är en artikel som ännu inte antagits eller genomgått sakkunnigbedömning (se definitioner i Sherpa/Romeo).

Sherpa/Romeo delar upp förlagens policies enligt en färgskala:

  • Grön = tillåter parallellpublicering av postprint och prepublicering av preprint
  • Blå = tillåter endast parallellpublicering av postprint
  • Gul = tillåter endast prepublicering av preprint
  • Vit = tillåter varken parallell- eller prepublicering

Det är inte ovanligt att forskare anger att man är tveksam till att parallellpublicera för att man är rädd för att bryta mot avtalet med förlaget. Sanningen är att i dagsläget tillåter en majoritet av förlagen, 63 procent, parallell- eller prepublicering, enligt Sherpa/Romeo. Siffrorna för postprints är 53 procent och för preprints 38 procent (2010-04-07).

På tidskriftsnivå blir siffrorna högre. Enligt Eprints.org tillåter 63 procent av tidskrifterna parallellpublicering av postprints och 32 procent prepublicering av preprints. Totalt blir det alltså 95 procent för någon form av publicering (2010-04-07). Anledningen till att siffrorna för förlag och tidskrifter skiljer sig åt är att flera av de förlag som tillåter parallellpublicering av postprints är väldigt stora och ger ut en avsevärd mängd tidskrifter, som t.ex. Elsevier och Springer.

Noteras bör att Eprints.org använder en något annorlunda färgskala än Sherpa/Romeo:

  • Eprints full green = Sherpa grön + blå (tillåter postprints och i vissa fall preprints)
  • Eprints pale green = Sherpa gul (tillåter endast preprints)

Det kan förstås hända att det förlag forskaren publicerar hos är ”vitt”, alltså generellt inte tillåter parallellpublicering eller inte finns med i Sherpa/Romeo-databasen alls. I detta fall kan man helt enkelt skicka ett brev till förlaget och be om tillstånd. Man kan även redan innan man skriver på publiceringsavtalet, när artikeln accepterats, begära att få behålla rättigheten att deponera en kopia av artikeln i det egna lärosätets öppna arkiv. (Läs mer under avsnittet Upphovsrätt för forskare.)

Förlagets kontra författarens artikelversion
Utöver distinktionen mellan postprint och preprint så är det viktigt att även skilja på två varianter av postprints, nämligen förlagets publicerade pdf-fil och författarens slutliga godkända manuskript. Förlagets pdf är helt enkelt den pdf som publicerats i tidskriften. Författarens sista version är i idealfallet innehållsligt identisk, men oformaterad och innehåller inte tidskriftens paginering eller logga. De flesta större förlag tillåter idag endast parallellpublicering av just författarversionen och inte förlagets pdf. Denna information står i så fall under General conditions i Sherpa/Romeo-databasen.

Några exempel på hur det kan uttryckas:

  • Publishers PDF cannot be used
  • Publishers version cannot be used
  • Authors version of post-prints may be archived

På grund av att det ofta endast är författarversionen som får deponeras, är det viktigt att författaren är noga med att den slutliga version han/hon får tillbaka från tidskriften är innehållsligt identisk med den publicerade versionen. Det är inte minst av vikt när artiklar deponeras genom ombud (bibliotekarier eller administrativ personal) och inte av forskaren själv. Till exempel kan det ställa en del tekniska krav på personalen, som att på ett korrekt sätt infoga bilder och diagram i artikeln, något som Medicinska fakultetens bibliotek vid Lunds universitet har erfarenhet av (Hultman-Özek 2005). Osäkerhet kring versionens status kan förstås även uppstå. Det enda sättet att definitivt säkerställa författarversionen som identisk med förlagets version är egentligen att jämföra texterna (Antelman 2006, s. 87). De flesta skulle nog anse att detta är ett alltför resurskrävande arbete för biblioteket/administrationen. Om man har ett arbetsflöde som involverar ombud är det rimligt att se versionshanteringen som primärt författarens ansvar.

Vad gäller eventuella skillnader mellan de olika versionerna, så har ett par studier publicerats som visar att det ofta förekommer skillnader och ibland rena fel i artiklarna. Oftast har felen varit i författarversionen, men det finns även exempel där den publicerade versionen introducerat fel som inte fanns i författarens manuskript. Ingen av studierna fann att det förekom större felaktigheter, utan det rörde sig huvudsakligen om mindre saker som inte påverkade det vetenskapliga resultatet eller förståelsen av det (Goodman, Dowson & Yaremchuk 2007 ; Wates & Campbell 2007). Dock behövs fler och större studier kring detta, för att kunna undanröja tveksamheter kring parallellpublicerade versioner.

Som Antelman vidare påpekar i sin artikel är det ett faktum att en författarversion av en postprint på grund av att den är oformaterad, närmast ser ut som en preprint. ”Without the contextual branding of a journal or pagination, such a document is not, according to the norms of most disciplines, citable.” (Antelman 2006, s. 87). När en publicerad artikel deponeras i ett öppet arkiv, är det därför angeläget att bibliografiska uppgifter fylls i korrekt (se mer nedan under Hur gör man och varför?) och att man även länkar till den officiella publicerade versionen av artikeln (det är något som nästan alla förlag kräver). När fulltexten dessutom är en författarversion är det högst rekommendabelt att lägga till ett standardiserat försättsblad som på ett tydligt sätt anger referensen och att versionen är sakkunnigbedömd. Försättsbladet läggs in som första sidan i pdf-filen.

Här ges ett exempel på hur man kan formulera ett sådant försättsblad för en vetenskaplig artikel:

This is an author produced version of a paper published in Journal of example science.

This paper has been peer-reviewed but does not include the final publisher proof-corrections or journal pagination.

Citation for the published paper:

Andersson, A., “Example of a paper”,

Journal of example science, 2007, volume 5, issue 5, pp. 5-10.

URL to article at publishers site: http://dx.doi.org/13234567889

Access to the published version may require journal subscription.

Published with permission from: Elsevier

Embargo
Embargo innebär i detta sammanhang en restriktion från t ex ett förlag hur snart en artikel får tillgängliggöras i ett öppet arkiv.

Det kan till exempel vara 6 eller 12 månader efter publicering i tidskriften. Denna information står under Restrictions eller Conditions i Sherpa/Romeo, och kan exempelvis uttryckas på följande sätt:

  • 12 month embargo
  • Publisher’s version/PDF may be used after 12 months

Rekommendation eller krav från forskningsfinansiärer
I allt högre grad kräver eller rekommenderar forskningsfinansiärer att en kopia av publikationer som resulterar från forskning som de finansierat, ska deponeras i ett öppet arkiv. Sherpa driver en systertjänst till Romeo kallad Juliet, som listar de finansiärer som har antagit en policy för detta. I Sverige är det Vetenskapsrådet och Formas (2010-04-07). Sherpa/Juliet ställer upp tre kriterier för att finansiärens policy ska räknas som helt och hållet Open Access:

  • Att deponering krävs (alltså är obligatorisk)
  • Att det som ska deponeras är postprint-versionen av artikeln (antingen förlags-pdf eller författarversion)
  • Att deponeringen ska ske direkt när artikeln accepterats av en tidskrift (dvs utan embargotid)

I dagsläget (2010-04-07) är det ingen finansiär som uppfyller alla dessa tre kriterier, men flera uppfyller de två första. Än så länge accepterar man ett embargo, de flesta anger 6 månader.

Andra dokumenttyper
Forskningspublikationer som inte har publicerats i vetenskapliga tidskrifter kan även de tillgängliggöras i öppna arkiv. Det kan vara konferensbidrag, bokkapitel, hela böcker eller rapporter av olika slag. För publikationer som har publicerats externt (utanför lärosätet) gäller liksom för artiklar att få tillstånd från utgivaren att parallellpublicera. Det görs enklast genom att kontakta förlaget/utgivaren och be om tillstånd. Det kan vara kommersiella förlag, men ofta även statliga myndigheter eller organisationer av olika slag. Erfarenheter visar att det påfallande ofta går bra att få ett sådant tillstånd.

Många av dessa andra typer av dokument består av det som kallas grå litteratur. De öppna arkiven erbjuder en möjlighet för den grå litteraturen att bli synlig och tillgänglig på ett helt annat sätt än tidigare (Correia & Neto 2002; Banks 2005). En definition på grå litteratur lyder: “Information produced on all levels of government, academics, business and industry in electronic and print formats not controlled by commercial publishing i.e. where publishing is not the primary activity of the producing body” (GreyNet : The Grey Literature Network Service). Grå litteratur genomgår vanligen inte sakkunnigbedömning, men det kan ändå handla om publikationer av vetenskaplig karaktär. I detta sammanhang rör det sig till exempel om material publicerat inom lärosätet eller som är helt opublicerat. För publikationer som publicerats inom lärosätet äger författaren upphovsrätten och kan göra publikationen fritt tillgänglig om inget särskilt avtal som förbjuder detta har skrivits, med institution, fakultet eller lärosäte. Till denna grupp kan räknas delar av avhandlingar, rapportserier, en del lokala tidskrifter etc. Opublicerat material som working papers kan författaren utan problem deponera en kopia av i det lokala öppna arkivet.

Statistik från OpenDOAR (2010-04-07) visar att de vanligaste dokumenttyperna efter tidskriftsartiklar globalt sett i de öppna arkiven är uppsatser och avhandlingar samt opublicerade rapporter och working papers.

Hur gör man och varför?
En vanlig invändning från forskare mot att deponera sina publikationer i öppna arkiv är att de tror eller upplever att det tar för mycket tid och att det är komplicerat. Det handlar ju inte bara om att ladda upp en fil någonstans, utan man måste även beskriva sin publikation med bibliografiska uppgifter (metadata). Men studier visar att att det de facto är varken speciellt tidskrävande eller svårt att deponera sina publikationer i öppna arkiv.

En studie vid University of Southampton utifrån programvaran Eprints där man studerade serverloggar, visar att den genomsnittliga tiden för inläggning av en artikel var ca 10 minuter. Mediantiden var ännu mindre, 5 minuter och 37 sekunder (Carr & Harnad 2005, s. 5). Baserat på ett genomsnittligt antal författare per artikel som låg på 3.33, beräknade Carr och Harnad vidare att en forskare som publicerar en artikel i månaden, skulle ägna ca 39 minuter per år på att deponera sina artiklar (Carr & Harnad 2005, s. 6). En annan studie utförd av Swan och Brown vid Key Perspectives Ltd. som baserades på enkäter utskickade till forskare runt hela världen visar på liknande resultat. 52 procent av de svarande menade att det tog några minuter att deponera en artikel (Swan & Brown 2005, s. 53f ; se även Swan 2006, s. 55). Båda dessa studier visar dessutom att tiden det tar att registrera metadata minskar avsevärt efter den första artikeln. Carr och Harnad visar även att ju fler artiklar en författare lagt in, desto snabbare går det.

Vad gäller svårigheten så rapporterar Swan och Brown att efter den första artikeln tyckte 72 procent av forskarna att det var lätt eller mycket lätt att deponera. Endast 9 procent upplevde det som svårt (Swan & Brown 2005, s. 54 ; Swan 2006, s. 55f).

Varför behövs då metadata? Därför att bra och strukturerad metadata ökar chansen till att publikationen används och citeras, vilket är vad forskare vill. I Swan och Browns studie angav 92 procent av forskarna att anledningen till att man publicerar sig över huvud taget är att man vill sprida forskningsresultaten till sina kollegor (”communicate results to their peers”) (Swan & Brown 2005, s. 23). Ett antal studier har visat att artiklar som är fritt tillgängliga på webben citeras tidigare och mer än artiklar som endast finns tillgängliga via prenumerationsbaserade tidskrifter (Open Citation Project: ”The effect of open access and downloads (’hits’) on citation impact: a bibliography of studies”).

De institutionella arkiven ger möjlighet till att göra deponerade publikationer synliga och tillgängliga på webben genom att man lägger till strukturerad metadata och genom att protokollet OAI-PMH ser till att datan kan ”höstas” och göras synlig i olika söktjänster och sökmotorer (se vidare OAI-PMH protokollet och söktjänster).

Av denna anledning är det viktigt att lägga till metadata om publikationen. Även om fulltexten av någon anledning inte får läggas ut, underlättar denna information för någon som hittat referensen på webben, att bedöma om artikeln är intressant för honom/henne, och att i så fall kunna få tag på fulltexten på annat sätt.

Referenser
Antelman, K. (2006). Self-archiving practice and the influence of publisher policies in the social sciences. Learned Publishing 19(2), s. 85-95 (Elektronisk). Tillgänglig: http://dx.doi.org/10.1087/095315106776387011 (2010-04-07). Parallellpublicerad version: http://eprints.rclis.org/archive/00006023/

Banks, M. (2005). Towards a continuum of scholarship : the eventual collapse of the distinction between grey and non-grey literature, i: D. Farace & J.Frantzen (red.), Open access to grey resources : seventh international conference on grey literature ; INIST-CNRS, Nancy, France, 5 - 6 December 2005. Amsterdam : TextRelease. ISBN 90-77484-06-X (Elektronisk). Tillgänglig: http://eprints.rclis.org/archive/00005803/ (2010-04-07).

Carr, L. & Harnad, S. (2005). Keystroke economy : a study of the time and effort involved in self-archiving. Technical report, ECS, University of Southampton (Elektronisk). Tillgänglig: http://eprints.ecs.soton.ac.uk/10688/ (2010-04-07).

Correia, A.M.R. & Neto, M.D. (2002). The role of eprint archives in the access to, and dissemination of, scientific grey literature : LIZA - a case study by the National Library of Portugal. Journal of Information Science 28 (3), s. 231-41 (Elektronisk). Tillgänglig: http://dx.doi.org/10.1177/016555150202800305 (2010-04-07).

Crow, R. (2002). The case for institutional repositories : a SPARC position paper. Washington, DC : SPARC (The Scholarly Publishing & Academic Resources Coalition) (Elektronisk). Tillgänglig: http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf (2010-04-07).

Goodman, D., Dowson, S. & Yaremchuk, J. (2007). Open access and accuracy : author-archived manuscripts vs. published articles. Learned Publishing 20(3), s. 203-215 (Elektronisk). Tillgänglig: http://dx.doi.org/10.1087/095315107X204012 (2010-04-07). Parallellpublicerad version: http://dlist.sir.arizona.edu/1968/

Harnad, S. (1995). Overture : the subversive proposal, i: A. Okerson & J. O’Donnell (red.), Scholarly journals at the crossroads : a subversive proposal for electronic publishing. Washington, DC : Association of Research Libraries. ISBN: 0-918006-26-0 (Elektronisk). Tillgänglig: http://www.arl.org/bm~doc/subversive.pdf (2010-04-07).

Harnad, S. (2001). The self-archiving initiative. Nature 410, s. 1024-25 (Elektronisk). Tillgänglig: http://dx.doi.org/10.1038/35074210 (2010-04-07). Parallellpublicerad version: http://eprints.ecs.soton.ac.uk/5947/

Harnad, S. (2006). Optimizing OA self-archiving mandates : what? where? when? why? how?. Technical report, ECS, University of Southampton (Elektronisk). Tillgänglig: http://eprints.ecs.soton.ac.uk/13098/ (2010-04-07).

Holmqvist, K. & Johansson, T. (2005). Organiserad vetenskaplig elektronisk publicering vid universitet och högskolor i Sverige. Magisteruppsats i Biblioteks- och informationsvetenskap, Lunds universitet (Elektronisk). Tillgänglig: http://lup.lub.lu.se/student-papers/record/1331756 (2010-04-07).

Hultman-Özek, Y. (2005). Lund Virtual Medical Journal makes self-archiving attractive and easy for authors. D-Lib Magazine 11(10) (October 2005) (Elektronisk). Tillgänglig: http://dx.doi.org/10.1045/october2005-ozek (2010-04-07).

Swan, A. (2006). The culture of open access : researchers’ views and responses, i: N. Jacobs (red.), Open access : key strategic, technical and economic aspects, s. 52-59. Oxford : Chandos. ISBN: 1-84334-204-9 (Elektronisk). Tillgänglig: http://eprints.ecs.soton.ac.uk/12428/ (2010-04-07).

Swan, A. & Brown, S. (2005). Open access self-archiving : an author study. Truro, UK : Key Perspectives Ltd (Elektronisk). Tillgänglig: http://eprints.ecs.soton.ac.uk/10999/ (2010-04-07).

Wates, E. & Campbell, R. (2007). Author’s version vs. publisher’s version : an analysis of the copy-editing function. Learned Publishing 20(2), s. 121-129 (Elektronisk). Tillgänglig: http://dx.doi.org/10.1087/174148507X185090 (2010-04-07).

Print This Post Print This Post

Sorry, comments for this entry are closed at this time.