Tillgång till dagens e-resurser i framtiden

May 5, 2008 – 1:39 pm

Utarbetat med stöd av KB:s utvecklingsprogram OpenAccess.se

Peter Hansson, 2007
http://creativecommons.org/licenses/by-nc-sa/2.5/se/

Beskrivning av avsnittet
Det här avsnittet ger en kort introduktion till vad som är viktigt att tänka på för att dagens e-resurser ska bli läsbara och tillgängliga i framtiden. Avsnittet berör tre viktiga frågor: användandet av persistenta identifikatorer, hur en e-resurs kan återfinnas samt vad som är viktigt att tänka på när informationen lagras.

Persistent identifikator
För att man lätt ska kunna identifiera ett elektroniskt dokument bör man tilldela det en persistent identifikator, en unik symbol som fastställer dokumentets identitet och som i det ideala fallet ska finnas för evigt. Det finns olika typer av persistenta identifikator. Några exempel:

• Uniform Resource Name National Bibliography Number eller URN:NBN (ex. URN:NBN:se-2006-1)
• Digital Object Identifier eller DOI (ex. 10.1000/182)
• Handle (ex. 2077/554).

Jämför hur ISBN (ex. 91-7291-878-0) används för tryckta böcker.

http://www.kb.se/isbn-centralen/
http://www.doi.org/
http://www.handle.net/

Tillgängliggörande
För att man lätt ska kunna finna ett elektroniskt dokument är det viktigt att det finns en beskrivning av dokumentet, sk metadata, som indexeras för sökning. Metadatan måste sedan göras tillgänglig på något sätt, t ex via en webbaserad söktjänst. Det är viktigt att det finns minst en persistent identifikator registrerad för varje dokument så att det finns möjlighet att direkt nå det dokument man söker. Detta är speciellt viktigt när användaren är ett datorsystem.

Elektroniska dokument flyttas ibland från ett ställe till ett annat på liknande sätt som böcker flyttas från en hylla till en annan eller efter en tid hamnar i magasin eller depå. För att möjliggöra en flytt av elektroniska dokument utan att äventyra tillgängligheten kan en sk uppslagstjänst för persistenta identifikatorer användas. Systemet har en enda uppgift - att givet en persistent identifikator tala om för användaren var det elektroniska dokumentet för tillfället finns. Med andra ord ger uppslagstjänsten som resultat adressen till dokumentet som efterfrågas.

Kungliga biblioteket (KB) har en uppslagstjänst för identifikatorerna URN:NBN, DOI och Handle. Tjänsten kan nås från adressen http://urn.kb.se/

KB arbetar för att få fram en pliktleveranslag för elektroniska dokument, vilket ska tvinga förlag att också skicka en kopia till KB efter publicering. När ett dokument blir äldre ökar risken att det försvinner från de lokala lagringsplatserna, bland annat pga att organisationer upphör eller ombildas och då finns en tanke (som ännu inte realiserats) att KB:s elektroniska pliktexemplar av dokumentet ska bli tillgängligt istället.

Lagring

Format
Det är svårt att förutsäga vilken livslängd ett specifikt lagringsformat (även kallat filformat när det gäller elektroniska dokument) har, därför är det lättast att göra antagandet att varje dataformat efter en viss tid upphör att existera eller ersätts av ett annat.

För att kunna läsa ett gammalt filformat i framtiden krävs att man vet exakt hur filformatet är uppbyggt och ska tolkas. Ett försök att dokumentera kända filformat och tilldela varje filformat en unik identifikator pågår. Det mest kända filformatregistreringssystemet är idag PRONOM http://www.nationalarchives.gov.uk/pronom/

Två olika huvudinriktningar när det gäller att tillgängliggöra äldre elektroniska publikationer diskuteras ofta bland experter på området: emulering och migrering. Att emulera innebär att man behåller den ursprungliga mjukvaran även i framtida datorsystem. På så sätt kan mottagaren/läsaren vara säker på att det ursprungliga dokumentet visas på samma sätt över tiden (åtminstone i teorin). Vid migrering byter man teknisk plattform. I denna process krävs vanligen att man behöver omvandla/konvertera originaldokumentet till ett annat, mer aktuellt dataformat, som kan användas på den nya tekniska plattformen. Eftersom originaldokumentet kan behöva konverteras finns en risk att data går förlorad eller förvanskas.

Oavsett om emulering eller migrering används är det många publiceringscentran i universitetsvärlden som förespråkar användandet av öppna filformat, dvs specifikationen av formatet är fritt tillgänglig och formatet får användas fritt, för att underlätta för kommande generationer att läsa gamla elektroniska publikationer i framtiden. Exempel på öppna filformat är ODF (OpenDocument Format), PDF och XML. En del menar också att man bör begränsa sig till att använda enkla textbaserade filformat, som till exempel XML.

Se även http://en.wikipedia.org/wiki/Open_format

Skydd mot oönskade ändringar
För att kunna kontrollera att innehållet i ett dokument inte förändrats över tid behöver man skapa en checksumma för dokumentet. En checksumma räknas fram mha en matematisk funktion. Skapade checksummor bör vara allmänt tillgängliga så att vem som helst kan göra en äkthetskontroll. En checksumma ändras aldrig efter att den en gång skapats.

Lagringsplats
Man bör lagra elektroniska dokument på flera olika lagringsplatser (ibland används begreppet arkiv), helst geografiskt utspridda över hela världen. Det minskar risken för att elektroniska dokument går förlorade pga t ex krig och annat elände samt gör tillgängligheten mindre sårbar eftersom man vid t ex avbrott i kommunikationsförbindelser kan hänvisa till andra ställen.

Print This Post Print This Post

Sorry, comments for this entry are closed at this time.