Essä: Att vara sen kan vara till fördel

26 okt 2020 • 6 min

Genom att utnyttja andras försprång och diskutera utvecklingens möjligheter och begränsningar kan senfärdigheten bli en styrka, skriver Peter Sjökvist och Sebastian Cöllen.

Det är i dag mer regel än undantag att kulturarvs­institutioner har något slags digital samling och arbetar intensivt med digitalisering och digitalt tillgängliggörande. Forskare som Melissa Terras menar till och med att digitalisering har kommit att bli en kärnverksamhet för kulturarvssektorn. En given följd är att det ligger mycket prestige i begreppet. Digitalisering är vägen för framtiden, och ingen vill hamna på efterkälken.
Samtidigt är det tydligt att digitalisering inte är den kostnadseffektiva engångslösning som man kanske en gång hoppades eller trodde att den skulle vara. Precis som de analoga samlingarna måste de digitala vårdas och underhållas. Enligt den omfattande undersökningen Core Survey 4 (2017) stod skanning, skapande av metadata och liknande initiala moment bara för hälften av utgifterna inom bibliotekssektorn i Sverige, medan den andra hälften gick till strukturella kostnader för underhåll, licenser och användarsupport. Dessutom åldras de digitala filerna snabbare än de fysiska originalen. Medan originalen alltid är autentiska bygger den digitala reproduktionens autenticitet på ett likhetsförhållande till originalen. Denna likhet är beroende av den teknik och de standarder som användes vid tiden för digitaliseringen. Och vad som är en godtagbar teknisk standard idag kommer att vara en undermålig sådan för framtida syften. Tänk bara på mikrofilmerna och den enorma betydelse de tillmättes under mitten av 1900-talet. Det vore naivt att tro att vi nu har fått en teknik som kommer att stå sig, när den tekniska utvecklingen bara tenderar att gå snabbare och snabbare.

Peter Sjökvist, bibliotekarie vid avdelningen för specialsamlingar på Uppsala universitetsbibliotek.

Ur detta perspektiv är det rimligt att arbetet med digitalisering behöver gå in
i en mer reflektiv fas. Digitaliseringen måste fortsätta att understödjas och utvecklas, men just därför blir det viktigare än någonsin att återigen diskutera frågan om digitaliseringens enorma möjligheter och ofrånkomliga begränsningar.
För forskningen är givetvis den ökade tillgängligheten en av digitaliseringens största vinster. För att undersöka ett särskilt dokument, exempelvis en handskrift eller en äldre tryckt bok, behövde man tidigare ibland argumentera för att faktiskt få se den fysiska artefakten, vänta på att den kunde göras tillgänglig och till slut kanske finansiera långväga resor till institutionen där den förvarades. När den digitala reproduktionen ligger endast ett knapptryck bort, tycks dessa hinder vara undanröjda. Denna ökade tillgänglighet räcker för många syften och innebär en fantastisk lättnad för de flesta forskare.

Samtidigt ska man inte glömma det självklara, nämligen att produkten av en digitaliseringsprocess – den digitala kopian (digitalisatet) – inte är detsamma som originalet. För den generation digital natives som utgör framtidens forskarsamhälle är risken att det blir naturligt att gå direkt till en digital kopia online, utan att någonsin hålla det fysiska dokumentet i sin hand eller arbeta med kritiska utgåvor. För dessa användare kommer skillnaden mellan original och digitalisat inte att vara uppenbar; risken är att reproduktionen framstår som the real thing. Vi återkommer till problematiken med detta.
Inte heller kan digitalisering av dokument jämföras med kritisk textutgivning, trots att den motsatta åsikten antyds bland svenska forskare (skillnaden är egentligen principiell: medan den kritiska utgåvan vill etablera en idealtext på verksnivå via en jämförelse av flera textvittnen, reproducerar digitalisatet en enskild handskrift eller ett enskilt exemplar, och representerar alltså inte mer än just den handskriften eller det exemplaret). Det räcker inte att digitaliseringen bygger på genomtänkta överväganden och justeringar för att verksamheten ska kunna kallas kritisk, då skulle ordet förlora sin innebörd och relevans inom textutgivningen.

Sebastian Cöllen, bibliotekarie vid avdelningen för lärande- och forskningsstöd vid Uppsala universitetsbibliotek.

Vikten av informationskompetens – att kunna bedöma vad man faktiskt har för ögonen – blir här särskilt tydlig. Det behövs en kunskap om att digitalisatet är beroende av en ofta ganska slumpartad urvals- och tolkningsprocess, där faktorer som budget, standarder, tekniska förutsättningar, fysisk tillgång till dokumenten och den digitala plattformens gränssnitt avgör hur slutprodukten kommer att se ut och vad som faktiskt digitaliseras. Dessutom måste användaren vara medveten om att man umgås med digitalisatet på ett annat sätt än med originalet. De två utgör inte bara olika medier, utan faktiskt ontologiskt skilda entiteter, var och en med sina unika möjligheter till interaktion. För att ta några övertydliga exempel: hos originalet kan man betydligt bättre uppskatta dokumentets materiella egenskaper, vilket rör allt från pappers- och pergaments­kvaliteter till bokbandets uppbyggnad, bibliografiskt format, samt så enkla saker som tyngd och doft, medan man i högupplösta digitalisat har fantastiska möjligheter att zooma och se detaljer i dokumentet som knappt är synliga för blotta ögat. Den teoretiska diskussionen kring dessa skillnader mellan original och digitalisat har först sent kommit igång på allvar, men frågans betydelse är central, inte minst om man betänker hur mycket uppmärksamhet materialitet och materiella aspekter ägnats inom de senaste decenniernas forskning.
Dessa skillnader medför samtidigt att digitalisatet kan erbjuda något mer och annat än originalet. Det kan verkligen till fullo utveckla sin potential som forskningsverktyg. Men att det är så, och var gränserna går för vad som kan göras, förstår faktiskt inte en användare som inte även känner originalet väl.

De tekniska möjligheter som kan tillkomma hos digitalisatet är många. Bland annat kan större mängder information extraheras med mer eller mindre automatiserade processer; maskin­läsning (OCR och HTR) tillåter för­enklad sökbarhet, och öppnar för metoder såsom name entity recognition och topic modeling; dessutom kan information länkas och delas, vilket ökar föremålets informativa potential. Pedagogiska verktyg som semantisk uppmärkning kan tillföra nya analytiska funktioner, och tidsmässiga lager av samma handskrift kan på skärm­en presenteras sida vid sida, eller förlorade fragment återförenas virtuellt. Större möjligheter till interaktion gör att användarna själva kan generera uppdaterad information. Det är med hänsyn till denna mångfald av möjligheter som forskningens verkliga behov behöver kartläggas. Inte minst gäller det metadatan.

Från ett användarperspektiv är det lätt att glömma bort att själva bildfilen bara är en del av den digitala reproduktionen. Till denna hör i regel också kontrollerad strukturell och deskriptiv metadata gällande originaldokumentet. Framför allt med hjälp av den senare finns möjligheter att generera mer information, till exempel statistisk data från ett eller flera liknande dokument, bland annat för visualiseringar. Det bör alltså betonas att skapande av högkvalitativ metadata är en mycket viktig del i digitaliseringsprocessen när den utförs för forskningsändamål. Ofta ställs nämligen de två mot varandra i den allmänna diskussionen, som om den ena kunde ersätta den andra. Men god metadata kompletterar digitalisatet med sådan information som den digitala bildfilen inte kan återskapa. Förutom givna uppgifter såsom titel, utgivare, utgivningsår och –ort, presenterade enligt särskilda standarder, kan det gälla sådana centrala dimensioner som föremålets format, storlek och vikt, dess material och historiska kontext. Dessutom har meta­datan mycket lång hållbarhet. Digitala filer kommer, mycket generöst räknat, att behöva ersättas med intervaller på 20–30 år, medan metadatans livslängd i princip är oändlig. Denna aspekt borde vara utomordentligt viktig i en sektor som ständigt bekymrar sig över bristande resurser.
Det betonas ofta att Sverige ligger långt efter övriga jämförbara länder när det gäller hur långt man kommit med digitaliseringen av sina biblioteksbestånd. Både Litteraturbankens arbete och de stora forskningsbibliotekens avsiktsförklaring för digitalisering av svenskt tryckt material, som presenterades för några månader sedan, har sin grund däri. Saken är dock att detsamma gäller katalogiseringen av bestånden i digitala format. Exempelvis finns svenskt 1500-tal utomordentligt väl beskrivet i Collijns tryckta bibliografi fram till år 1600, men digitala poster över det samlade materialet i Libris saknas alltjämt, trots att detta borde kunna ordnas relativt enkelt. Flera bibliotek i Sverige har fantastiska samlingar, även i en internationell jämförelse, men i Libris är katalog­posterna över dem oftast mycket rudi­mentära eller helt obefintliga. Retrospektiv digital katalogisering och digitalisering lider tyvärr av decennier av eftersatt arbete. Det är ur ett biblioteksperspektiv inte lätt att förstå varför detta prioriterats bort, men det är vad vi har att förhålla oss till, och när digitalisering nu ska utföras blir behovet av katalogposter akut. De behövs för att man ska kunna säga exakt vad det är man digitaliserat.

Det finns samtidigt uppenbara fördelar med att arbetet dröjt (om man bortser från att materialet haft en kraftigt minskad tillgänglighet under den tid som varit). Om Sverige hade startat de stora digitaliseringsprojekten när andra gjorde det, skulle det nu strax vara dags att göra om det hela på grund av den tekniska utvecklingen. Så skedde för Library of Congress i USA, som kring millennie­skiftet digitaliserade alla sina äldre tryckta böcker. För några år sedan fick emellertid allting göras om, eftersom den gamla bildkvaliteten var undermålig. Vid den retrospektiva katalogiseringen kan man också ha mycket nytta av att många andra kommit längre än vi, eftersom det är lätt att kopiera och återanvända information. Så visst har pengar sparats därigenom.
Men det är givet att det inte kan fortsätta på detta sätt. Digitalisering och digital katalogisering av det gemensamma kulturarvet är en självklar del av verksamheten för moderna bibliotek. Den avsiktsförklaring för digitalisering av det svenska trycket som kom för några månader sedan är därför mycket välkommen. Trots att det egentligen inte borde behöva sägas att stora svenska bibliotek har för avsikt att tillgängliggöra det svenska trycket digitalt – allt annat vore mycket märkligt – och att initiativet ännu verkar ofinansierat, vittnar det om en insikt om frågans aktualitet och trängande eftersatthet, samt att samarbete behövs som kan påskynda processen. Det är verkligen bättre sent än aldrig som gäller.

En förhoppning för framtiden, när frågan nu är på dagordningen igen, är att digitaliseringens möjligheter och begränsningar fortsätter att diskuteras bland forskare och i biblioteksvärlden. Vi menar att verklighetsfrånvända föreställningar om att digitalisatet kan ersätta originalet i själva verket hindrar digitaliseringen från att uppnå sin fulla potential. För att digitaliseringen ska ha ett långsiktigt värde, även i ett ekonomiskt avseende, förutsätts dessutom ett parallellt arbete med att tillföra hög­kvalitativ metadata.

Text: Peter Sjökvist och Sebastian Cöllen, Uppsala universitet

0 kommentarer

Senaste nytt

Reportage

Experten: Naiv bild av rysk propaganda i EU

Att Sverige värderar yttrandefriheten är något Ryssland utnyttjar och det finns en naivitet i Sverige och EU när det handlar om den ryska propagandan, säger Maryna Vorotyntseva, senior expert på Nato Stratcom. I dag talar hon på källkritikens dag.

13 mar 2024 • 3 min

MIK

Desinformation bör bemötas på biblioteken

Kampanjen om hur socialtjänsten kidnappar muslimska barn pågår fortfarande. Biblioteken är en bra plats att förebygga spridningen av falsk information, säger Linda Corsvall på Socialstyrelsen. ”Vi behöver klara av att ta samtalen.”

12 mar 2024 • 3 min

Nyheter

Firar 25 år med jubileumsbok

Google, Malmö högskola och därmed även det som numera heter Malmö universitetsbibliotek, alla föddes de 1998. Boken om det jubilerande biblioteket fungerar som ett kollektivt minne för medarbetarna.

6 mar 2024 • 3 min