Gammal källkritik otillräcklig
21 dec 2023 • 9 min
Beprövade metoder att granska text, bild och ljud är inte längre effektiva. AI gör det nödvändigt med nya sätt att värdera källor.
AI-genererad bild.
Det var för ett år sedan som ChatGPT tog världen med storm. Bara två månader efter lanseringen hade AI-chatboten över 100 miljoner användare. Den kraftfulla tekniken fanns plötsligt lättåtkomlig för vem som helst. Bara att logga in, ställa en fråga och få ett rimligt svar. Men tekniken bakom modellen är allt annat än rak och enkel – och det är en orsak till att det är så svårt att kritiskt källgranska AI-genererat material.
– För att verkligen förstå stora språkmodeller som ChatGPT måste man förstå att de inte alls fungerar på samma sätt som sökmotorer eller bibliotekskataloger. ChatGPT producerar ett svar utifrån språkliga mönster som baseras på enorma mängder text, säger Olof Sundin, professor vid Lunds universitet.
AI-språkmodeller som ChatGPT bygger på en självlärande teknik, och skapar sina textsvar ur vad som är mest sannolikt utifrån vad AI-tjänsten redan lärt sig från tidigare interaktioner och all inmatad data.
Den allra största utmaningen med ChatGPT är att det resultat som tjänsten levererar inte har några källor, så det går inte längre att bedriva källkritik på ett vanligt sätt.
hitta på fakta – och ChatGPT har blivit känd för att till och med hallucinera ihop källor. Tidningen The Guardian har till exempel berättat om påhittade källhänvisningar till deras sajt.
– Den allra största utmaningen med ChatGPT är att det resultat som tjänsten levererar inte har några källor, så det går inte längre att bedriva källkritik på ett vanligt sätt, säger Olof Sundin.
Det var när studenter började använda sig av ChatGPT som debatten väcktes inom akademin om fusk och källmaterial kopplat till generativ AI. Därefter har flera av de nya AI-tjänsterna fått kritik – och blivit stämda av konstnärer – för att strunta i upphovsrättslagstiftningen när de samlar in stora datamängder till kraftfulla AI-verktyg.
Flera mediehus har stoppat den så kallade AI-skrapningen, insamlingen av deras texter och material. Till exempel vill inte Aftonbladet att OpenAI (som äger ChatGPT) samlar in deras artiklar – samtidigt som tidningen använder AI-teknik för att göra sammanfattningar av texter.
Vid sidan av upphovsrättsdebatten behövs en diskussion om den personliga integriteten. Det tycker Karolina Andersdotter som är doktorand i informationsvetenskap vid Åbo Akademi i Finland och tjänstledig universitetsbibliotekarie i Uppsala.
– De stora datamängderna som AI-modellerna utgår ifrån kommer ju från information som människor har delat med sig av, säger Karolina Andersdotter.
Hon menar att det finns en naivitet i Sverige när det kommer till datainsamling, integritet och digitalisering.
– Problemet är ju att de stora AI-tjänsterna ägs av företag. Det finns ingen öppen AI. Om det fanns en AI motsvarande bibliotekstjänsten Open Library skulle jag gärna använda det.
För att få tillgång till många AI-tjänster behöver användarna godkänna omfattande samtyckesformulär, men debatten kring AI och personlig integritet har ändå inte tagit fart. Karolina Andersdotter ser detta som ytterligare ett skäl för biblioteken att förmedla kunskap på området.
I augusti i år skrev hon en essä i Biblioteksbladet om vikten av kunskap om AI på biblioteken.
– Biblioteken har en roll i skärningspunkten mellan teknik, samhälle och medborgare. De är knutpunkten däremellan. I synnerhet de som har mindre kunskaper vänder sig dit för att få tag på information, säger Karolina Andersdotter.
Biblioteken har en roll i skärningspunkten mellan teknik, samhälle och medborgare. De är knutpunkten däremellan.
– Det går inte att förhålla sig till något medium utan att tänka på att här kan det finnas en AI-tillämpning.
I årets upplaga av Internetstiftelsens rapport Svenskarna och internet framgår det att tre av tio svenskar har använt AI-verktyg det senaste året. Samtidigt tror nästan var tredje svensk att AI kommer att ha en negativ påverkan på framtiden. ”Är det ingen som kommer ihåg Terminator-filmerna?” undrar en person i ett fritextsvar. Bilden av AI som ett existentiellt hot skrämmer många.
– Man blandar ihop så kallad artificial general intelligence, AGI, med de vanliga AI-tillämpningarna som vi har i dag, som maskininlärning och sannolikhetsmetoder. På det sättet trappar man upp tonläget i debatten så att hårdare regleringar och lagstiftningar känns helt rimliga, men det är också farligt. Vi kan få ett auktoritärt samhälle rätt snabbt om vi går den vägen, kommenterar Jutta Haider, professor i biblioteks- och informationsvetenskap vid Högskolan i Borås. Hon fortsätter:
– Man riskerar också att missa reglering av faktiska problem samtidigt som techjättarnas monopolställning befästs ytterligare.
Hon anser att bibliotekarier spelar en viktig roll för att avmystifiera AI.
– Allmänheten behöver en nyanserad bild av vad AI är och inte är.
På det sättet trappar man upp tonläget i debatten så att hårdare regleringar och lagstiftningar känns helt rimliga, men det är också farligt. Vi kan få ett auktoritärt samhälle rätt snabbt om vi går den vägen.
Redan i mars kom en amerikansk forskargrupp fram till att det behövs en ”specifik dialekt” för språkmodeller som ChatGPT för att människor ska kunna göra distinktioner mellan text genererad av AI och text skriven av människor. Forskarna drog slutsatsen efter att de låtit 4 600 försökspersoner ta del av 7 600 personpresentationer. Bara i 50–52 procent av fallen kunde försökspersonerna avgöra vilken text som var genererad av AI och vilken som var skriven av en av människa.
– Den forskning jag har sett de senaste månaderna visar att inte heller experter kan avgöra om en text är skapad av en människa eller en maskin, säger Carl Heath.
Även syntetiska röster gjorda med AI-teknik, blir allt svårare att avslöja.
– Det finns vissa mönster i AI-genererat ljud som avslöjar att det är skapat digitalt, men samma mönster kan också komma från ett redigeringsprogram.
Enligt Carl Heath är det fortfarande rätt enkelt att avslöja om bilder och filmer har skapats med AI. Appar för att göra bilder är till exempel ofta sämre på att rita händer, har svårt med detaljer och suddar gärna ut oklarheter som textskyltar i bakgrunden. Bilderna får även ett visst ”generiskt” eller konstnärligt uttryck. Verktygen hanterar inte heller alltid tyngdlagen på ett sannolikt sätt. Ibland finns det svävande föremål i AI-bilder.
– I de flesta fall kommer de flesta att kunna skilja på en AI-baserad och en icke-AI-baserad bild. Men det gäller inte alla AI-bilder, under alla omständigheter, säger Carl Heath.
För att dra resonemanget ännu längre ställer han frågan, vad är ens en AI-genererad bild? Såväl Googles sökmotor som kameran i en mobiltelefon bär redan på AI-komponenter.
– Nu håller också Google på att släppa en ny kamera där du redan när du tar fotot kan manipulera bilden med AI-teknik.
En blomma som står fel kan flyttas och en gråtande person kan i stället få ett leende – och det görs redan i fotoappen, innan själva fotot tas.
– Det är en AI-bild som skapas, men den är också en amplifierad bild av en verklighet som fanns där och då. Eftersom AI-manipuleringen redan finns i fotot så kommer det inte längre att gå att tanka ut foton ur mobiltelefonen och använda dem som bevis. För du kan inte säga till polisen att de här bilderna faktiskt har återgett sanningen eller någon form av objektiv verklighet, säger Carl Heath.
På senare tid har därtill flera AI-tjänster tillkommit som kan göra videoklipp på andra språk. Ladda upp en filmsekvens där du berättar något, AI-tjänsten transkriberar och översätter och skapar ett nytt klipp där du till exempel pratar japanska. Nyligen publicerades SD-ledaren Jimmie Åkessons tal till nationen, översatt till arabiska med tekniken.
Ett annat orosmoment med den snabba utvecklingen är så kallad algorithmic bias, fördomsfullhet eller partiskhet, som är inbyggd i AI-tjänsternas programmering. De stora bild- och språktjänsterna är baserade på oändligt stora datamängder, ofta insamlade från internet. Det betyder att tjänsterna baserar sina svar på innehåll som människor redan skapat på nätet – och de fördomar och felaktigheter som vi redan spridit där finns så att säga med i AI-tjänsternas DNA. Det här är något de stora AI-bolagen arbetar för att programmera bort, men det är inte helt lätt. En AI är aldrig bättre än de data som den är baserat på.
Nyligen skrev forskare från Oxford i den medicinska tidskriften The Lancet om svårigheterna med att få text-till-bild-tjänsten Midjourney att skapa bilder efter instruktionen, eller den så kallade prompten: ”svarta afrikanska läkare ger vård till vita lidande barn”. Trots tydliga instruktioner producerade verktyget bilder av ljushyade läkare, och barnen som fick vård var alltid mörkhyade.
När Midjourney väl gjorde bilder av icke-vita läkare så fanns också exotiska djur som giraffer med i motiven. De inbyggda fördomarna var för starka för att tjänsten skulle klara att följa instruktionerna.
”För att reda ut denna fördomsfullhet är det viktigt att nämna att AI lär sig genom att absorbera befintliga bilder som finns tillgängliga online”, skriver forskarna i sin essä.
Varför bör bibliotekarier sätta sig in i den nya tekniken?
– Om man ska förhålla sig till sin samtid så behöver man förstå den teknik som finns i samtiden. Och AI är en teknik som både skapar stora utmaningar och problem och som också erbjuder många möjligheter. Inte minst när det kommer till forskning, analys, sökning, textbearbetning och tillgänglighet, säger Carl Heath.
Han uppmanar alla bibliotekarier att prova AI-teknik för att få en bättre förståelse för den.
– Det är bara med kunskap som du kan motverka de negativa konsekvenserna av AI. Och det är bara med kunskap som du kan ta vara på möjligheterna med den.
Många varnar för att desinformationen kommer att öka lavinartat när produktionen av AI-genererat material ökar. Det är ingen svår slutsats att dra att behovet av medie- och informationskunnighet kommer att växa. Och även om den AI-genererade desinformationen ännu inte har slagit igenom, så har AI-explosionen av innehåll börjat. Redan i maj hade AI-appen Boomy producerat 14,4 miljoner låtar, vilket ska motsvara 13 procent av all musik i världen.
– Det kommer att bli en explosion av innehåll överhuvudtaget, säger Mathias Cederholm som länge har bevakat frågor rörande källkritik och fejkade nyheter.
Han är disputerad i historia, driver Facebookgruppen Källkritik, fake news och faktagranskning och håller föreläsningar och utbildningar om bland annat Mik.
På Amazon finns det redan flera AI-skrivna böcker. Näthandlaren har lagt in en regel om att det ska stå om boken är AI-genererad.
– Men en oseriös aktör kan ju bara strunta i det – och sådana texter blir ju bara bättre och bättre, säger Mathias Cederholm.
Nyligen avslöjade mediesajten 404, med hjälp av AI-koll-appen ZeroGPT, att flera av Amazons svampguider är AI-generade.
– De hade jättedåliga tips som var direkt hälsovådliga. Vi behöver ha ett bättre system för att kvalitetssäkra text – och inte minst böcker.
Kan en AI-skriven svampguide komma in i bibliotekssamlingarna?
–Jag tror att svenska bibliotek kommer att behöva bli lite försiktiga med vad de plockar in – och jag tror att det kommer att skapas fler hybridböcker där folk blandar sin egenskrivna text med AI-genererad, och sedan ger ut boken i eget namn.
Det kommer att bli allt svårare att upprätthålla gränsdragningarna mellan vad som är mänskligt och datagenererat. Vi kommer att få tänka om när det gäller vad som är autentiskt och konst och mänskligt skapat.
–Det är också en värld man måste ha koll på och se om den håller måttet. Blir det bra saker så kommer de att vara väldigt användbara, säger Mathias Cederholm.
AI-verktygen kommer också att bli bättre och mer trovärdiga.
– Det har ju gått väldigt fort och AI kommer att finnas överallt i den digitala världen, men det finns fortfarande ingen internationell eller nationell infrastruktur för att bedöma och testa dem.
Mathias Cederholm förutspår att AI-verktyg blir en naturlig del av bibliotekariers vardag och att så kallad prompt engineering, det vill säga kunskap om att ge AI-verktyg instruktioner, blir en naturlig del av Mik.
Samtidigt blir AI-verktyg allt bättre på att instruera sig själva, i takt med att AI:t lär sig mer.
– Det kommer att bli allt svårare att upprätthålla gränsdragningarna mellan vad som är mänskligt och datagenererat. Vi kommer att få tänka om när det gäller vad som är autentiskt och konst och mänskligt skapat. Folk gör jättekul grejer med AI-teknik. Men ju mer AI-innehåll som finns på nätet desto mer kommer AI att övas på AI-genererat innehåll. Det blir något slags reproduktion av AI-genererat material – och frågan är ju vad det kommer att leda till på sikt.
Artikeln publicerades först i Biblioteksbladet nummer 4 2023, Numret om AI.
Läs också ››
AI-konstnären Annika Nordenskiöld: ”Jag trodde aldrig jag skulle få uppleva en ny konstform i mitt liv”
Senaste nytt
Sluta tvivla – hoten mot demokratin är på riktigt
"Är inte de här som kallar sig nazister egentligen bara några få knäppgökar?", undrade en besökare nyligen när Jan Scherman besökte biblioteket i Arboga. Den här krönikan är hans svar på frågan.
16 sep 2024 • 3 min
Urholkning av budgetar för public service oroar
En oroväckande urholkning av budgeten för public service lyfts fram i remissvar till regeringens utredning om public services uppdrag.
13 sep 2024 • 2 min
Efter hat och hot: nu läser dragqueens sagor i riksdagen
Den 24 september läser teatersällskapet Bland drakar och dragqueens sagor i riksdagens andrakammarsal. Alla ledamöter är inbjudna. Initiativtagare är Jan Jönsson (L), oppositionsborgarråd i Stockholm, och organisationen Civil Rights Defenders, och riksdagens tvärpolitiska hbtqi-nätverk står för inbjudan.
12 sep 2024 • 2 min
De är höstens krönikörer
Biblioteksbladet vill att fler personliga och initierade röster med ett ärende ska höras. Miriam Nauri och Jan Scherman är höstens krönikörer.
11 sep 2024 • < 1 min
Boktips på nytt sätt
Vilken bok önskar du att du kunde läsa igen som om det var för första gången? Sandra Johnsons fråga gav hundratals svar och inspirerade Åsa Nilsson på Flens bibliotek till ett nytt sätt att ge besökarna boktips.
10 sep 2024 • 4 min
Årets pristagare: ”Jag har visat dem vad ett skolbibliotek kan vara”
Hur lyckas man med skolbiblioteket? Stick ut hakan och visa vad en bibliotekarie kan erbjuda, säger Felix Sjögren på Årets skolbibliotek.
9 sep 2024 • 3 min
Symbolisk timme för läsning
På söndag är det FN:s läskunnighetsdag och mellan klockan sju och åtta på kvällen infaller Lästimmen, ”Read Hour”. En symbolisk timme för att uppmärksamma vikten av läsning, som i år utökas till en hel helg.
6 sep 2024 • 2 min
Svensk kommitté skapad för att skydda kulturarvet
Säkerhetsläget i Europa ställer nya krav på kunskap om kulturarvet. I dagarna bildas en nationell kommitté i Sverige för att skydda kulturarvet.
5 sep 2024 • < 1 min
Ett folkbibliotek för alla – vad betyder det?
Konflikter om vem biblioteket ska vara till för blir ofta en antingen-eller-fråga om huruvida neutralitet är möjlig, skriver doktoranden Anne-Sofie Elbrønd Nissen. ”Genom att fokusera på när och hur konkreta aktiviteter bidrar till att göra biblioteket till en plats för alla blir det möjligt att ha mer nyanserade diskussioner om dess demokratiska roll.”
4 sep 2024 • 5 min
Efter hackerattacken: KB lär av brittiska erfarenheter
Tio månader efter ransomwareattacken mot British Library är flera fysiska och digitala arkiv fortfarande stängda. ”Det finns ingen silver bullet som kan rädda och försvara oss”, säger KB:s it-chef om händelsen.
3 sep 2024 • 3 min
Prischanser för Biblioteksbladet
Nomineringar till Publishingpriset i två kategorier kan ge åtråvärda prisstatyetter senare i höst. ”Glädjande att ansträngningarna uppmärksammas”, säger Biblioteksbladets chefredaktör Thord Eriksson.
2 sep 2024 • < 1 min
Prisat skolbibliotek ”fullt integrerat”
Skolbiblioteket på Nydalaskolan i Malmö har gått från att vara en separat enhet till att vara helt integrerad i skolverksamheten. Nu utnämns det till Årets skolbibliotek.
2 sep 2024 • < 1 min
0 kommentarer