Gammal källkritik otillräcklig

21 dec 2023 • 9 min

Beprövade metoder att granska text, bild och ljud är inte längre effektiva. AI gör det nödvändigt med nya sätt att värdera källor.

Det var för ett år sedan som ChatGPT tog världen med storm. Bara två månader efter lanseringen hade AI-chatboten över 100 miljoner användare. Den kraftfulla tekniken fanns plötsligt lättåtkomlig för vem som helst. Bara att logga in, ställa en fråga och få ett rimligt svar. Men tekniken bakom modellen är allt annat än rak och enkel – och det är en orsak till att det är så svårt att kritiskt källgranska AI-genererat material.
– För att verkligen förstå stora språkmodeller som ChatGPT måste man förstå att de inte alls fungerar på samma sätt som sökmotorer eller bibliotekskataloger. ChatGPT producerar ett svar utifrån språkliga mönster som baseras på enorma mängder text, säger Olof Sundin, professor vid Lunds universitet.

AI-språkmodeller som ChatGPT bygger på en självlärande teknik, och skapar sina textsvar ur vad som är mest sannolikt utifrån vad AI-tjänsten redan lärt sig från tidigare interaktioner och all inmatad data.

Den allra största utmaningen med ChatGPT är att det resultat som tjänsten levererar inte har några källor, så det går inte längre att bedriva källkritik på ett vanligt sätt.

Olof Sundin
Med hjälp av de instruktioner som användaren ger kan ChatGPT leverera en text från en viss genre, med en specifik målgrupp, syfte och tonalitet. Men om innehållet i prosan är sant eller falskt tar tjänsten inte ansvar för. AI-språk­tjänster kan hallucinera, det vill säga,
hitta på fakta – och ChatGPT har blivit känd för att till och med hallucinera ihop källor. Tidningen The Guardian har till exempel berättat om påhittade källhän­visningar till deras sajt.
– Den allra största utmaningen med ChatGPT är att det resultat som tjänsten levererar inte har några källor, så det går inte längre att bedriva källkritik på ett vanligt sätt, säger Olof Sundin.

Det var när studenter började använda sig av ChatGPT som debatten väcktes inom akademin om fusk och källmaterial kopplat till generativ AI. Därefter har flera av de nya AI-tjänsterna fått kritik – och blivit stämda av konstnärer – för att strunta i upphovsrättslagstiftningen när de samlar in stora datamängder till kraftfulla AI-verktyg.
Flera mediehus har stoppat den så kallade AI-skrapningen, insamlingen av deras texter och material. Till exempel vill inte Aftonbladet att OpenAI (som äger ChatGPT) samlar in deras artiklar – samtidigt som tidningen använder AI-­teknik för att göra sammanfattningar av texter.

Karolina Andersdotter. Foto: CC BY 4.0 Hilda Forss

Vid sidan av upphovsrättsdebatten behövs en diskussion om den personliga integriteten. Det tycker Karolina Andersdotter som är doktorand i informations­vetenskap vid Åbo Akademi i Finland och tjänstledig universitetsbibliotekarie i Uppsala.
– De stora datamängderna som AI-­modellerna utgår ifrån kommer ju från information som människor har delat med sig av, säger Karolina Andersdotter.
Hon menar att det finns en naivitet i Sverige när det kommer till data­insamling, integritet och digitalisering.
– Problemet är ju att de stora AI-tjänst­erna ägs av företag. Det finns ingen öppen AI. Om det fanns en AI motsvarande bibliotekstjänsten Open Library skulle jag gärna använda det.

För att få tillgång till många AI-tjänster behöver användarna godkänna om­fattande samtyckesformulär, men debatten kring AI och personlig integritet har ändå inte tagit fart. Karolina Andersdotter ser detta som ytterligare ett skäl för biblioteken att förmedla kunskap på området.
I augusti i år skrev hon en essä i Biblioteksbladet om vikten av kunskap om AI på biblioteken.
– Biblioteken har en roll i skärningspunkten mellan teknik, samhälle och medborgare. De är knutpunkten där­emellan. I synnerhet de som har mindre kunskaper vänder sig dit för att få tag på information, säger Karolina Andersdotter.

Biblioteken har en roll i skärningspunkten mellan teknik, samhälle och medborgare. De är knutpunkten där­emellan.

Karolina Andersdotter
Hon betonar att hon inte ser kunskap om AI som en enskild kunnighet inom Mik, medie- och informationskunnighet, utan anser att AI kommer in på alla begreppets underområden: mediekunnighet, bildkunnighet, datakunnighet och så vidare.
– Det går inte att förhålla sig till något medium utan att tänka på att här kan det finnas en AI-tillämpning.
I årets upplaga av Internetstiftelsens rapport Svenskarna och internet framgår det att tre av tio svenskar har använt AI-­verktyg det senaste året. Samtidigt tror nästan var tredje svensk att AI kommer att ha en negativ påverkan på fram­tiden. ”Är det ingen som kommer ihåg Terminator-filmerna?” undrar en person i ett fritextsvar. Bilden av AI som ett existentiellt hot skrämmer många.
– Man blandar ihop så kallad artificial general intelligence, AGI, med de vanliga AI-tillämpningarna som vi har i dag, som maskininlärning och sannolikhetsmetoder. På det sättet trappar man upp tonläget i debatten så att hårdare regleringar och lagstiftningar känns helt rimliga, men det är också farligt. Vi kan få ett auktoritärt samhälle rätt snabbt om vi går den vägen, kommenterar Jutta Haider, professor i biblioteks- och informationsvetenskap vid Högskolan i Borås. Hon fortsätter:
– Man riskerar också att missa reglering av faktiska problem samtidigt som techjättarnas monopolställning befästs ytterligare.
Hon anser att bibliotekarier spelar en viktig roll för att avmystifiera AI.
– Allmänheten behöver en nyanserad bild av vad AI är och inte är.

AI-konstnären Annika Nordenskiöld har skapat alla bilder i reportaget.

På det sättet trappar man upp tonläget i debatten så att hårdare regleringar och lagstiftningar känns helt rimliga, men det är också farligt. Vi kan få ett auktoritärt samhälle rätt snabbt om vi går den vägen.

Jutta Haider
Det är lätt att tro att AI är ett nytt fenomen, men redan på 1950-talet blev det en akademisk gren. Det senaste året är det generativ AI, tjänster som kan generera, skapa innehåll som ljud, bild och text, som har fått stor uppmärksamhet. Inte minst för att det råder oro om att generativ AI kan blåsa upp desinformationskampanjer till en aldrig tidigare skådad skala, med falska konton och oändliga mängder information. Det finns alltså poänger med att hålla isär vilka texter, bilder, filmer och ljudklipp som är AI-genererade och vilka som har en mänsklig upphovsperson. Men det är inte helt enkelt, enligt Carl Heath, senior forskare på forskningsinstitutet Rise och återkommande skribent i Biblioteksbladet – och det blir bara svårare.
Redan i mars kom en amerikansk forskargrupp fram till att det behövs en ”specifik dialekt” för språkmodeller som ChatGPT för att människor ska kunna göra distinktioner mellan text genererad av AI och text skriven av människor. Forskarna drog slutsatsen efter att de låtit 4 600 försökspersoner ta del av 7 600 person­presentationer. Bara i 50–52 procent av fallen kunde försökspersonerna avgöra vilken text som var genererad av AI och vilken som var skriven av en av människa.
– Den forskning jag har sett de senaste månaderna visar att inte heller experter kan avgöra om en text är skapad av en människa eller en maskin, säger Carl Heath.
Även syntetiska röster gjorda med AI-teknik, blir allt svårare att avslöja.
– Det finns vissa mönster i AI-genererat ljud som avslöjar att det är skapat digitalt, men samma mönster kan också komma från ett redigeringsprogram.

Carl Heath.

Enligt Carl Heath är det fortfarande rätt enkelt att avslöja om bilder och filmer har skapats med AI. Appar för att göra bilder är till exempel ofta sämre på att rita händer, har svårt med detaljer och suddar gärna ut oklarheter som textskyltar i bakgrunden. Bilderna får även ett visst ”generiskt” eller konstnärligt uttryck. Verktygen hanterar inte heller alltid tyngdlagen på ett sannolikt sätt. Ibland finns det svävande föremål i AI-bilder.
– I de flesta fall kommer de flesta att kunna skilja på en AI-baserad och en icke-AI-baserad bild. Men det gäller inte alla AI-bilder, under alla omständigheter, säger Carl Heath.
För att dra resonemanget ännu längre ställer han frågan, vad är ens en AI-genererad bild? Såväl Googles sökmotor som kameran i en mobiltelefon bär redan på AI-komponenter.
– Nu håller också Google på att släppa en ny kamera där du redan när du tar fotot kan manipulera bilden med AI-teknik.
En blomma som står fel kan flyttas och en gråtande person kan i stället få ett leende – och det görs redan i fotoappen, innan själva fotot tas.
– Det är en AI-bild som skapas, men den är också en amplifierad bild av en verklighet som fanns där och då. Eftersom AI-manipuleringen redan finns i fotot så kommer det inte längre att gå att tanka ut foton ur mobiltelefonen och använda dem som bevis. För du kan inte säga till polisen att de här bilderna faktiskt har återgett sanningen eller någon form av objektiv verklighet, säger Carl Heath.

På senare tid har därtill flera AI-tjänster tillkommit som kan göra videoklipp på andra språk. Ladda upp en filmsekvens där du berättar något, AI-tjänsten transkriberar och översätter och skapar ett nytt klipp där du till exempel pratar japanska. Nyligen publicerades SD-ledaren Jimmie Åkessons tal till nationen, översatt till arabiska med tekniken.

Ett annat orosmoment med den snabba utvecklingen är så kallad algorithmic bias, fördomsfullhet eller partiskhet, som är inbyggd i AI-tjänsternas programmering. De stora bild- och språktjänsterna är baserade på oändligt stora datamängder, ofta insamlade från internet. Det betyder att tjänsterna baserar sina svar på innehåll som människor redan skapat på nätet – och de fördomar och felaktigheter som vi redan spridit där finns så att säga med i AI-tjänsternas DNA. Det här är något de stora AI-bolagen arbetar för att programmera bort, men det är inte helt lätt. En AI är aldrig bättre än de data som den är baserat på.
Nyligen skrev forskare från Oxford i den medicinska tidskriften The Lancet om svårigheterna med att få text-till-bild-tjänsten Midjourney att skapa bilder efter instruktionen, eller den så kallade prompten: ”svarta afrikanska läkare ger vård till vita lidande barn”. Trots tydliga instruktioner producerade verktyget bilder av ljushyade läkare, och barnen som fick vård var alltid mörkhyade.
När Midjourney väl gjorde bilder av icke-vita läkare så fanns också exotiska djur som giraffer med i motiven. De inbyggda fördomarna var för starka för att tjänsten skulle klara att följa instruktionerna.
”För att reda ut denna fördomsfullhet är det viktigt att nämna att AI lär sig genom att absorbera befintliga bilder som finns tillgängliga online”, skriver forskarna i sin essä.

Varför bör bibliotekarier sätta sig in i den nya tekniken?
– Om man ska förhålla sig till sin samtid så behöver man förstå den teknik som finns i samtiden. Och AI är en teknik som både skapar stora utmaningar och problem och som också erbjuder många möjligheter. Inte minst när det kommer till forskning, analys, sökning, textbearbetning och tillgänglighet, säger Carl Heath.
Han uppmanar alla bibliotekarier att prova AI-teknik för att få en bättre förståelse för den.
– Det är bara med kunskap som du kan motverka de negativa konsekvenserna av AI. Och det är bara med kunskap som du kan ta vara på möjligheterna med den.

AI-genererad bild skapad av Annika Nordenskiöld.

Många varnar för att desinformationen kommer att öka lavinartat när produktionen av AI-genererat material ökar. Det är ingen svår slutsats att dra att behovet av medie- och informationskunnighet kommer att växa. Och även om den AI-genererade desinformationen ännu inte har slagit igenom, så har AI-explosionen av innehåll börjat. Redan i maj hade AI-appen Boomy producerat 14,4 miljoner låtar, vilket ska motsvara 13 procent av all musik i världen.
– Det kommer att bli en explosion av innehåll överhuvudtaget, säger Mathias Cederholm som länge har bevakat frågor rörande källkritik och fejkade nyheter.
Han är disputerad i historia, driver Facebookgruppen Källkritik, fake news och faktagranskning och håller föreläsningar och utbildningar om bland annat Mik.
På Amazon finns det redan flera AI-­skrivna böcker. Näthandlaren har lagt in en regel om att det ska stå om boken är AI-genererad.
– Men en oseriös aktör kan ju bara strunta i det – och sådana texter blir ju bara bättre och bättre, säger Mathias Cederholm.
Nyligen avslöjade mediesajten 404, med hjälp av AI-koll-appen ZeroGPT, att flera av Amazons svampguider är AI-generade.
– De hade jättedåliga tips som var direkt hälsovådliga. Vi behöver ha ett bättre system för att kvalitetssäkra text – och inte minst böcker.

Kan en AI-skriven svampguide komma in i bibliotekssamlingarna?
–Jag tror att svenska bibliotek kommer att behöva bli lite försiktiga med vad de plockar in – och jag tror att det kommer att skapas fler hybridböcker där folk blandar sin egenskrivna text med AI-genererad, och sedan ger ut boken i eget namn.

Det kommer att bli allt svårare att upprätthålla gränsdragningarna mellan vad som är mänskligt och datagenererat. Vi kommer att få tänka om när det gäller vad som är autentiskt och konst och mänskligt skapat.

Mathias Cederholm
Det som kommer att hända framöver, enligt Mathias Cederholm, är att vi snart möter AI överallt. Vi kommer att ha AI-teknik i våra egna ordhandlings- och bildprogram. Det kommer att finnas en chatbot på varje sajt som är byggd på en generativ AI. Det kommer nya AI-applikationer som är stramare med olika riktningar.
–Det är också en värld man måste ha koll på och se om den håller måttet. Blir det bra saker så kommer de att vara väldigt användbara, säger Mathias Cederholm.
AI-verktygen kommer också att bli bättre och mer trovärdiga.
– Det har ju gått väldigt fort och AI kommer att finnas överallt i den digitala världen, men det finns fortfarande ingen internationell eller nationell infrastruktur för att bedöma och testa dem.
Mathias Cederholm förutspår att AI-verktyg blir en naturlig del av bibliotekariers vardag och att så kallad prompt engineering, det vill säga kunskap om att ge AI-verktyg instruktioner, blir en naturlig del av Mik.

Samtidigt blir AI-verktyg allt bättre på att instruera sig själva, i takt med att AI:t lär sig mer.
– Det kommer att bli allt svårare att upprätthålla gränsdragningarna mellan vad som är mänskligt och datagenererat. Vi kommer att få tänka om när det gäller vad som är autentiskt och konst och mänskligt skapat. Folk gör jättekul grejer med AI-teknik. Men ju mer AI-innehåll som finns på nätet desto mer kommer AI att övas på AI-genererat innehåll. Det blir något slags reproduktion av AI-genererat material – och frågan är ju vad det kommer att leda till på sikt.

Artikeln publicerades först i Biblioteksbladet nummer 4 2023, Numret om AI.

Läs också ››
AI-konstnären Annika Nordenskiöld: ”Jag trodde aldrig jag skulle få uppleva en ny konstform i mitt liv”

AI-genererad bild skapad av Annika Nordenskiöld.

0 kommentarer

Senaste nytt

Skolbibliotek

Ny lag om skolbibliotek på väg

Elever ska som regel ha tillgång till ett skolbibliotek på sin skola. Och det ska vara bemannat av utbildade bibliotekarier. Det skriver regeringen i det lagförslag som nu skickas till Lagrådet.

17 jun 2024 • 2 min

Nyheter

En hel dag om bibliotek i Almedalen

Under rubriken Biblioteksarenan ägnas en hel dag av Almedalsveckan till samtal om bibliotek. Bland panellisterna finns Kajsa Ravin, Göran Arrius, Brit Stakston och Silvia Ernhagen.

17 jun 2024 • < 1 min

Reportage

Bytte socialtjänsten mot biblioteket

Efter 15 år i socialtjänsten började Gabriella Andersson för tre år sedan att utbilda sig till bibliotekarie. Nu tar hon examen. ”Jag har fått en djupare förståelse för bredden i det här yrket.”

14 jun 2024 • 2 min

Reportage

Ett kulturarv med växande hål

Medieutvecklingen är blixtsnabb, lagarna föråldrade, Kungliga biblioteket ligger efter – och frågor om framtiden möts med politisk tystnad. Samtidigt försöker 13 personer bevara fler minnen av 2020-talet.

7 jun 2024 • 9 min