Porträttbild på German Bender, programchef för arbetsmarknad och utbildning på Tankesmedjan Arena Idé.
German Bender

krönika Deepfakes gör att vi inte längre kan lita på rörliga bilder. Men har vi någonsin kunnat göra det? German Bender scrollar sig bakåt i historien och frågar sig varför vi så länge haft så stor tilltro till ett i grunden opålitligt medium.

Ibland roar och oroar jag mig med att titta på deepfakes. Det är datormanipulerade videor där en persons ansikte exempelvis bytts ut mot en annans, eller där man får en person att se annorlunda ut eller säga något den aldrig sagt.

Ett känt exempel är en fejkad men realistisk video på Barack Obama, där han bjuder på citat som ”President Trump is a total and complete dipshit”, ”fucked up dystopia” och ”stay woke, bitches”. Videon är två år gammal och går ganska enkelt att genomskåda om man vet att den är manipulerad. Men den tekniska utvecklingen går oerhört fort och i dag är det svårare att upptäcka en deepfake. Om fem år är det antagligen närmast omöjligt.

Ett annat exempel är en fascinerande deepfake där en Youtube-användare på sju dagar med gratisprogram lyckats föryngra Robert De Niro mycket mer realistiskt än vad regissören Martin Scorsese lyckades åstadkomma med en mångmiljonbudget i storfilmen The Irishman från i fjol. Samme youtuber gjorde nyligen om scener ur Solo: A Star Wars Story, där han bytt ut ansiktet på skådespelaren som spelar den yngre Han Solo mot Harrison Fords ansikte. Det är omöjligt att upptäcka manipulationen.

I en nypublicerad artikel testar New York Times reportrar algoritmer med artificiell intelligens för att skapa helt verklighetstrogna ansikten på människor som inte existerar. Du kan själva testa att skapa fejkade ansikten här.

Sådär kan man hålla på, exemplen på deepfakes blir allt fler och allt mer realistiska. Och då har vi inte ens nämnt den växande pornografiska subgenren där man byter ut porrskådisars ansikten mot kända skådespelares – eller varför inte sin expartners.

Faktum är att rörliga bilder och fotografier använts för att manipulera vårt verklighetsintryck ända sedan mediets födelse.

Föga förvånande börjar folk bli oroade. I boken Deepfakes: The Coming Infocalypse tecknar Nina Schick, tidigare politisk rådgivare åt Joe Biden och Nato, en dystopisk framtidsskildring där vi inte längre kan lita på rörliga bilder och där ”allting kan förnekas eftersom allting kan fejkas”. Det har hon nog rätt i.

Men nytt är det inte.

Faktum är att rörliga bilder och fotografier använts för att manipulera vårt verklighetsintryck ända sedan mediets födelse.

Själv insåg jag det när jag såg filmen Jurassic Park för första gången 1993. Man kan säga att det var då min fascination för deepfakes föddes. Jag var 17 år och det jag såg på filmduken skakade om mig i grunden.

Dinosaurier. På riktigt!

Jag trodde knappt mina ögon. Där var de, på film, lika levande och verkliga framför kameran som skådespelarna Sam Neill och Laura Dern när de nästan blir ihjältrampade av en Brachiosaurus i en scen. De vänliga djuren strövar majestätiskt fram på fälten, råmande som gigantiska kor.

I dag skulle en sådan filmscen inte ens vara värd att nämna i en tidningsspalt som den här, men när jag satt där i biosalongen för drygt 27 år var Jurassic Park det närmaste jag kommit att ifrågasätta min egen verklighetsuppfattning. Jag insåg direkt att vi hade klivit in i en annan värld.

Låt säga att regissören Steven Spielberg, i en genial PR-kupp ett år före filmens premiär, hade läckt ut ett kort klipp till CNN från en ”anonym källa” som sa att amerikanska forskare upptäckt dinosaurier djupt inne i djungeln någonstans. Då hade jag och många andra förmodligen trott på det. Så realistiska var bilderna och så starkt är verklighetsintrycket som filmmediet frammanar.

Men varför är verklighetsintrycket så starkt?

Jag blev så besatt av frågan att jag tre år senare skrev en uppsats i filmvetenskap för att besvara den. Förklaringen jag fann – om man bortser från det uppenbara i att film ”ser ut” och ”låter” som verkligheten – låg i filmmediets tekniska förutsättningar och hur de påverkade åskådarna när filmen uppfanns i slutet av 1800-talet.

I dag är ju rörlig bild oftast filmad med digitala kameror, men en gång i tiden var kamerorna laddade med optisk film som registrerade ljuset som flödade in genom kameralinsen. Filmen var, eller uppfattades som, ett avtryck av verkligheten. Ungefär på samma sätt som ett fotavtryck är ett tecken på att någon gått där. Inom filmteori kallas det filmens indexikalitet.

I ett föredrag på Vitterhetsakademien från 2016 talar professorn Astrid Söderbergh Widding om hur upplysningsidealen präglade den tidiga synen på filmmediet: ”För första gången kunde, genom filmen, världen registreras på ett vetenskapligt korrekt sätt och ett avtryck av verkligheten förmedlas i bild.” Men, frågar hon: ”till vilken verklighet?”

Problemet är ju inte filmmediets svårtyddhet, utan verklighetens.

Noga besett har ju filmens trovärdighet som verklighetsavtryck alltid varit en illusion. Vi har ljugit med film och fotografi långt innan film kunde manipuleras digitalt. Vilket även Nina Schick medger i sin bok. Ett av de mer välkända fallen är Josef Stalins retuschering av fotografier som visade hans politiska fiender. Stalin ville bokstavligt talat sudda ut misshagliga personer ur den ärofyllda historieskrivning han försökte skapa om sig själv och Sovjetunionen.

Ett mer närliggande och nutida exempel är Uppdrag Gransknings avslöjande från 2001 om hur polisen lagt på nytt ljud i videoklipp från Göteborgskravallerna, för att framställa situationen som mer hotfull för poliserna än den varit. De manipulerade klippen användes av åklagare i en rättegång där en 19-årig man dömdes till åtta månaders fängelse för bland annat våldsamt upplopp.

Det har aldrig varit viktigare att ställa grundläggande mediekritiska frågor

Men bilder behöver inte ens manipuleras tekniskt för att förvränga verkligheten. De kan berätta en osann historia ändå.

I den underskattade filmen Wag the Dog (även den med Robert De Niro) iscensätter en politisk konsult en propagandafilm om ett påhittat krig i Albanien för att avleda uppmärksamheten från den amerikanska presidentens sexuella närmanden mot en ung flicka. Filmen är inte tekniskt manipulerad, utan fejkad på så sätt att den är filmad i studio och skildrar ett fiktivt krig.

Även autentiska filmklipp kan förstås användas för att fara med osanning. Det finns ett otal exempel på hur mer eller mindre tendentiösa medier och myndigheter använt bilder tagna ur sitt sammanhang för att påstå saker som ligger i linje med deras egen agenda.

Nu satsas stora belopp på forskningsprojekt i bland annat Sverige och USA för att hitta sätt att avslöja deepfakes rent tekniskt. Givetvis har också övervakningskapitalismens främsta försvarare av Sanningen och Det Upplysta Samtalet (jag talar givetvis om Facebook) gett sig in i kampen mot deepfakes. Man kan ju bara föreställa sig vad som skulle ske om ogrundade rykten började spridas på plattformen …

Jag tror tyvärr att allt detta är mer eller mindre bortkastade pengar, som vore mycket mer väl investerade i utbildning och information om källkritik och sociala medier-etikett. Och det handlar inte bara om politiska budskap, där vi ändå har en lång historia av källkritik och relativt välfungerande journalistisk granskning. Jag är minst lika oroad över mikronivån: ganska snart blir det möjligt för vem som helst att göra realistiska deepfakes där du själv säger/gör något du aldrig sagt/gjort.

I takt med att deepfakes blir allt svårare och snart omöjliga att upptäcka, bör den insikten sjunka in hos oss alla. Vi måste helt enkelt bli än mer kritiska mediekonsumenter och betrakta rörliga bilder precis som all annan text.

Det har aldrig varit viktigare att ställa grundläggande mediekritiska frågor som: i vilket sammanhang och forum ser jag detta, vilken är källan, är det som skildras osannolikt, vem kan ha intresse av att sprida det, och så vidare. Till det kommer behovet av is i magen och en avvaktande hållning, att ta till sig nya uppgifter med eftertanke och inte reagera spontant och ogenomtänkt (särskilt inte på sociala medier).

Med det sagt vill jag inte tona ned de potentiella riskerna med deepfakes alltför mycket. De allra flesta av oss har svårt att inte reagera på påstått sanningsenliga filmskildringar av upprörande skeenden. Om stora grupper av människor börjar förledas av falska videoklipp kan konsekvenserna för demokratin givetvis bli allvarliga. Inte minst för att allt kommer kunna förnekas – även sanningen.

Samtidigt är konsekvenserna svåra att förutse. Vi människor är bra på att anpassa oss, kanske kommer vi utan större svårigheter att lära oss hantera en alltmer medialiserad och manipulerbar verklighet.

Några spaningar kanske man ändå kan våga sig på. Jag tror att ytan kommer bli allt viktigare: det som sägs officiellt, inför stor publik och i trovärdiga källor. Det som sägs – eller påstås ha sagts – bakom lyckta dörrar blir allt mindre trovärdigt, eftersom det blir svårare att granska och lättare att förneka det även om videoklipp skulle ”läcka ut”.

En annan tänkbar konsekvens är att agerande över tid kommer få ännu större betydelse än enstaka ord eller handlingar, jämfört med idag. Videoklipp av enstaka händelser som avviker från en persons tidigare handlingsmönster och åsikter blir vanskligare att lita på.

Men alla spekulationer om detta är som att skriva i vatten, eller snarare i en framstörtande flod. Både den tekniska och den samhälleliga utvecklingen går så fort och är så oförutsägbara att man bör ta alla förutsägelser med en stor nypa salt.

Att förutspå den tekniska utvecklingen, som jag tyckte mig kunna göra när jag såg Jurrasic Park för snart 30 år sedan, var egentligen inte särskilt svårt. Att förutspå vad som kommer ske de kommande 30 åren är betydligt svårare.

Under tiden kan vi scrolla vidare och kolla på allt fler och bättre deepfakes. Här finns några till.

 

German Bender är programchef på Arena Idé och doktorand vid Handelshögskolan