MEN ER DET IKKE …: Med Windows-programmet Fakeapp har mange det morsomt med å bytte ut ansikter i videoklipp. Her ser vi Nicolas Cage som Lois Lane. Foto: Ukjent/Giphycat
MEN ER DET IKKE …: Med Windows-programmet Fakeapp har mange det morsomt med å bytte ut ansikter i videoklipp. Her ser vi Nicolas Cage som Lois Lane. Foto: Ukjent/GiphycatVis mer

Ansikter og stemmer kan lett forfalskes

Nå kan du ikke tro på noe av det du ser eller hører på nett lenger

Kunstig intelligens gjør det skremmende enkelt å forfalske lyd og video.

Å manipulere bilder har lenge vært mulig med programmer som Photoshop og lignende, der man kan forfalske det opprinnelige innholdet ved å sette på ting som ikke var der, klippe bort objekter, bytte ut ansikter, fjerne kviser, gjøre folk tynnere og den slags.

De fleste av oss har derfor fått en innebygd radar når vi ser bilder på nett, der man en gang i blant blir kritisk og tenker at «det der må være manipulert».

Men nå må du være like kritisk til video og lyd også. Med stadig kraftigere maskinvare, samt utviklingen innenfor kunstig intelligens og maskinlæring, finnes det allerede i dag gode verktøy for å forfalske både lyd og video.

Og de kommer bare til å bli bedre.

Bytter ut ansikter i video

Å manipulere video har til nå vært en svært vanskelig og tidkrevende prosess, der man i praksis har vært nødt til å endre hvert eneste enkeltbilde i videoen, som det som regel finnes 24-30 av per sekund.

Men dette går langt enklere for seg når man setter en maskin til å gjøre jobben. Bare se på dette klippet, der ansiktet til Nicolas Cage er satt på Lois Lane i Supermann-filmen Man of Steel:

Ganske troverdig spør du oss, og dette er ikke laget av et profesjonelt filmstudio. Nei - skaperen har brukt Windows-programmet FakeApp, som er laget av Reddit-brukeren deepfakes.

Artikkelen fortsetter under annonsen

Trener systemet med bilder og video

Det fungerer ved at man samler inn en haug av bilder og videoer av personen man vil manipulere inn, og der man trener opp systemet til å forstå hvordan vedkommendes ansikt ser ut fra flere vinkler og lysforhold.

Dette kan ta timesvis selv med et kraftig grafikkort, men til slutt får man beregnet en modell for hvordan vedkommende ser ut, og som dernest kan settes inn i stedet for en annen persons ansikt i en video.

Litt på samme måte som ansiktsbyttingen i Snapchat og lignende apper, altså, men vesentlig mer sofistikert.

Gjengen i NRKBeta har prøvd ut appen og brukte et døgn på å trene den opp med klipp fra Side om Side, Ukens vinner og Presten, og resultatet ser du her, der Bjarte Tjøstheim har erstattet Jon Almaas' karakter Christian Kopperud i Side om Side:

Perfekt er det ikke, der man av og til kan skimte enkelte småfeil, men likefullt – dette beviser at det nå er veldig lett å forfalske hvem som er med i en video.

Og rundtom på nettet ser det ut til at det er porno som er hovedfokuset, der særlig kvinnelige skuespillere, presidentfruer og andre kjendiser blir manipulert inn i scener fra pornofilmer som fremstår høyst troverdige.

Men det er ikke bare ansikter som lett kan manipuleres. På tampen av fjoråret viste Nvidia hvordan de kunne generere andre værforhold i en video, eller gjøre om en video som var fanget på dagtid til en nattvideo.

Genererer en kopi av stemmen

På samme måte kan stemmer forfalskes. Tidligere i dag testet jeg ut tjenesten Lyrebird, som lar deg generere en stemmemodell basert på opptak du gjør med mikrofonen.

Lyrebird lar deg lese inn minst 30 setninger for å generere en stemmeprofil. Skjermbilde: Pål Joakim Pollen
Lyrebird lar deg lese inn minst 30 setninger for å generere en stemmeprofil. Skjermbilde: Pål Joakim Pollen Vis mer

I alt leste jeg inn 30 setninger fra skjermen (totalt cirka ett minutt), og når maskineriet hadde gjort sitt, kunne jeg lime inn skrevet tekst og få generet den som lydfil med min egen stemme. Her kan du høre et eksempel, der jeg bare limte inn et avsnitt fra en artikkel om vinranker fra The Verge.

Fortsatt litt robot-aktig, men om du kjenner meg, hører du nok at det er min stemme. Skaperne av tjenesten anbefaler at man bruker en mikrofon av god kvalitet (jeg brukte bare den som er innebygd i PC-en), og at man gjerne leser inn noen hundre setninger for optimalt resultat.

En kan videre se for seg at tjenesten kan lages slik at man bare kan laste inn video- eller lydklipp av en person som snakker og deretter stå fritt til å bytte ut budskapet med sitt eget.

Imponerende, men skummelt

Vi lar oss imponere av teknologier som FakeApp og Lyrebird, men samtidig betyr det at vi går en ganske skremmende fremtid i møte.

For – ikke bare er det lett å manipulere bilder. Det har også blitt lett å manipulere både stemmer og videoer, og det betyr at du som nettbruker bør bli stadig mer kritisk til medieinnhold på nett.

Det kan definitivt også åpne for nye måter å trakassere andre på. Det er ingenting som hindrer at kjendisene i de falske sex-videoene kan byttes ut med vanlige folk, og i en tid der mange har delt hundrevis av bilder av seg selv i sosiale medier, kan man enkelt samle inn nok materiale til å trene opp Fakeapp og lignende tjenester som garantert vil blomstre opp fremover.