KI brengt Mona Lisa tot leven

Zag het er zo uit als de mysterieuze glimlach van haar lippen gleed en ze begon te praten?

Deepfakes – met behulp van KI gegenereerde neppe video- of audiofragmenten – zien we de laatste tijd regelmatig opduiken. Een bekend voorbeeld is onderstaand filmpje waarin Barack Obama een aantal opmerkelijke uitspraken doet.

In werkelijkheid heeft Obama deze dingen nooit gezegd. De beelden zijn – met behulp van kunstmatige intelligentie – gemaakt. Het maken van zo’n filmpje is nog niet zo gemakkelijk. Om tot overtuigende beelden te komen, moet een kunstmatig intelligent systeem eerst een enorme dataset aan beelden – van in dit geval Obama – bestuderen.

Handvol beelden
Tenminste: dat was tot voor kort zo. In een nieuw paper – dat nog peer-review moet ondergaan – maken wetenschappers namelijk bekend dat ze hetzelfde nu kunnen doen met slechts een handvol beelden.

Hoe werkt het?
In onderstaand filmpje wordt het haarfijn uitgelegd. Waar het eigenlijk op neerkomt, is dat onderzoekers de KI eerst loslaten op een enorme database met daarin beelden van bewegende gezichten. Zo leert het systeem hoe menselijke gezichten normaliter bewegen, waarbij de focus ligt op herkenningspunten die elk gezicht heeft (face landmarks genoemd): de ogen, neus en mond bijvoorbeeld. Vervolgens kan de KI met al die kennis op zak een bewegend beeld genereren van een gezicht waarvan slechts enkele afbeeldingen voorhanden zijn.

De onderzoekers benadrukken dat hun methode de meest realistische beelden oplevert als er wat meer dan een handvol beelden van een gezicht voorhanden zijn. Maar ook als er slechts één afbeelding is om mee te werken, kunnen op deze manier bewegende beelden worden gegenereerd. Bijvoorbeeld van Mona Lisa of het Meisje met de parel (zie hieronder).

Afbeelding: Zakharov E., et al. / arXiv:1905.08233.

Dat het zo gemakkelijker wordt om neppe video’s te genereren lijkt misschien een kwalijke zaak. Maar daar denken de onderzoekers anders over. “We realiseren ons dat onze technologie gebruikt kan worden voor de zogenoemde deepfake-video’s. Maar het is belangrijk om je te realiseren dat Hollywood al een eeuw lang neppe video’s (ook wel special effects genoemd) maakt (…) Onze studie zal leiden tot de democratisering van bepaalde special effects-technologieën.”

Bronmateriaal

"Few-Shot Adversarial Learning of Realistic Neural Talking Head Models" - Arxiv
Afbeelding bovenaan dit artikel: Zakharov E., et al. / arXiv:1905.08233

Fout gevonden?

Voor jou geselecteerd