A.I. gokt uiterlijk op basis van je stem

Karlijn Klei

15 juni 2019 08:59

stem

Met niet meer dan het geluid van je stem maakt A.I.-systeem Speech2Face een reconstructie van je gezicht. Althans, dat probeert ‘ie.

De verteller in een film, de conducteur in de trein of de helpdesk van een webwinkel; vraag jij je ook weleens af hoe eigenaars van die ‘losse stemmen’ eruit zien? Je bent niet de enige. Onderzoekers aan het MIT’s Computer Science and Artificial Intelligence Laboratory (CSAIL) besloten een stapje verder te gaan en een computer dat te laten doen. Ze ontwikkelden Speech2Face; een A.I.-systeem dat met alleen je stemgeluid een reconstructie maakt van je gelaatstrekken.

Lees ook:

Youtube

Die vaardigheid heeft het neurale netwerk van Speech2Face opgedaan door uren en uren aan YouTube-video’s te bekijken. Door naar die miljoenen beelden van pratende mensen te turen, heeft het systeem geleerd verbanden te leggen tussen stemgeluid – zoals de toon en de taal – en bepaalde gezichtskenmerken.

In zo’n zes procent van de gevallen produceert A.I.-systeem Speech2Face een gezicht van het verkeerde geslacht of etniciteit. © MIT CSAIL

Bij het horen van een nieuw stemfragment kan Speech2Face met die opgedane kennis bepaalde eigenschappen voorspellen. Leeftijd en geslacht bijvoorbeeld, die beide de toon van je stem beïnvloeden, maar ook etniciteit en zelfs de vorm van het hoofd en de breedte van de neus. Hoe langer het audiofragment, hoe beter de gelijkenis.

Gelijkenis

Laten we eerlijk zijn; omdat je stem natuurlijk niets zegt over je kapsel, gezichtshaar, make-up, enzovoorts, lijken lang niet alle gezichten even goed. Het doel van het systeem, zo stellen de onderzoekers, is dan ook niet een één op één replicatie te maken van je gelaatstrekken, maar de dominante gezichtskenmerken te schetsen op basis van je stem.

Gezichtsreconstructie op basis van een foto (onder camera) en door Speech2Face op basis van stemgeluid (onder luidspreker). © MIT CSAIL

En dat doet het systeem heel aardig. In de meeste gevallen produceert Speech2Face een gezicht dat in ieder geval in grote lijnen op dat van de eigenaar van de stem lijkt. Helemaal foutloos is het systeem overigens nog niet. Want heb jij een uitzonderlijk lage stem voor een meisje van 16, of klink je op je 75ste geen dag ouder dan 21? Ja, dan zou er zomaar een heel ander gezicht uit het systeem kunnen komen rollen.

De bevindingen van onderzoek zijn te vinden op pre-printserver arXiv.org.

Bronnen: arXiv.org, IFLScience

Beeld: MIT CSAIL

KIJK 6/2019Ben je geïnteresseerd in de wereld van wetenschap & technologie en wil je hier graag meer over lezen? Word dan lid van KIJK