Algoritme ontmaskert internettrollen

Sergei Monakhov ontwikkelde algoritmen die effectief de berichten van trollen kunnen opsporen. En dat op basis van taalpatronen in slechts vijftig tweets.

Wie een beetje op het internet leeft, is welbekend met zogeheten ‘internettrollen’. Deze accounts verspreiden opzettelijk haatzaaiende berichten, doen zich voor als iemand anders (impersonatie) of verspreiden misleidende informatie. Dit altijd met een bepaald doel voor ogen, zoals het verwarring zaaien of het sturen van discussies.

Hoe groot de impact van trollen kan zijn, bleek wel tijdens Amerikaanse verkiezingen in 2016. Zo zou Moskou een Russisch ‘trollenleger’ hebben ingezet om de verkiezingen te sturen in het voordeel van Donald Trump.

Voor dit probleem denkt Sergei Monakhov, onderzoeker aan de Freidrich Schiller Universiteit in Jena, een oplossing te hebben. Met behulp van een tweetal complexe algoritmen weet hij effectief de trol-tweets van serieuze berichten te onderscheiden, zo schrijft hij in PLOS ONE.

Lees ook:

Twitterbibliotheek

Al eerder probeerden onderzoekers om misleidende tweets uit de berichtenmassa te vissen op basis van gebruikte hashtags, geografische data en de snelheid waarmee de berichten geplaatst en verwijderd worden. Maar Monakhov gooit het over een andere boeg. Hij knutselde twee algoritmen in elkaar die troll-tweets van serieuzere tweets weten te onderscheiden aan de hand van taalgebruik.

In de regel bevatten troll-tweets een duidelijke terugkomende boodschap. Maar nog belangrijker, zo ontdekte Monakhov, zijn de vreemde constructies van woorden en woordcombinaties die hieruit voortkomen. Dit komt waarschijnlijk doordat de trollen een relatief kleine collectie aan standpunten hebben die ze herhaaldelijk willen verspreiden. Tegelijkertijd moeten ze dit op voldoende verschillende manieren formuleren om niet te veel op te vallen.

Hoge precisie

Om de algoritmen te trainen maakte Monakhov gebruik van publieke twitterberichten geplaatst door Amerikaanse congresleden, maar ook een enorme bibliotheek vol berichten van Russische trollen. Op basis van slechts vijftig tweets slaagden zijn algoritmen erin de troll-tweets met hoge precisie (91 procent) uit de overige berichten te filteren. Het systeem wist zelfs de verwarrende en soms provocerende tweets van Donald Trump keurig te onderscheiden van ‘echte’ troll-berichten.

De onderzoeker hoopt dat zijn neurale netwerk kan worden ingezet om weerstand te bieden in de cyberoorlog met internettrollen. Het idee is dat de berichten snel kunnen worden opgespoord en verwijderd, zonder dat daarbij de vrijheid van meningsuiting in het gedrang komt. Voordat het zo ver is moet het algoritme zijn kracht nog bewijzen tegen ander soort berichten (lees: door niet-publieke figuren). Aan de slag!

Internettrollen opgespoort met behulp van twee algoritmen — Op basis van 50 willekeurige tweets wisten de algoritmen berichten van internettrollen, congresleden en Donald Trump te onderscheiden.

Bronnen: PLOS ONE, EurekAlert!

Beeld: Monakhov, 2020 (PLOS ONE, CC BY)

Ben je geïnteresseerd in de wereld van wetenschap & technologie en wil je hier graag meer over lezen? Word dan lid van KIJK!

Algoritme ontmaskert internettrollen

Twitterbibliotheek

Hoge precisie

Meest gelezen

De ringen van Saturnus zien er veel jonger uit dan ze daadwerkelijk zijn

Honden communiceren complexe gedachten met knoppen

Vandaag in 1903: Orville Wright maakt de eerste vliegtuigvlucht

Ongekend risico voor leven op aarde: wetenschappers waarschuwen voor ‘gespiegelde bacteriën’

Wat gebruikten de eerste brandweerlieden om branden te blussen?

PODCAST

Bestel nu!

Meer Tech

De fitzroyschildpad ademt via zijn achterwerk

Vandaag in 2011: André Kuipers voor de tweede keer de ruimte in

Het beste wetenschapsnieuws van deze week

Hoe zonk het VOC-schip Zuytdorp?