Onderzoek - ontwikkeling en innovatie
Spoiler alert: Algoritme UT-student voorspelt ‘De Mol’
Meer dan drie miljoen fans vragen zich elk weekend af wie de Mol is in het populaire spelprogramma Wie is de Mol?. Haico Dorenbos, masterstudent Computer Science aan de Universiteit Twente, heeft mogelijk het antwoord. Zijn ‘Moldel', een slim algoritme dat hij speciaal voor de show bouwde, voorspelt dat de kans erg groot is dat Marije (50%) of Splinter (40%) de Mol is.
“Een paar seizoenen geleden keken mijn broer en ik samen naar Wie is de Mol?”, vertelt Haico. “We waren beiden overtuigd van wie de Mol zou zijn, maar ‘onze’ Mollen vielen al snel af. Ik vroeg me toen af of een algoritme de uitkomst zou kunnen bepalen. Ik kwam er al vrij snel achter dat dat goed kan. Ik bouwde het Moldel, testte dat op de twintig eerdere seizoenen, en ontwikkelde het steeds verder. Het systeem wordt steeds betrouwbaarder. In de eerdere seizoenen bleek dat het model na aflevering zes, waar we nu ook zijn, de Mol meestal al kon voorspellen.”
Dat dit algoritme wellicht niet voor alle fans even leuk is, snapt Haico best. “Het Moldel neemt misschien wat kijkplezier weg en sommige fans vinden dit te ver gaan, maar ik wil hiermee aantonen waartoe algoritmes in 2021 in staat zijn.”
Vijf lagen
Het Moldel maakt gebruikt van 5 lagen die elk een belangrijke bouwsteen van het systeem vormen.
Hieronder de lagen uitgelegd:??
- De Exam Drop layer kijkt hoe afvallers hun zichtbare vragen beantwoorden. Deze layer probeert te voorspellen hoe groot de kans is dat de kandidaten deze vragen goed hebben beantwoord. Eerdere afvallers hebben vaak een grotere kans dan latere afvallers om hun vraag fout te beantwoorden, en vraag 20 ‘Wie is de Mol?’ wordt bijvoorbeeld vaker fout beantwoord dan vraag 1 ‘Is de Mol een man of een vrouw?’.??
- De Exam Pass layer probeert aan de hand van hoeveel jokers/vrijstellingen gebruikt worden, te voorspellen wie de Mol is. Als iemand de finale bereikt zonder veel jokers/vrijstellingen te gebruiken, is het waarschijnlijker dat die speler de Mol is dan spelers die de finale bereiken door veel jokers/vrijstellingen te gebruiken.??
- De Wikipedia layer kijkt naar de Wikipediapagina’s van spelers en probeert op basis van Natural Language Processing (een techniek die gebruikt wordt om slimme algoritmes onze taal te laten begrijpen) karaktereigenschappen van spelers te analyseren. Denk aan beroep en bekendheid. Deze layer wordt getraind met Wikipediapagina’s van oud-mollen.??
- De Appearance layer kijkt naar hoe vaak spelers in beeld komen tijdens de aflevering door middel van een gezichtsherkenningstool. De mol blijkt namelijk significant minder in beeld te komen tijdens de eerste vijf afleveringen.??
- De Social Media layer sluit spelers uit als Mol als ze te vroeg actief zijn op social media tijdens de opnameperiode. De layer kijkt ook naar ander bewijs dat aantoont dat ze niet aanwezig waren bij de gehele opname periode.????
Data: voorspelling eerdere seizoenen na de finale-aflevering
Data: voorspelling dit seizoen (21) na aflevering 6
Wiskunde en informatica
Haico Dorenbos (24) volgt momenteel de mastertrack Data Science & Technology binnen de master Computer Science van de UT. Het project heeft een sterke wiskundige link. Zijn begeleiders zijn prof. Johannes Schmidt-Hieber, dr. Alexis Derumigny en dr. Mannes Poel. De eerste twee zijn wiskundigen, Poel is een computer scientist. Haico voltooide eerder de bachelors Technische Wiskunde en Computer Science aan de TU Eindhoven.