Onderzoek - ontwikkeling en innovatie
Nooit meer de was opvouwen: een handige robot die niet afgeleid wordt
In de toekomst zullen robots verschillende alledaagse taken overnemen, zoals het uitruimen van de vaatwasser of het strijken van kleding. Om dit effectief te doen, moeten ze leren hoe ze relevante informatie uit hun omgeving kunnen filteren en zich niet laten afleiden. TU/e-promovendus Bram Grooten werkt aan algoritmes die robots helpen zich aan te passen aan nieuwe situaties en gefocust te blijven op hun taken.
Toen Bram Grooten zijn onderzoek presenteerde tijdens de pitchcompetitie Talking Science, hield hij een toiletborstel in zijn hand. Het was een speelse oproep voor robots die huishoudelijke taken kunnen overnemen, zoals de wc schoonmaken of kleding vouwen. Maar achter deze grap schuilt een persoonlijke motivatie. “Het is mijn droom om dit werkelijkheid te maken,” zegt Grooten.
“Als kind moest ik altijd de vaatwasser uitruimen en dacht ik: waarom kan dit niet geautomatiseerd worden?” Twintig jaar later is een deel van die droom werkelijkheid: veel huishoudens hebben inmiddels een robotstofzuiger, maar robotica in het huishouden heeft nog niet veel verder vorm gekregen. “Zelfs eenvoudige taken zijn voor robots moeilijker dan je zou denken,” zegt Grooten.
“Laten we bijvoorbeeld kleding vouwen nemen, een taak waar veel onderzoek naar wordt gedaan,” legt hij uit terwijl hij zijn vest uitdoet en het verfrommeld op de tafel legt. “Kijk, voor een robot is het best lastig om te begrijpen hoe dit precies werkt. Wat wij als mensen vanzelfsprekend vinden, moet een robot leren – en dit geldt voor verschillende soorten kledingstukken.”
Reinforcement learning
Om een robot tot een goede assistent te maken, moet deze eerst worden getraind om een taak uit te voeren. Hiervoor kan de robot talloze voorbeelden krijgen of via simulaties snel veel scenario’s leren. Vaak wordt hierbij gebruik gemaakt van een techniek die reinforcement learning wordt genoemd. De robot krijgt een positieve score als hij een taak goed uitvoert en een negatieve score als hij een fout maakt. Het doel is dat de robot door trial-and-error leert wat de bedoeling is.
Aanpassingsvermogen
Het probleem met deze methode is dat robots vaak gedrag aanleren dat alleen werkt in de specifieke situatie waarin ze getraind zijn. Verandert er iets, bijvoorbeeld als een kledingstuk anders in elkaar zit of de omgeving er anders uitziet, raakt de robot in de war. “Als je de robot in een andere kamer plaatst, kan hij afgeleid raken door het behang, de vloer of de televisie,” zegt Grooten.
In de toekomst zou een huishoudrobot wellicht beschikken over een schat aan gegevens – van de temperatuur in elke kamer tot wat er in de keukenkastjes ligt. “Maar voor een specifieke taak, zoals koffie zetten, is slechts een klein deel van die informatie relevant,” legt Grooten uit. Alle andere prikkels kunnen verwarrend zijn voor een robot die enkel met standaard reinforcement learning is getraind.
Daarom willen onderzoekers robots ontwikkelen die zich kunnen blijven concentreren op de taak en zich niet laten afleiden door overbodige informatie. “In mijn onderzoek proberen we robots adaptiever te maken, door adaptive reinforcement learning te gebruiken,” zegt Grooten. Deze techniek zorgt ervoor dat robots zich beter kunnen aanpassen aan verschillende situaties en omgaan met nieuwe visuele achtergronden of geluiden. “We willen dat de robot ook in onverwachte situaties blijft begrijpen wat hij moet doen,” legt hij uit.
Slimme algoritmes
Grooten ontwikkelde slimme algoritmes zoals ANF (Automatic Noise Filtering) en MaDi (Masking Distractions), die een robot helpen irrelevante informatie te negeren. Het ANF-algoritme zorgt ervoor dat omgevingsruis wordt gefilterd, terwijl MaDi storende pixels donker maakt, zodat ze de robot niet kunnen afleiden.
Met behulp van deze algoritmes leert de robot zich te concentreren op de essentiële aspecten van zijn taak, zelfs in veranderende omgevingen.
Simulatie en praktijk
Grooten testte deze methoden eerst in een simulatie: de robot voerde een eenvoudige taak uit op een neutrale achtergrond. Vervolgens werd de achtergrond vervangen door willekeurige beelden om te testen of de robot de taak nog steeds kon uitvoeren. Het resultaat? De robot bleef gefocust en raakte niet in de war.
Wat Grooten het leukste vindt, is om deze technologie met een echte robot te testen. “We leerden een kleine robot met een webcam om zo dicht mogelijk bij een rode stip op een scherm te komen,” zegt hij. “Na verloop van tijd veranderden we de achtergrond naar verschillende beelden. Na slechts twee uur training met MaDi zagen we al indrukwekkende resultaten.”

Van simulatie naar realiteit
“Het mooiste aan dit onderzoek is dat je een algoritme maakt en echt kunt zien dat de robot doet wat hij moet doen,” zegt Grooten. “Dat moment maakt alles tastbaar, en dat vind ik geweldig.”
Tijdens zijn promotieonderzoek werkte Grooten ook een half jaar bij Sony AI, waar hij het algoritme SPARC ontwikkelde. Dit algoritme zorgt ervoor dat een robot die in een simulatie is getraind, zich ook goed kan aanpassen aan de echte wereld. Door simulaties systematisch te variëren, leert het systeem zich adaptief aan nieuwe situaties aan te passen.
“Ik werkte daar samen met een team dat reinforcement learning gebruikte voor de ontwikkeling van PlayStation-games,” vertelt hij. “Het was een geweldige ervaring, vooral omdat ik simulaties kon doen in een geavanceerde gameomgeving zoals Gran Turismo 7 – veel geavanceerder dan de simulaties die we normaal op de universiteit gebruiken.”
Van auto’s tot sokken
De methoden die Grooten ontwikkelt, zijn niet alleen toepasbaar voor huishoudrobots, maar kunnen ook in andere gebieden worden gebruikt, zoals de bouw, de zorg of zelfs zelfrijdende voertuigen. “Waar systemen zich moeten aanpassen aan nieuwe situaties, kunnen deze algoritmes een rol spelen,” zegt Grooten.
Hoewel er nog veel onderzoek nodig is voordat we een robot kunnen vertrouwen om de was te strijken of het avondeten te bereiden, komt de droom van Grooten – en van vele anderen – steeds dichterbij. Wie weet, misschien is het straks de robot die je sokken altijd bij elkaar houdt en nooit meer een verloren sok heeft.


