De menselijke poort — en de harde grens
Agents at Work — CC BY 4.0Wanneer een medewerker iets belangrijks aanraakt — een beslissing over een persoon, een betaling, een belofte — is het standaardadvies: “houd een mens in de loop.” Dat is goed advies. Het is ook de meest verkeerd begrepen veiligheidsmaatregel in het hele vakgebied, omdat de gemakzuchtige versie ervan nauwelijks werkt. Deze les gaat over het bouwen van de poort zodat deze ook daadwerkelijk standhoudt.
De poort, goed uitgevoerd
Een menselijke poort is een punt in het werk van de agent waar deze moet stoppen en een persoon een beslissing neemt voordat er iets in de wereld gebeurt. De agent bereidt zich voor — leest, stelt op, rangschikt, markeert — en wacht vervolgens af. Een persoon bekijkt het, beslist, en het is de beslissing van die persoon die wordt uitgevoerd.
Dat is de opzet. De valkuil zit in één woord: beslist. Er is een wereld van verschil tussen iemand die de beslissing neemt en iemand die de beslissing van de machine goedkeurt. Op een organigram zien ze er identiek uit. Ze vormen niet dezelfde veiligheidsmaatregel, en het bewijs voor deze kloof is overduidelijk.
Waarom ‘een mens keurt goed’ zwakker is dan het klinkt
Zet een persoon voor de aanbeveling van een AI en keer op keer neemt hij die over — ook als die verkeerd is.
- In een onderzoek uit 2025 onder 528 mensen in meer dan 1.500 wervingsscenario’s kozen beoordelaars in tot wel 90% van de gevallen voor de keuze van de AI, tegenover een basispercentage van ongeveer 50% wanneer ze zelf moesten kiezen. Deze neiging hield zelfs aan wanneer ze de kwaliteit van de AI als laag beoordeelden. Ze vertrouwden het niet, maar volgden het toch op.
- In een ander gecontroleerd onderzoek verlaagde een AI-systeem stilletjes de score van één nationale groep sollicitanten met 10%. Ongeveer 60% van de beoordelaars had dit nooit opgemerkt. De vooringenomenheid zat niet verborgen in code die ze niet konden zien — het zat in de resultaten die voor hun neus lagen, en het glipte er gewoon doorheen.
- Een onderzoek naar 41 bestaande beleidsregels voor menselijk toezicht bracht structureel hetzelfde aan het licht: de beleidsregels gaan ervan uit dat mensen de fouten van de machine kunnen opmerken, maar meestal zijn mensen niet in staat het toezicht uit te oefenen waarop het beleid reken.
Dit heeft een naam — automatiseringsvertekening — en het verdwijnt niet omdat je slim bent of goede bedoelingen hebt. Een snelle, vloeiende, zelfverzekerde aanbeveling is ontworpen om mee eens te zijn. Iemand die moe is aan het einde van een stapel van veertig zal ermee instemmen. De ‘human in the loop’ wordt een stempel die de beslissing van de machine omzet in een menselijke beslissing — terwijl hij vrijwel geen van de bescherming biedt die iedereen ervan verwacht.
Wat een echte poort onderscheidt van een stempel
De wet draait toevallig precies om dit onderscheid. Volgens de Europese AVG (die op jou van toepassing is als je ooit gegevens van een in de EU gevestigde persoon verwerkt), is een uitsluitend geautomatiseerde beslissing over iemand in principe verboden — en wat een beslissing uit dat verbod haalt, is een oprechte, niet-symbolische menselijke betrokkenheid: iemand met de bevoegdheid en de informatie om tot een ander antwoord te komen, niet iemand die op ‘goedkeuren’ klikt. De Nieuw-Zeelandse Privacycommissaris maakt hetzelfde praktische punt vanuit de andere kant: een symbolische menselijke tussenkomst lost de automatiseringsblindheid misschien helemaal niet op. (Algemene informatie, geen juridisch advies — de details zijn nog onduidelijk en vereisen deskundig advies.)
Een poort die je daadwerkelijk beschermt, heeft dus drie eigenschappen, en het is Anker 3 — jij bent er verantwoordelijk voor — concreet gemaakt:
- De persoon kan oprecht ‘nee’ zeggen — en doet dat soms ook. Als je beoordelaar nog nooit een beslissing van de agent heeft terzijde geschoven, heb je geen poort; dan heb je een formaliteit.
- Zij beslissen op basis van het bewijs, niet op basis van het oordeel. De agent legt voor wat hij heeft gevonden en waarom — geen score of een aanbeveling om mee in te stemmen. (Dat is de volgende les.) Iemand die bewijs afweegt, weerstaat de druk; iemand die een oordeel krijgt voorgeschoteld, stempelt het zomaar goed.
- De beslissing wordt onderbouwd door tests, niet door een vluchtige blik. Je kunt een afwijking van 10% niet op het oog opmerken — 60% van de mensen ziet het over het hoofd. Je ontdekt dat soort dingen door de output van de agent over verschillende groepen heen te meten, wat niveau 3 is. De poort en de test werken samen; geen van beide draagt de last alleen.
De eerlijke conclusie
Voor een beslissing met hoge inzet over een persoon: „we maken het anoniem en een mens geeft de goedkeuring“ — het verweer waar bijna iedereen zijn toevlucht toe neemt — komt dicht in de buurt van precies datgene waarvan het bewijs aantoont dat het faalt. Dat is geen reden tot wanhoop; het is een reden om de poort op te zetten als een echte beslissing, er tests achter te schuiven en de les te accepteren die de Recruiter zal benadrukken: soms is de juiste poort om de agent de beslissing helemaal niet te laten nemen .
Denk eens aan een beslissing van een agent die je door een mens zou willen laten controleren. Wees eerlijk: zou die persoon de tijd, de informatie en de bevoegdheid hebben om die beslissing daadwerkelijk te herroepen — of zou hij of zij, aan het einde van een drukke dag, gewoon op ‘goedkeuren’ klikken? Wat zou er moeten veranderen om er een echte controle van te maken?
Vervolg
Een echte controle vereist dat de agent bewijsmateriaal overhandigt, geen oordeel. Dat is een ontwerpkeuze die je maakt bij het bouwen ervan — criteria, geen gevoelens.
Vrijelijk gedeeld, te goeder trouw. Als je er iets aan hebt gehad, is een koha voor ontwikkelings- en exploitatiekosten van harte welkom.
Laat een koha achter →