Large Language Models in assessment: Doorbraak of gevaar?

ChatGPT kan cv's screenen in seconden. GPT-4 kan sollicitatiegesprekken voeren en analyseren. De nieuwste modellen kunnen complete assessments genereren, afnemen en scoren. De vraag is niet of Large Language Models assessment kunnen transformeren - ze doen het al. De vraag is: moeten we dat willen?

Het antwoord is - zoals zo vaak in assessment - genuanceerd. LLMs zijn tegelijk een doorbraak én een gevaar, afhankelijk van hoe je ze inzet.

De verleidelijke voordelen

De voordelen van LLMs in assessment zijn zo evident dat ze nauwelijks toelichting behoeven. Schaalbaarheid: een LLM kan duizenden kandidaten tegelijk interviewen. Consistentie: elke kandidaat krijgt dezelfde vragen op dezelfde toon. Efficiëntie: wat vroeger weken duurde, gebeurt nu in minuten.

De toepassingen exploderen. Geautomatiseerde analyse van video-interviews. Het genereren van gepersonaliseerde assessmentvragen op basis van functieprofielen. Real-time scoring van open antwoorden. Sommige platforms laten kandidaten gesprekken voeren met AI-avatars die onmogelijk van echte interviewers te onderscheiden zijn.

Het vergif in de belofte

Maar hier komt de kritische kanttekening die elke HR-professional moet kennen. LLMs reproduceren patronen uit hun trainingsdata. Als die data bias bevat - en dat doet internetdata vrijwel altijd - zal het model die bias reproduceren.

Onderzoek naar AI-bias in hiring toont complexe, contextuele vormen van discriminatie. Een LLM kan vandaag eerlijk lijken en morgen discrimineren als de prompt verandert. Een model kan vrouwen bevoordelen voor sommige functies en benadelen voor andere. De inconsistentie maakt auditing een nachtmerrie.

De EU AI Act classificeert daarom LLM-gebaseerde selectietools als hoog-risico, met bijbehorende compliance-verplichtingen die veel aanbieders niet kunnen waarmaken.

De gulden middenweg

De slimste toepassingen vermijden de valkuil door LLMs te beperken tot taken waar ze excelleren zonder schade aan te richten:

Vraag-generatie: LLMs kunnen assessmentvragen voorstellen die menselijke experts valideren
Rapportage: Assessmentresultaten vertalen naar leesbare, gepersonaliseerde rapporten
Communicatie: Kandidaatcorrespondentie personaliseren zonder selectiebeslissingen te nemen

Selection Lab past dit principe rigoureus toe. Hun AI - inclusief LLM-componenten - automatiseert het selectieproces maar beoordeelt geen kandidaten. Die rol is voorbehouden aan wetenschappelijk gevalideerde assessments.

"LLMs zijn fantastisch voor taalverwerking", zegt oprichter Lotte Welten. "Maar selectiebeslissingen zijn geen taalprobleem. Ze vereisen psychometrisch gevalideerde meetinstrumenten, geen patroonherkenning op internetdata."

De bottomline

LLMs transformeren assessment - dat staat vast. De vraag is of die transformatie tot betere of slechtere selectie leidt. Het antwoord hangt af van wijsheid in implementatie. Gebruik LLMs waar ze waarde toevoegen: efficiëntie, personalisatie, communicatie. Vermijd ze waar ze schade kunnen aanrichten: het beoordelen van mensen. Die taak blijft het domein van bewezen valide instrumenten en menselijk oordeelsvermogen.

Large Language Models in assessment: Doorbraak of gevaar?

De verleidelijke voordelen

Het vergif in de belofte

De gulden middenweg

De bottomline

Gerelateerde artikelen

Proctoring technologie evolueert: Van surveillance naar smart monitoring

API-first assessment platforms: Integratie als onderscheidend vermogen

Mobile-first assessment: Optimaliseren voor smartphone-afname

NLP transformeert analyse van open antwoorden in assessments