36. Calibratie- of ijksessies verhogen de kwaliteit van beoordelingen
Welke stappen doorloopt de leidinggevende voor hij zich accuraat kan uitspreken over de prestaties van de medewerker? Hoe ijkt hij de prestaties?
De leidinggevende zal zich bijzonder goed voorbereiden op het beoordelingsgesprek. Immers, tijdens het gesprek, al is het een (poging tot) dialoog, kan de leidinggevende zijn beoordeling niet meer veranderen. Doet hij dat wel, daar tal van consultants adviseren om een "participatief beoordelingsgesprek" te voeren, dan zal het daarop volgende jaar de meerderheid van de slimme medewerkers proberen te onderhandelen over hun beoordeling.
Bij een van mijn klanten, waar ik in het bestaande proces stapte om het te optimaliseren, gaf dat meer dan 40 % veranderde (lees: verhoogde) beoordelingen tijdens het beoordelingsgesprek. Daardoor wordt het beoordelingsgesprek meer een tactische oefening dan een communicatie over prestaties.
Beoordelingen zullen in eerste instantie "fair" zijn, d.w.z. gebaseerd op feiten, prestaties vergelijken met gemaakte afspraken, (achter de schermen) passende vergelijkingen maken van de prestaties tussen medewerkers... M.a.w. het beoordelingsgesprek is een gesprek, maar de inhoud van de boodschap wordt de eerste jaren best weinig participatief (met de medewerker) bepaald.
Wanneer leidinggevenden onvoldoende informatie hebben om hun huiswerk als beoordelaar te starten (het zou niet mogen, maar het gebeurt) adviseer ik hen een einde-van-het-jaar voortgangsgesprek te voeren. Dit gesprek is precies hetzelfde als het midden-van-het-jaar voortgangsgesprek, alleen op een later moment. Kwestie is dat de leidinggevende weet waarover hij spreekt tijdens het beoordelingsgesprek.
Stap 1: Individueel huiswerk van de leidinggevende
Normaliter is de leidinggevende in staat om, per salarisgraad, de prestaties van de medewerkers te clusteren en te rangordenen. Dit geeft een opdeling van de teamleden in categorieën zoals in onderstaande tabel. Deze clustering en rangordening is de verantwoordelijkheid van 'de baas' (de direct leidinggevende). Hij staat immers dag-in-dag-uit dicht bij de medewerker. De leidinggevende heeft de medewerker vaak kunnen observeren, hij weet hoeveel hij leidinggevende diende bij te springen opdat de medewerker succesvol zou zijn.
Ik adviseer 'de baas van de baas' deze clustering en rangordening slechts door het overtuigen van de medewerker-leidinggevende te veranderen. Het alternatief, autoritair beslissen dat de prestatiebeoordeling van deze of gene medewerker hoger of lager moet zijn, resulteert op korte termijn in een leidinggevende die tijdens het beoordelingsgesprek een beoordeling moet geven waar hij niet achter staat. Zo heb ik het ooit in mijn adviespraktijk meegemaakt dat een leidinggevende beoordelaar weigerde het beoordelingsformulier van zijn medewerker te handtekenen!
Op langere termijn zorgt het autoritair beslissen van 'de baas van de baas' over deze clustering en rangordening van prestaties voor vermijdingsgedrag van de rechtstreekste leidinggevenden en delegatie (naar boven!) van het beoordelingsproces.
Samengevat: de direct leidinggevende clustert en rangordent, per functieschaal, de prestaties van zijn medewerkers - bv. aan de hand van de categorieën topper, subtopper... (zie tabel hieronder).
Waarom bij dit huiswerk categorieën als topper, subtopper... gebruiken in plaats van de (uiteindelijke) beoordelingsankers (bv. uitstekend, zeer goed...)? Het omgekeerde spaart toch tijd?
Ja, dat kan kloppen. Het is evenwel de bedoeling om tijdens de ijksessie gemeenschappelijke maatstaven te ontwikkelen. Defensieve reacties, waarbij een leidinggevende zich bv. aan een "zeer goed" voor een medewerker heeft vastgepind, zullen we zoveel mogelijk voorkomen.
In praktijk zie ik ook dat leidinggevenden, door de opdracht nog niet "uitstekend", "zeer goed"... dan eigen manieren van clusteren en rangordenen ontwikkelen. In dit stadium van de oefening voor mij een signaal van constructief probleem oplossen (= hoe cluster en rangorden ik de prestaties in mijn team het best?).
Wanneer een leidinggevende onervaren is in het beoordelen, dan verdient het aanbeveling dat hij en 'de baas van de baas' een tussenstap nemen. De leidinggevende legt zijn ontwerp van clustering en rangordening als toets voor aan 'de baas van de baas'. De 'baas van de baas' spart: hij vraagt kritisch door, hij brengt situaties en prestaties in herinnering... Daarmee ondersteunt hij het inzicht en het zelfvertrouwen van de onervaren leidinggevende en voorkomt men tijdverlies tijdens de eigenlijke ijksessie.
Gulden regel blijft: de verantwoordelijkheid voor het clusteren en rangordenen ligt bij de direct leidinggevende.
Stap 2: IJken over teams heen
Het is mogelijk dat 'de baas van de baas' geheel alleen instaat voor het gelijk trekken van de beoordelingen over alle teams waarvoor hij verantwoordelijk is. Op basis van de clustering en rangordening van de lagere leidinggevenden beslist hij wie "uitstekend", "zeer goed"... gepresteerd heeft.
Er zijn een paar belangrijke nadelen aan deze werkwijze verbonden. Als 'de baas van de baas' zich vergist, vergist 'de baas' zich ook. En als dat bekend wordt, krijg je heel wat gemor en demotivatie in de organisatie.
Ook voor het verkrijgen van zelfinzicht bij de leidinggevenden over hun beoordelingscriteria zijn ijksessie aangewezen.
Verplichte spreiding, hulpmiddel?
Om de ijking te vergemakkelijken worden soms werkwijzen gebruikt als verplichte spreiding.
Het gebruik van verplichte spreiding kan, onder strikte voorwaarden, een bruikbare techniek zijn. Onder vele anderen haalt Edward E. Lawler III (2002), vooraanstaand auteur en onderzoeker, vernietigend uit t.o.v. het ondoordacht gebruik van forced ranking (verplichte spreiding). Het Welch-principe met zijn jaarlijks '10 % under performers' doen verdwijnen uit de organisatie, 70 % middenmoters trainen en coachen naar betere prestaties en '20 % top performers' genereus waarderen en belonen, heeft veel kwaad bloed gezet. En dat niet alleen bij de vakbonden.
HRM als meetstok?
Als alternatief komt in sommige organisaties HRM mede aan de beoordelaarstafel zitten. HRM-ers kunnen mijn inziens uitstekende facilitatoren zijn tijdens ijksessies maar er zijn weinig organisaties waar de P&O-ers voldoende detailinformatie hebben over dagdagelijks functioneren van medewerkers om inhoudelijk de prestatiebeoordelingen mee te bepalen. Vaak missen ze ook de vaktechnische kennis (hoe ga je als P&O-er bv. de efficiëntie van een chip design evalueren?!?)
De beste oplossing: IJk of callibratievergadering
Het best mogelijke alternatief: 'de bazen' komen onder voorzitterschap van 'de baas van de bazen' samen om een calibratiesessie uit te voeren.
Doel
Bij het beoordelen, gemeenschappelijke maatstaven ontwikkelen tussen leidinggevenden (noem het "een gemeenschappelijk maatgevoel").
Inhoud
Het in lijn brengen van de voorstellen van beoordeling. Met andere woorden: teamleiders bevragen de prestaties van representatieve medewerkers in elkaars teams, zodat ze consensus bereiken over wie welke eindbeoordeling krijgt.
In onderstaande tabel wordt dit visueel voorgesteld, voor slechts drie teams (met een weinig veeleisende, een gematigde en een veeleisende leidinggevende) voor de beoordelingsankers Uitstekend, Zeer goed, Goed, Bijna goed en Onvoldoende.
Huiswerk leiding-gevende team A | Huiswerk leiding-gevende team B | Huiswerk leiding-gevende team C | ||
Toppers | Uitstekend/ Zeer goed? | Toppers | Uitstekend | Toppers |
Subtoppers | Zeer goed? | Subtoppers | Uitstekend? | Subtoppers |
Beter dan trouwe soldaten | (Zeer) Goed? | Beter dan trouwe soldaten | Zeer goed? | Beter dan trouwe soldaten |
Trouwe soldaten | (Bijna) goed? | Trouwe soldaten | (Zeer) goed? | Trouwe soldaten |
Bijna trouwe soldaten | Bijna goed/ onvoldoende? | Bijna trouwe soldaten | (Bijna) Goed? | Bijna trouwe soldaten |
Probleem kinderen | Onvoldoende | Probleem kinderen | Bijna goed/ Onvoldoende? | Probleem kinderen |
"Het glas is half vol"-beoordelaar | "Gematigde" beoordelaar | "Het glas is half leeg"-beoordelaar |
De essentie
Het is niet nodig alle medewerkers de revue te laten passeren (de klassieke vlootshow). Teamleider C kan beginnen met het ijken van een representatieve subtopper. Stelt hij vast dat zijn subtopper een Uitstekend als beoordeling krijgt, hoeft hij zijn echte Toppers niet te ijken, want zij krijgen zeker de beoordeling Uitstekend. Voor hem is het belangrijk om dan na te gaan of wat hij Trouwe soldaten noemt, een Goed of een Zeer goed zullen ontvangen, enz.
Teamleider A zal bij de ijking van zijn Subtoppers zien of ze een Zeer goed toegeschreven krijgen (en dan zien of zijn Toppers een Uitstekend waard zijn) dan wel zijn 'Beter dan trouwe soldaten' een Goed of Zeer Goed waard zijn. En vandaar gaat hij verder.
Samengevat, alleen die representatieve medewerkers ijken die nodig zijn om ketens tussen teams aan elkaar te klikken.
Er is flink wat onderzoek over het effect van frame-of-reference rater training (Dierdorff, Surface en Brown, 2010; Gorman & Rentsch, 2009; Sulsky & Day, 1992; Woehr, 1994; Latham, 1975). Als facilitator van calibratiesessies nodig ik leidinggevenden uit elkaar als volgt te bevragen:
- Wat waren de afspraken met de medewerker? (M.a.w., wat vond ik als leidinggevende oorspronkelijk belangrijk? Wat zijn mijn beoordelingscriteria?)
- Wat waren de prestaties van de medewerker? (M.a.w., wat zijn de feiten? Wat heb ik geobserveerd?)
- Wat waardeer ik ook nog (positief of negatief)? (M.a.w., zijn er nog andere factoren van belang bij de beoordeling? Hoe vertaal ik deelbeoordelingen in een globale beoordeling?)
Het goede nieuws van deze methode van bevragen is dat de calibratiebijeenkomst een zakelijk gesprek wordt, waarbij informele macht in de peer groep van leidinggevenden minder doorslaggevend wordt.
Het slechte nieuws is dat het meer vergadertijd vraagt dan losweg wat kreten te roepen die hoofdzakelijk gebaseerd zijn op het imago van de geijkte medewerker. Vandaar het belang om de casussen voor ijking goed te kiezen i.p.v. een vlootshow te organiseren.
(Noot: een goed gedocumenteerde, bv. tweejaarlijkse, vlootshow in de context van employability, manpowerplanning, loopbaanmanagement... is een uitstekend initiatief en een absolute aanrader maar niet nodig om tot accurate jaarprestatiebeoordelingen te komen. Voor wie meer wil weten: Google HR3P).
Wanneer leidinggevenden in een overzichtstabel hun voorstellen van eindbeoordeling samengevat zien, ontstaan spontaan vragen bij leidinggevenden die hoger of lager beoordelen dan hun collega's. Deze verschillen kunnen verantwoord (of niet verantwoord) zijn. Voer het gesprek over de prestaties dus ten gronde!
Eerst de medewerkers beoordelen en dan de leidinggevenden om omgekeerd?
Latham, Budworth, Yanar en Whyte (2008) vinden in vier onderzoeken met diverse methodologieën ondersteuning voor hun hypothese dat de eigen voorafgaande beoordeling van de leidinggevende de daaropvolgende beoordelingen van zijn medewerkers beïnvloedt.
Al interpreteer ik dat een gedeelte van het effect dat ze vinden toe te schrijven is aan het Pygmalion effect, het vermoeden blijft dat (minstens sommige) leidinggevenden het niet kunnen hebben dat hun medewerkers (veel) beter beoordeeld worden dan zijzelf.
Om dit effect tegen te gaan, hebben nogal wat organisaties de regel dat de leidinggevende pas beoordeeld wordt nadat al de medewerkers beoordeeld zijn.
Het organiseren van calibratiesessies is mijn inziens een effectieve werkwijze die past in deze aanpak. Doorgaans zie ik na het calibreren van de beoordelingen van de medewerkers, de lagere leidinggevenden de zaal verlaten waarna de hogere leidinggevenden de prestaties van de lagere leidinggevenden ijken. De managers en directeurs kunnen dan zelfs rekening houden met wat ze tijdens de voorafgaande ijking inhoudelijk beargumenteerd zagen als effectieve uitvoering van het Resultaatgebied Leidinggeven bij de supervisors.
Valkuilen
Elk systeem heeft mogelijke nadelen...
- Leidinggevenden hebben schroom om namen te noemen en gaan vage verhalen vertellen. Remedie: een afspraak voor discretie. Een leidinggevende, die zich daar niet aan houdt, krijgt lik op stuk tijdens een berispinggesprek (correctiegesprek).
- Er toch een vlootshow van maken (onder het motto 'liever een weinig diepgaand verhaal over iedereen') omdat leidinggevenden onvoldoende feitelijke info ter beschikking hebben. Remedie: dit jaar een "zachte landing" orchestreren en volgend jaar wél SMARTe afspraken maken en stap 1 van het huiswerk serieus nemen.
- Vergeten/weglaten ook de representanten van 'de trouwe soldaten' te ijken waardoor de neiging ontstaat om maar minder de extremen (hogere en lagere beoordelingen) te gebruiken. Remedie: stel zowel de vraag "Zijn de niet-gemiddelde beoordelingen terecht?" als de vraag "Zijn de gemiddelde beoordelingen terecht?"
- De ijksessie tijdens het beoordelingsgesprek gebruiken als excuus t.o.v. de medewerker: "Ja Marieke, voor mij zou jij ook een hogere score krijgen, maar je weet dat hierover in het management consensus moet ontstaan en het is onmogelijk collega's leidinggevenden te overtuigen van...". Remedie: leidinggevenden leren spreken in eigen naam, en dat na hun zorgvuldig huiswerk!
Natuurlijk kan een op dit domein ervaren facilitator (drie keer raden wie ik bedoel) de calibratiesessies voorzien van tal van nuttige tips & tricks om een effectieve en efficiënte vergadering te waarborgen.
Aarzel niet te reageren: contact
Geschreven door:
Thema's van onze nieuwsbrieven
Andere artikelen binnen dit thema
- 27. Hoe leidinggevenden aansporen tijdig de jaargesprekken te voeren en u de nodige documenten te bezorgen?
- 28. Coachen van de beoordelingsaverse leidinggevende
- 29. Criteria voor een succesvol beoordelingssysteem
- 33. Zelfbeoordelingen door medewerkers: een verstandige keuze?
- 37. Goed werk goed belonen