Je vraagt AI om KPI’s voor je strategie. Binnen tien seconden heb je een lijst: NPS, CSAT, churn rate, Customer Effort Score, first call resolution, response tijd. Indrukwekkend. Professioneel. Klaar om in je dashboard te plakken.

Er is alleen een probleem. Het zijn dezelfde KPI’s die ieder ander bedrijf ook krijgt. Ze meten niets dat uniek is aan jouw situatie.

In 1975 formuleerde Charles Goodhart, economisch adviseur van de Bank of England, wat nu bekend staat als Goodhart’s Law: “When a measure becomes a target, it ceases to be a good measure.”1 Die wet geldt des te harder wanneer AI je targets kiest, want AI optimaliseert voor wat algemeen gangbaar is, niet voor wat specifiek relevant is.

Het probleem zit niet in AI, het zit in context

Vraag ChatGPT om KPI’s voor “klanttevredenheid verbeteren” en je krijgt een keurig georganiseerde lijst. Maar AI weet niet dat jouw klanten niet over prijs klagen maar over levertijd. Het weet niet dat je churn-probleem bij enterprise-klanten zit, niet bij mkb. Het weet niet dat je vorig kwartaal je onboarding hebt vernieuwd en de impact daarvan wilt meten.

Zonder die context doet AI wat het kan: generieke antwoorden op generieke vragen. Recent onderzoek in Patterns bevestigt dit: “The unthinking pursuit of metric optimization can lead to real-world harms.”2

Dit is hetzelfde contextprobleem dat AI overal parten speelt. AI genereert slechte KPI’s om dezelfde reden dat het slechte strategieen genereert: het kent je organisatie niet. Het heeft geen toegang tot je strategische doelen, je teamdynamiek, je marktpositie of je kwartaalresultaten. En zonder die informatie kan het alleen terugvallen op gemiddelden.

Balanced Scorecard

Balanced Scorecard

De Balanced Scorecard (BSC) meet bedrijfsprestaties vanuit vier perspectieven...

Bekijk template

Het gaming-probleem

Goodhart’s Law is geen abstracte theorie. Een analyse van de LMSYS AI-leaderboard toont het in actie: grote bedrijven zoals Meta, OpenAI en Google testten intern meerdere modelversies en publiceerden alleen de beste resultaten3. Het resultaat? De benchmark verloor zijn vermogen om daadwerkelijke modelkwaliteit te meten.

Shopify’s CEO Lutke vermijdt bewust standaard Silicon Valley metrics: “No metric by itself is a complete heuristic for a complex business. There’s a million different tensions in the company, and you can’t keep them all in harmony by optimizing for one thing.”1

Slecht gekozen KPI’s leiden tot voorspelbare gevolgen:

  • Teams verschuiven hun focus naar het gamen van het systeem in plaats van naar betekenisvolle resultaten
  • Individuen plaatsen persoonlijke performance boven teamsucces
  • Iedereen ervaart stress over metrics die niets zeggen over daadwerkelijk succes

Voorbeeld: “Aantal afgesloten support tickets per dag” als KPI leidt ertoe dat medewerkers tickets snel afsluiten zonder echte oplossing. De metric gaat omhoog, de klant is niet geholpen.

Wanneer AI-KPI’s wel werken

AI-suggesties zijn niet per definitie waardeloos. Ze werken in drie situaties.

Gestandaardiseerde processen. Sales pipeline metrics, website analytics, financiele ratio’s: deze zijn universeel toepasbaar. Hier hoeft AI je context niet te kennen.

Startpunt voor discussie. Een AI-gegenereerde lijst geeft je een menu om uit te kiezen en aan te passen. Dat is beter dan vanaf nul beginnen. Maar het is een vertrekpunt, geen eindpunt.

Completeness check. Heb je aan alles gedacht? AI kan helpen identificeren welke metrics je mogelijk over het hoofd ziet. Maar ook hier geldt: de check is pas waardevol als je de suggesties afweegt tegen je eigen context.

Wanneer AI-KPI’s gevaarlijk worden

Vanity metrics

AI optimaliseert voor meetbaarheid, niet voor relevantie. Het suggereert metrics die makkelijk te meten zijn maar weinig zeggen over daadwerkelijk succes.

Zoals GitClear aantoont: “Acceptance rate is fundamentally a proxy for AI assistant quality, yet it is misconstrued as a productivity measure.”4 De acceptance rate van AI-suggesties zegt niets over of de suggestie daadwerkelijk nuttig was. Hetzelfde geldt voor de KPI’s die AI voorstelt.

47% van merken focuste in 2024 meer op “attention metrics” in plaats van traditionele vanity metrics5. Ze kwamen tot dezelfde conclusie: makkelijk meetbaar is niet hetzelfde als betekenisvol.

Context-blindheid

AI weet niet dat jouw bedrijf een specifieke uitdaging heeft die een unieke KPI vereist. Schneider Electric’s chief governance officer stelt: “We want our KPIs to evolve over time because we don’t want to drive our business on legacy or vanity metrics.”6

Dit is de kern van het probleem. Generieke AI-tools hebben geen toegang tot je strategie, je doelen, je canvassen, je kwartaalresultaten. Ze kennen niet de relatie tussen je strategische doelen en de activiteiten die je team dagelijks uitvoert. En dus suggereren ze KPI’s die klinken alsof ze uit een managementboek komen, want dat is precies waar ze vandaan komen.

De oplossing is niet betere prompts schrijven. De oplossing is AI je context geven.

KPI’s die ontstaan uit je strategie, niet uit een prompt

In dare2plan zijn KPI’s geen losstaand lijstje. Ze zijn verbonden met je strategische doelen in het canvas. Wanneer je team een strategisch canvas invult, of dat nu een OGSM, jaarplan of balanced scorecard is, definieer je eerst je doelen. De KPI’s volgen daaruit.

Dat is fundamenteel anders dan AI vragen om een lijst KPI’s te genereren. In het canvas dwing je jezelf om na te denken over de keten: doel, maatstaf, streefwaarde, actie. De KPI is niet een metric die je uit de lucht plukt, het is een maatstaf die logisch volgt uit wat je probeert te bereiken.

De AI-assistent in dare2plan kent die context. Het weet welke doelen je team najaagt, welke initiatieven lopen, en welke resultaten je vorig kwartaal hebt behaald. Wanneer het KPI’s suggereert, zijn die gebaseerd op jouw strategie, niet op wat “de meeste bedrijven” meten.

Een framework voor KPI-evaluatie

Ongeacht of een KPI van AI komt of van je eigen team: toets elke metric aan deze vier criteria.

1. Actie-orientatie

Leidt de KPI tot actie als die de verkeerde kant op gaat? Zo niet, dan is het een vanity metric.

“Websiteverkeer” - Welke actie neem je als dit daalt? Vaak onduidelijk. “Conversieratio van trial naar betaald” - Direct acteerbaar via onboarding verbeteren.

2. Beinvloedbaarheid

Kun je de KPI daadwerkelijk beinvloeden met je acties? Externe factoren die je niet kunt sturen, horen niet in je KPI-set.

3. Leading vs lagging

AI suggereert vaak lagging indicators (resultaten) terwijl je leading indicators (voorspellers) nodig hebt om tijdig bij te sturen.

Lagging: “Kwartaalomzet” Leading: “Aantal gekwalificeerde leads in pipeline”

4. Meetbaarheid vs manipuleerbaarheid

Is de metric gevoelig voor gaming? Als medewerkers de KPI kunnen beinvloeden zonder het onderliggende doel te bereiken, is het een slechte KPI.

Praktijkvoorbeeld: klantretentie

AI suggereert (zonder context):

  • Churn rate
  • Customer lifetime value
  • NPS
  • Herhaalaankopen percentage
  • Support ticket volume
  • Response tijd

Na evaluatie met het framework:

  • Churn rate (lagging, maar cruciaal) - behouden
  • NPS (leading indicator voor churn) - behouden
  • Support ticket volume (niet acteerbaar, kan stijgen door groei) - geschrapt
  • Response tijd (gaming-gevoelig) - geschrapt

In dare2plan’s canvas, verbonden aan het doel “klantretentie verhogen van 85% naar 92%”:

  • Churn rate per klant-segment (specifiek voor jouw klantenbestand)
  • NPS na onboarding (leading indicator, gekoppeld aan je onboarding-initiatief)
  • Percentage klanten dat feature X gebruikt (specifieke leading indicator voor dit bedrijf)
  • Aantal proactieve check-ins met at-risk klanten (proces-KPI, direct acteerbaar)

Het verschil: de eerste lijst is generiek. De derde lijst is verbonden met een specifiek doel, specifieke initiatieven en specifieke klant-segmenten. De KPI’s meten niet “klantretentie in het algemeen”, ze meten of jouw acties werken voor jouw klanten.

De 34% die het goed doet

Slechts 34% van organisaties gebruikt AI om nieuwe KPI’s te genereren, maar van hen ziet 90% verbeteringen6. Dat is een opvallend getal. De organisaties die AI voor KPI’s inzetten, doen het met succes. Maar ze doen het niet door AI blind een lijst te laten genereren. Ze doen het door AI te voeden met hun strategische context.

Het patroon is consistent met wat we bij alle AI-toepassingen zien: de technologie werkt, mits je het de juiste input geeft. En “de juiste input” bij KPI’s is je strategische context: je doelen, je huidige prestaties, je marktpositie, je teamcapaciteit.

Van generieke KPI’s naar context-bewuste metrics

De beste KPI’s zijn vaak niet de meest voor de hand liggende. Ze vereisen nadenken over wat daadwerkelijk succes drijft in jouw unieke context. AI kan dat denkwerk niet vervangen. Maar het kan het versterken, als het je context kent.

Bekijk de dare2plan template bibliotheek en kies het canvas dat past bij je situatie. Wanneer je doelen, KPI’s en acties in een gestructureerd canvas staan, heeft AI iets om mee te werken. Dan verschuift het gesprek van “geef me KPI’s” naar “help me beoordelen of deze KPI’s de juiste dingen meten.”

Het is niet een kwestie van indicatoren afschaffen, maar ze op hun rechtmatige plek zetten: als instrument in dienst van een strategie, niet als strategie op zich1.

Balanced Scorecard

Balanced Scorecard

De Balanced Scorecard (BSC) meet bedrijfsprestaties vanuit vier perspectieven...

Bekijk template

Referenties

  1. Goodhart’s Law. Wikipedia & Bertrand Duperrin (2025). Do you know Goodhart’s law on KPIs and measurement? duperrin.com  2 3

  2. Thomas, R. & Uminsky, D. (2022). Reliance on metrics is a fundamental challenge for AI. Patterns. sciencedirect.com 

  3. Collinear AI (2024). Gaming the System: Goodhart’s Law Exemplified in AI Leaderboard Controversy. collinear.ai 

  4. GitLab (2024). Measuring AI effectiveness beyond developer productivity metrics. gitlab.com 

  5. Today Digital (2025). Vanquishing Vanity in the AI Age: The Digital Marketing Metrics to Watch in 2025. todaydigital.com 

  6. MIT Sloan Management Review (2024). The Future of Strategic Measurement: Enhancing KPIs With AI. sloanreview.mit.edu  2