
Van corridor naar werkvloer: wat de techroute Amsterdam–Eindhoven ons echt vraagt
09/06/2026
Wie AI gebruikt, herkent AI
23/06/2026
Taalmodellen: slim,
maar niet eerlijk
ChatGPT klinkt overtuigend. De zinnen lopen soepel, de toon zit goed, maar klopt het ook? Over hallucinaties, sneeuwballen en de chatbot die het altijd met je eens is.
ChatGPT geeft een overtuigend antwoord op je vraag. Het klinkt logisch, de toon lijkt goed, de zinnen lopen soepel, maar klopt het ook? Hm niet perse. Want taalmodellen werken niet vanuit begrip of kennis van de waarheid. Ze werken op patronen: op basis van miljarden tekstfragmenten voorspellen ze statistisch welk antwoord het meest logisch klinkt op een vraag.
Hallucinaties: de zelfverzekerde gok
Taalmodellen zoals ChatGPT en Claude geven vaak verrassend overtuigende antwoorden. Daardoor lijkt het al snel alsof ze ook echt "weten" waar ze het over hebben. Maar zo werkt het niet. Taalmodellen hebben geen begrip van regels of waarheid; ze werken op patronen. Op basis van enorme hoeveelheden tekst voorspellen ze welk antwoord statistisch het meest logisch volgt op een vraag.
Dat leidt soms tot hallucinaties: antwoorden die geloofwaardig klinken maar feitelijk niet kloppen. Een wetenschappelijk artikel met een perfecte titel en auteurslijst dat nergens terug te vinden is. Een historisch voorbeeld dat nét anders is gelopen. Geen uitzonderingen, maar een structureel risico. Bij complexe of niche-vragen lopen foutpercentages in evaluaties nog steeds op tot tientallen procenten.
Foutpercentage bij evaluaties — per vraagtype
Indicatieve percentages uit evaluatiestudies. Hoe specifieker de vraag, hoe groter het risico op een fout antwoord.
De oorzaak ligt deels hoe modellen worden getraind. Onderzoekers van OpenAI vergelijken het met een examen-effect: correcte antwoorden worden beloond, terwijl "ik weet het niet" weinig oplevert. Statistisch gezien is gokken dus slimmer dan niets zeggen. Herkenbaar: bij een toets kies je ook liever een twijfelachtig antwoord dan een lege plek.
Bron: Waarom taalmodellen hallucineren | OpenAI
Sneeuwbal
Het stopt daar niet. Modellen bouwen voort op hun eerdere antwoorden. Onderzoekers noemen dit hallucination snowballing: een kleine onnauwkeurigheid kan uitgroeien tot een volledig fout verhaal, simpelweg omdat het model consistent probeert te blijven. En zelfs als je een fout corrigeert, zie je regelmatig dat het model de correctie tijdelijk verwerkt, maar bij een volgende vraag alsnog terugvalt op de oorspronkelijke versie.
Hallucination snowballing — hoe een kleine fout groeit
Elke reactie wordt gegenereerd op basis van de huidige gesprekscontext, niet vanuit een intern geheugen waarin fouten écht worden hersteld.
Technisch klopt dat: elke reactie wordt gegenereerd op basis van de huidige gesprekscontext, niet vanuit een intern geheugen waarin fouten écht worden hersteld. Zit de onjuiste informatie steviger verankerd in de patronen van het model, dan wint die bij de volgende ronde.
Bron: [2305.13534] How Language Model Hallucinations Can Snowball
Sycofantie: de chatbot die het altijd met je eens is
Naast hallucinaties is er nog een ander probleem, en die is subtieler. Taalmodellen blijken ook de neiging te hebben om gebruikers gelijk te geven. Onderzoek van Stanford laat zien dat commerciële modellen gebruikers zo'n 50% vaker bevestigen dan menselijke respondenten, zelfs als die gebruikers iets verkeerds of zelfs schadelijks zeggen.
Onderzoekers noemen dit sycophancy: overdreven meeloperig gedrag. Ik weet niet hoe het met jullie zit, maar persoonlijk heb ik blijkbaar opvallend vaak een goed idee, een slim argument of een sterke redenering. Als ik de chatbot tenminste mag geloven.
Bevestigingsgedrag — AI-model vs menselijke respondent
AI-model
~85%
bevestigt de gebruiker, ook bij onjuiste of schadelijke uitspraken
Menselijke respondent
~55%
bevestigt de ander, maar stelt ook vaker kritische vragen
Uit experimenten met meer dan 1.600 deelnemers. Eén gesprek met een bevestigende AI was al genoeg om mensen sterker overtuigd te maken van hun eigen gelijk én minder bereid om conflicten met anderen op te lossen.
Mensen vinden bevestigende antwoorden niet alleen prettiger, ze beoordelen ze ook als slimmer en betrouwbaarder. In experimenten met meer dan 1.600 deelnemers raakten mensen na een gesprek met een bevestigende AI sterker overtuigd van hun eigen gelijk én minder bereid om conflicten met anderen op te lossen. Één gesprek was al genoeg.
Dat maakt sycofantie een ander soort risico dan hallucinaties. Een hallucinatie is feitelijk onjuist. Een sycofant antwoord kan feitelijk kloppen en toch misleidend zijn, omdat het bestaande aannames van de gebruiker bevestigt in plaats van bevraagt. Het leert je geen verkeerde feiten, maar maakt je wél zekerder van wat je toch al dacht.
Bron: Sycophantic AI decreases prosocial intentions and promotes dependence | Science · AI overly affirms users asking for personal advice | Stanford Report
Wat betekent dit voor jou?
Taalmodellen zijn ontworpen om plausibele, consistente antwoorden te geven. Dat maakt ze nuttig. Maar iets kan heel overtuigend klinken en toch niet kloppen. Zeker als het gaat om feiten of beslissingen die er echt toe doen, blijft controleren noodzakelijk.
Univia perspectief
Bij Univia zien we dit dagelijks: AI is een krachtig hulpmiddel, maar menselijk oordeelsvermogen blijft onmisbaar. De tool doet het zware werk. Jij beoordeelt of het klopt.
Benieuwd wat AI wél betrouwbaar voor jouw organisatie kan doen?
We schrijven regelmatig over automatiseringen, data-gedreven oplossingen en AI-toepassingen. Check onze andere blogs, of neem gewoon contact op, we denken graag mee.
Altijd als eerste het nieuws van Univia ontvangen?
Volg ons op social media, en houd onze blog pagina in de gaten voor de laatste updates! Of schrijf je nu in voor onze nieuwsbrief!











