Scores? Testen? Waar hebben we het eigenlijk over?

Scores? Testen? Waar hebben we het eigenlijk over?

De laatste dagen is er ophef rondom de RAKIT-2 en de differentiërende waarde ervan bij scores boven 130, nadat er uitspraken gedaan zijn over een plafondeffect bij oudere kinderen binnen deze test. Vervelend, want het kan onzekerheid en meer discussie geven bij individuele gezinnen en scholen. Ook goed, omdat het iedereen forceert om goed te kijken naar de koppeling tussen statistiek en praktijk. Om heel kritisch te kijken naar de individuele toepassing van scores die uit testen komen en de wetenschap hierachter. Ik merk dat ik het een lastige discussie vind, omdat dit vooral gaat over de koppeling van onderzoek naar praktijk en grotendeels voorbij gaat aan de waarde die ik hecht aan het doen van diagnostiek. Juist het in kaart brengen van een persoon en niet de scores. Ik snap dat de scores belangrijk zijn voor erkenning en duidelijkheid, maar het geeft wel een waarde aan diagnostiek die ik er liever niet aan geef. Omdat we aan beiden niet ontkomen, beschrijf ik dus graag wat meer context.

De wetenschappelijke kant

Belangrijke nuance op de twijfel rondom toepassing van de RAKIT-2 bij hoogbegaafde kinderen: in de presentatie die genoemd werd, is aangegeven dat er in IQ’s boven 130 bij de RAKIT-2 niet vanzelfsprekend goed gedifferentieerd wordt. De onderbouwing van deze uitspraak is in het genoemde filmpje overigens niet gegeven. Dit is iets anders dan dat je bij de RAKIT-2 snel een hele hoge score behaalt. Het onderscheid tussen 130 en 145+ is alleen lastiger zuiver te maken. Mogelijk is het handig om bijvoorbeeld bij de RAKIT-2 betrouwbaarheidsintervallen te gebruiken en geen puntscores. In hoeverre de WISC-V een vollediger en betrouwbaarder beeld geeft bij hoogbegaafde kinderen, wordt niet verder onderbouwd en staat in contrast met informatie uit de handleiding van de WISC-V waarin hoogbegaafde kinderen als groep worden genoemd die specifieke, onevenwichtige intelligentieprofielen laten zien. Wanneer je kijkt naar beide testen en de toepassing hiervan bij hoogbegaafde kinderen, zitten er dus altijd voor- en nadelen aan het gebruik van beide testen. Of de RAKIT-2 en WISC-V toegepast worden en met welke onderbouwing, lijkt mij dus een persoonlijke keuze en moet altijd door de professional voorzien worden van context en verantwoording.

G factor en betrouwbaarheid

De heilige graal van intelligentieonderzoek is de g-factor (staat voor general intelligence). Dit is de overkoepelende intelligentiescore, vaak genoemd als Totaal IQ. Deze wordt uiteindelijk weer opgesplitst in verschillende factoren, waarbij al lang de zoektocht is welke losse vaardigheden er betrouwbaar en valide uit deze g-factor gedifferentieerd kunnen worden. En die zoektocht is fors, want hoewel hier wetenschappelijk gezien wel losse componenten uitkomen, zijn deze niet vanzelfsprekend op individueel niveau toepasbaar in de praktijk.

Zo zie je bij verschillende onderzoeken ook verschillende correlaties worden gemeten tussen de afzonderlijke factoren van de intelligentie en de g-factor. Binnen de WISC-V in Nederland zijn de correlaties van drie van de vijf onderliggende factoren met het totaal IQ redelijk hoog (0.83 tot 0.96), behalve de verwerkingssnelheid factor (0.60) en de verbaal begrip factor (0.73, bron: WISC-V handleiding). Deze twee laatste factoren hebben onvoldoende betrouwbaarheid om uitspraken en beslissingen op individueel niveau mee te doen (naar aanleiding van door COTAN vastgestelde criterium van minimaal 0.80). Voor de RAKIT-2 wordt voor onderliggende factoren hier in het algemeen wel aan voldaan (0.83 tot 0.95, bron: RAKIT-2 handleiding). Voor hoogbegaafde kinderen valt hierin wel op dat zij als groep lagere scores behalen op de WISC-V factoren Werkgeheugen en Verwerkingssnelheid (bron: handleiding WISC-V). In Amerika zijn hierover al aparte richtlijnen opgesteld rondom het gebruik van de intelligentieprofielen bij hoogbegaafde kinderen, maar in Nederland hebben we deze nog niet en is er voor de Nederlandse versie nog onvoldoende sluitende duidelijkheid. Bij de RAKIT-2 is hier onvoldoende over bekend voor de specifieke doelgroep hoogbegaafde kinderen.

In principe kunnen we dus stellen dat er in Nederland geen eenduidig goede test is voor de doelgroep hoogbegaafde kinderen. Hierbij kun je je ook afvragen of je met een IQ test altijd letterlijk IQ meet, of dat er ruis op de lijn is. Beide punten zijn een inherent onderdeel van het doen van diagnostiek en moeten professionals rekening mee houden.

Normen voor hoogbegaafde kinderen

Vanuit de handleidingen van de RAKIT-2 en de WISC-V kan gesteld worden dat van beide testen het moeilijk is om betrouwbare puntsgewijze scores te krijgen voor kinderen die binnen de uiteinden van een normaalverdeling vallen. Voor betrouwbare normen heb je namelijk veel deelnemers nodig in de steekproef en zeker in de hogere intelligenties zijn er in Nederland weinig mensen om deel te nemen. In de VS is dit gezien de grootte van hun bevolking makkelijker. Hiernaast wordt er in normeringsonderzoek voornamelijk gericht op de algemene populatie en vaak ook op mensen met leerproblemen of een verstandelijke beperking. Belangrijk, omdat dit de spreiding van de scores in kaart kan brengen en mensen met cognitieve moeilijkheden een grote doelgroep zijn waar intelligentieonderzoek op gericht wordt. Daarom is de keuze voor hogere normen en de beschrijving van de doelgroep hoogbegaafde kinderen bij de WISC-V interessant, maar daar blijkt dus eigenlijk juist een probleem uit als we daar dieper naar kijken. In plaats van meer aandacht te besteden aan het passend maken van deze normen (ook voor de normen boven 145), is naar mijn mening vooral gerapporteerd over een gebrek in de toepassing van normen binnen de WISC-V. Een dergelijk gebrek komt nu dus ook naar voren binnen de RAKIT-2. Aan beide testen zitten dus voor- en nadelen voor de toepassing bij hoogbegaafde kinderen.

De menselijke kant

Verschillende referentiekaders in onderzoek

Wanneer ik lezingen en trainingen geef, leg ik altijd uit dat er verschillende manieren zijn om te kijken naar de oorzaak van problematiek. Neuropsychologie, vaardigheden, vermogens, gedragspatronen, persoonlijkheid, opvoedproblematiek, verminderd welzijn, van alles! Deze referentiekaders kunnen naast elkaar bestaan en hebben allemaal hun waarde. Belangrijk hierbij is wel om te beseffen dat vragenlijsten en testen dit onderscheid niet vanzelfsprekend maken. De output van een vragenlijst over executieve vaardigheden gaat over de mate waarin een kind deze gedragingen laat zien, maar nog niet over de reden waarom een kind dergelijk gedrag vertoont. De vraag blijft dan of de conclusie dat een kind niet kan plannen op zijn plaats is, als er te weinig wordt gekeken naar de reden achter het gedrag. Een andere meting in een andere context kan namelijk anders uitvallen. Terwijl dit wel in de resultaten zo naar voren komt, bijvoorbeeld ‘lage mate van planvaardigheid’ kan een conclusie dat een kind de vaardigheid om te plannen niet heeft totaal onjuist zijn. Bij intelligentieonderzoek is dat net zo goed, omdat de output intellectuele vermogens en subschalen aangeeft. De context van het gedrag (o.a. interactie met materiaal en onderzoeker, motivatie) waar die scores uit voortkomen zit niet in de score genoemd. Het is aan de onderzoeker om verschillende stukjes informatie te integreren tot een genuanceerd beeld van een persoon en diens situatie.

Hierbij moet ik altijd denken aan een fenomeen frenologie. Dit is een stroming in de wetenschap van vroeger, waarbij karaktereigenschappen en ook vermogens van een persoon in kaart werden gebracht naar aanleiding van de vorm van de schedel. Inmiddels is deze stroming wetenschappelijk sterk achterhaald en wordt dit niet meer gebruikt. Hiermee niet zeggende dat intelligentieonderzoek eenzelfde nonsens is, maar weldenkende mensen hebben ook langere tijd de output van een dergelijk systeem geloofd. Het gaf een vorm van schijnveiligheid: “Het is gemeten, dus het is zo en dat verklaart wat ik zie.” Dat zie je ook terug bij discussies rondom het disharmonisch intelligentieprofiel, de definitie van hoogbegaafdheid en uitspraken over een lagere verwerkingssnelheid. Er is in de wetenschap continu sprake van voortschrijdend inzicht, dat we werken vanuit theorieën (geen feiten) en de erkenning dat generalisatie van groepsniveau naar het individu een ingewikkelde stap is. Juist hierbij is het belangrijk om verschillende referentiekaders met elkaar te integreren en continu te kijken naar de context van gedrag.

IQ test én psycholoog als middel, niet als doel

Moeten we dan helemaal niet meer testen of gaan wij vanuit Edu & ik stoppen met het gebruik van IQ testen? Nee, omdat diagnostiek een ontzettend mooi middel blijft om een individu en zijn behoeften in kaart te brengen. Je hebt meer controle over een context en kunt zeer gedetailleerd kijken naar oorzaak-gevolgrelaties, waar in een andere context geen tijd of reflectie genoeg voor is. Wat dit wel laat zien, is dat we ontzettend moeten oppassen met individuele uitspraken als gevolg van de score die er uit een test of schaal komt. Dat het veel belangrijker is om te kijken naar de mens die je tegenover je hebt en de verschillende aspecten van die persoon en de onderliggende behoeftes en dat je die in kaart probeert te brengen. Doet het er dan niet toe of een score zuiver/hoog/laag/betrouwbaar is? Natuurlijk wel, dus de wetenschap én professionals hebben een belangrijke taak om scores zo goed mogelijk aan te laten sluiten bij de individu en groep waar de scores over gaan. Het gaat dus om zowel de score als de kwalitatieve informatie.

Een intelligentieonderzoek blijft daarin een mooi middel, omdat er zoveel ruimte is om te observeren wat er gebeurt in contact, onder spanning en welke behoeftes iemand hierin heeft. Dat de wetenschap achter IQ testen bij individuen in de praktijk kan rammelen, is juist een pleidooi voor het inzetten van goed klinisch inzicht door een professional. Dit is wat mij betreft geen unieke discussie rondom de WISC-V, RAKIT-2 of elk ander middel voor psychodiagnostiek. Je bent als psycholoog of orthopedagoog je eigen beste middel en daar moet de expertise zitten om afwegingen te maken en nuances in kaart te brengen. Dit in overeenstemming met de Beroepscode van het Nederlands Instituut voor Psychologen en de Algemene Standaard Testgebruik NIP 2017, waarin beschreven staat dat psychologen hierin zowel de vrijheid als verantwoordelijkheid hebben om eigen keuzes te maken in het gebruiken van materiaal om een beoogd doel te bereiken, zolang dit verantwoord kan worden.

Het liefst gebruik ik in een intelligentieonderzoek de scores vaag en globaal en leg ik de nadruk op observatiegegevens in de context van de situatie, vanuit het idee dat het nooit verstandig is om harde uitspraken te doen over een individu op basis van normen. Dan blijft de indruk van gedrag over, die genuanceerd en concreet beschreven moet worden. Juist tijdens een intelligentieonderzoek zie je een rijkdom aan gedragspatronen, interacties en groei. Dat is niet in een score te vangen, maar wel op individueel niveau te interpreteren. Daar zit de koppeling naar de praktijk en de context van gedrag. Daarbij ontkomen we er niet aan dat er altijd een mate van interpretatie is en dat we goed moeten samenwerken om de uitkomsten van onderzoeken goed plaatsbaar te maken in de praktijk. Of de nieuwe ophef verandert hoe wij binnen Edu & ik omgaan met scores en testen, gaan we heel goed overleggen en verder ontwikkelen. Ook hierin willen we graag voortschrijdend inzicht erkennen. Daarin blijf ik erbij dat de RAKIT-2 een mooi middel is voor het doel wat onze diagnostiek beoogt te halen en dat we als werkveld anders met scores om moeten gaan.

Het liefst heb ik hier de discussie over, over oordeelloos observeren en genuanceerd klinisch inzicht inzetten in plaats van over de eenduidige waarde van verschillende onderzoeksmiddelen, zodat we zo duidelijk mogelijk in kaart kunnen brengen wat een kind nodig heeft. Daarin zitten zoveel nuances en kanten waarop je gedrag kunt interpreteren en referentiekaders waar je je als onderzoeker bewust van moet zijn dat dit een grote mate van vakkundigheid vraagt, zeker bij hoogbegaafde kinderen die zich (ook) sterk bewust zijn van de ander en de omgeving.

Geen reactie's

Geef een reactie