Longreads: als het ietsje (of veel) langer mag zijn

dinsdag 7 april 2020

Kritiek op de grafiek

     Het grapje is al gemaakt door anderen dan ik. Door corona is er een exponentiële stijging van mensen die naar grafieken over exponentiële stijgingen kijken. En er is ook een exponentiële stijging van mensen die kritiek hebben op die grafieken. Ik wil er zelf nog een niveautje aan toevoegen, namelijk door op mijn beurt kritiek te uiten op dat laatste soort mensen. Althans op één van die mensen.
     Die mens is Jean-Paul van Bendegem, professor in logica. Hij bekritiseert (hier) de grafiek die gebruikt wordt om de coronamaatregelen uit te leggen, de beroemde ‘flattening the curve’-grafiek. Die grafiek is een sterke vereenvoudiging, vindt hij. Onnadenkende mensen kunnen de grafiek verkeerd interpreteren.  Wij hebben nooit geleerd om dergelijke grafieken te interpreteren, zegt hij nog.
     Hebben we dat nooit geleerd? Dat weet ik nog zo niet. Mijn leraren wiskunde bijvoorbeeld  hebben mij uitgelegd wat een x-as en en y-as was, en al verwissel ik die twee wel eens, ik heb toch min of meer het principe begrepen. Mijn aardrijkskundeboeken stonden vol met grafieken van neerslag en andere gegevens. Op examens moest ik uit zo’n grafiek kunnen afleiden van welk continent of streek de gegevens waren afgebeeld. Ik geloof dat die x-as en y-as en die neerslaggrafieken nog altijd gangbaar zijn in ons onderwijs. Meer nog: de leerlingen van nu moeten zelf al eens zo’n grafiek maken met een elektronisch rekenblad. Zelfs ik, als leraar Nederlands, heb nog zulke grafieken laten maken door mijn leerlingen.
     Van Bendegem schrijft dat mensen de ‘flattening the curve’-grafiek verkeerd kunnen interpreteren. Daar twijfel ik niet aan. Mensen kunnen álles verkeerd interpreteren. Je moet maar eens een stukje op facebook plaatsen om er de bewijzen van te zien. Toch geeft de professor eigenlijk geen voorbeelden van dergelijke verkeerde, of schadelijke interpretaties die uit déze grafiek kunnen worden afgeleid. Dat komt volgens mij omdat het een redelijk goede grafiek is.
     Een groot deel van Van Bendegems kritiek betreft de vereenvoudigde voorstelling van de complexe werkelijkheid: mooie golvende lijnen, symmetrie in de stijging en daling, geen schaalverdeling met getallen die besmettingen en tijdsverloop weergeven. Om met dat laatste te beginnen: die getallen zijn nog altijd slecht gekend. Waarom zou je cijfers toevoegen die pure veronderstellingen zijn? Dat zou pas tot verkeerde interpretaties aanleiding geven. En met die symmetrie en mooie lijnen heb ik geen probleem. Je moet de zaken niet moeilijker maken dan nodig is in een bepaalde context. Niet makkelijker, maar ook niet moeilijker.
     Op de grafiek worden de genezingen niet weergegeven, zegt Van Bendegem. Nee, die worden niet weergegeven. Ik zou ook niet weten hoe je daaraan moet beginnen. Als die genezingen zo belangrijk zijn, zou ik die in een aparte grafiek weergeven. Van Bendegem heeft zelf vier alternatieve grafiekjes getekend, maar daar staat evenmin iets in over genezingen. Hij zal het ook moeilijk hebben gevonden om die in zijn grafiekjes verwerkt te krijgen.
     Bijzonder onrechtvaardig vind ik de opmerking over de kleuren. ‘Waarom zijn de oppervlaktes onder de curve gekleurd?’ vraagt Van Bendegem. ‘Dat is nergens voor nodig.’ Maar die kleuren zijn natuurlijk wel ergens voor nodig. Ze maken het veel gemakkelijker om de grafiek in één oogopslag te lezen. ‘Door het gebruik van de rode kleur wordt het signaal gegeven dat wat die curve aangeeft niet in orde is terwijl het groen positief is.’ Akkoord. Maar een besmettingsgraad die boven de capaciteit van het zorgsysteem komt is niet in orde. Waarom dat niet meteen met een alarmerende kleur weergeven? Dat je met die kleuren kunt overdrijven en manipuleren is natuurlijk waar, maar daar zijn betere voorbeelden van te vinden, in het klimaatdebat bijvoorbeeld (zie hier).
     De grafiek laat de groene en rode gebieden met elkaar overlappen zodat de kleuren in elkaar vloeien en in het midden een bruin gebied ontstaat. Weer is de professor niet tevreden.  ‘Dat suggereert dat de twee curves op elkaar inwerken,’ schrijft hij. Zelf zou ik zoiets nooit hebben gedacht. ’t Is mogelijk, natuurlijk, dat bij sommige mensen die suggestie wel wordt gewekt. Mensen die weinig van samengestelde kleuren afweten, of die héél logisch zijn ingesteld, héél veel van statistiek afweten, en héél weinig op hun intuïtie afgaan. Maar zulke mensen, dat weet de professor ook, zijn dun gezaaid.
     Van Bendegem geeft ook commentaar op de vlakke stippellijn van de zorgcapaciteit die horizontaal loopt. ‘Waarom wordt die capaciteit verondersteld constant te zijn? Kan de overheid niet tussenkomen en de capaciteit opdrijven?’ En om zijn punt te illustreren tekent hij zelf een grafiek met een miraculeus oplopende stippellijn. Het is jammer, maar de ervaringen van Italië tot België hebben laten zien dat een snelle vermenigvuldiging van beademingstoestellen en verzorgend personeel niet voor de hand ligt. Integendeel, omdat een deel van het verzorgend personeel zelf ziek wordt, kan de zorgcapaciteit zelfs dalen. In die omstandigheden lijkt een horizontale stippellijn een goed compromis.
     Van Bendegem zoekt geen ruzie met de mensen van de grafiek. Hij betwist hun boodschap niet. Zo zoek ik ook geen ruzie met Van Bendegem. Ik betwist zijn boodschap evenmin. Mocht ik volgend jaar nog les geven, dan zou ik overwegen om zijn tekst in mijn cursus op te nemen, omdat hij zo helder is, en een interessant probleem aankaart. Maar door de keuze van zijn voorbeeld heeft de professor zichzelf klemgereden en moet hij spijkers op laag water zoeken. Een beetje zoals boekjes over drogredenen vol staan met voorbeelden die, goed beschouwd, geen drogredenen zijn. Of zoals dat boekje ‘How to Lie with Statistcs’  vol staat met statistieken die, goed beschouwd, niet leugenachtig zijn.
     Spijkers op laag water dus. Maar in één geval gaat het om iets anders, namelijk wanneer de professor de verhouding tussen de curves bespreekt. Dan zoekt hij geen spijkers meer, maar slaat op één ervan. Helaas komt hij, naar mijn smaak, uit net náást de kop. ‘Moet dan de piek van de rode curve zo veel hoger liggen, zo vraagt hij zich af, dan die van de groene? Nog los van het feit dat men [niet weet] wat het maximaal aantal besmettingen zou kunnen zijn.’ Dat is scherp opgemerkt. Als men noch de juiste besmettelijkheid, noch het maximaal aantal besmettingen kent, kan men ook de piek van de rode curve niet goed berekenen. En als men het effect van de maatregelen niet kent, kan men de groene curve evenmin berekenen. Van Bendegem maakt dan weer zelf een tekeningetje met een rode curve die amper boven de groene uitkomt. Maar het onbedoelde resultaat is dat het groene gebied op de schets van de professor veel groter wordt dan het rode gebied. Terwijl het groene gebied in zo’n schets, waar geen andere variabelen in rekening worden gebracht, juist gelijk zou moeten zijn aan het rode.
    Kijken we nu even naar de oorspronkelijke grafiek die door Van Bendegem wordt bekritiseerd wordt. Daar zien we precies dezelfde fout optreden, maar dan in de omgekeerde richting. Het groene gebied is veel kleiner dan het rode. Het is eigenaardig dat Van Bendegem, die op alle slakken zout legt, daar niets over zegt. Hier is nu immers écht een bron van verkeerde interpretatie, vooral voor de optimisten onder ons. Dat kleinere groene gebied suggereert namelijk dat de maatregelen niet alleen zorgen voor een spreiding van de besmettingen over een langere periode, maar ook voor een vermindering in het aantal ervan. Zo’n vermindering zou wenselijk zijn, daar niet van, maar heeft op zich niets te maken met de capaciteit van ons zorgsysteem. Ik zou die complicatie er buiten laten en de oppervlakte van de twee gebieden, rood en groen, gelijk houden. Een grafiek moet eenvoudig zijn. Eén probleem tegelijk! Wie kwaad spreekt van vereenvoudiging, krijgt met mij te doen.
    

     Hieronder drie grafieken over hetzelfde probleem. De eerste – waar Van Bendegem kritiek op heeft – maximaliseert het effect van de maatregelen. De tweede – die Van Bendegem  zelf getekend heeft– minimaliseert ze. De derde is min of meer neutraal. Zou Van Bendgem zich nu afvragen wat er op de laatste grafiek gebeurt met het rode gebied dat áchter het blauwe verdwijnt?







Geen opmerkingen:

Een reactie posten