Het grapje is al gemaakt door anderen dan ik. Door corona is er een
exponentiële stijging van mensen die naar grafieken over exponentiële
stijgingen kijken. En er is ook een exponentiële stijging van mensen die
kritiek hebben op die grafieken. Ik wil er zelf nog een niveautje aan toevoegen,
namelijk door op mijn beurt kritiek te uiten op dat laatste soort mensen. Althans op één van die mensen.
Die mens is Jean-Paul van Bendegem, professor in logica. Hij bekritiseert (hier) de grafiek die gebruikt wordt om de coronamaatregelen uit te leggen, de beroemde ‘flattening the curve’-grafiek. Die grafiek is een sterke vereenvoudiging, vindt hij. Onnadenkende mensen kunnen de grafiek verkeerd interpreteren. Wij hebben nooit geleerd om dergelijke grafieken te interpreteren, zegt hij nog.
Hebben we dat nooit geleerd? Dat weet ik nog zo niet. Mijn leraren wiskunde bijvoorbeeld hebben mij uitgelegd wat een x-as en en y-as was, en al verwissel ik die twee wel eens, ik heb toch min of meer het principe begrepen. Mijn aardrijkskundeboeken stonden vol met grafieken van neerslag en andere gegevens. Op examens moest ik uit zo’n grafiek kunnen afleiden van welk continent of streek de gegevens waren afgebeeld. Ik geloof dat die x-as en y-as en die neerslaggrafieken nog altijd gangbaar zijn in ons onderwijs. Meer nog: de leerlingen van nu moeten zelf al eens zo’n grafiek maken met een elektronisch rekenblad. Zelfs ik, als leraar Nederlands, heb nog zulke grafieken laten maken door mijn leerlingen.
Van Bendegem schrijft dat mensen de ‘flattening the curve’-grafiek verkeerd kunnen interpreteren. Daar twijfel ik niet aan. Mensen kunnen álles verkeerd interpreteren. Je moet maar eens een stukje op facebook plaatsen om er de bewijzen van te zien. Toch geeft de professor eigenlijk geen voorbeelden van dergelijke verkeerde, of schadelijke interpretaties die uit déze grafiek kunnen worden afgeleid. Dat komt volgens mij omdat het een redelijk goede grafiek is.
Een groot deel van Van Bendegems kritiek betreft de vereenvoudigde voorstelling van de complexe werkelijkheid: mooie golvende lijnen, symmetrie in de stijging en daling, geen schaalverdeling met getallen die besmettingen en tijdsverloop weergeven. Om met dat laatste te beginnen: die getallen zijn nog altijd slecht gekend. Waarom zou je cijfers toevoegen die pure veronderstellingen zijn? Dat zou pas tot verkeerde interpretaties aanleiding geven. En met die symmetrie en mooie lijnen heb ik geen probleem. Je moet de zaken niet moeilijker maken dan nodig is in een bepaalde context. Niet makkelijker, maar ook niet moeilijker.
Op de grafiek worden de genezingen niet weergegeven, zegt Van Bendegem. Nee, die worden niet weergegeven. Ik zou ook niet weten hoe je daaraan moet beginnen. Als die genezingen zo belangrijk zijn, zou ik die in een aparte grafiek weergeven. Van Bendegem heeft zelf vier alternatieve grafiekjes getekend, maar daar staat evenmin iets in over genezingen. Hij zal het ook moeilijk hebben gevonden om die in zijn grafiekjes verwerkt te krijgen.
Bijzonder onrechtvaardig vind ik de opmerking over de kleuren. ‘Waarom zijn de oppervlaktes onder de curve gekleurd?’ vraagt Van Bendegem. ‘Dat is nergens voor nodig.’ Maar die kleuren zijn natuurlijk wel ergens voor nodig. Ze maken het veel gemakkelijker om de grafiek in één oogopslag te lezen. ‘Door het gebruik van de rode kleur wordt het signaal gegeven dat wat die curve aangeeft niet in orde is terwijl het groen positief is.’ Akkoord. Maar een besmettingsgraad die boven de capaciteit van het zorgsysteem komt is niet in orde. Waarom dat niet meteen met een alarmerende kleur weergeven? Dat je met die kleuren kunt overdrijven en manipuleren is natuurlijk waar, maar daar zijn betere voorbeelden van te vinden, in het klimaatdebat bijvoorbeeld (zie hier).
De grafiek laat de groene en rode gebieden met elkaar overlappen zodat de kleuren in elkaar vloeien en in het midden een bruin gebied ontstaat. Weer is de professor niet tevreden. ‘Dat suggereert dat de twee curves op elkaar inwerken,’ schrijft hij. Zelf zou ik zoiets nooit hebben gedacht. ’t Is mogelijk, natuurlijk, dat bij sommige mensen die suggestie wel wordt gewekt. Mensen die weinig van samengestelde kleuren afweten, of die héél logisch zijn ingesteld, héél veel van statistiek afweten, en héél weinig op hun intuïtie afgaan. Maar zulke mensen, dat weet de professor ook, zijn dun gezaaid.
Die mens is Jean-Paul van Bendegem, professor in logica. Hij bekritiseert (hier) de grafiek die gebruikt wordt om de coronamaatregelen uit te leggen, de beroemde ‘flattening the curve’-grafiek. Die grafiek is een sterke vereenvoudiging, vindt hij. Onnadenkende mensen kunnen de grafiek verkeerd interpreteren. Wij hebben nooit geleerd om dergelijke grafieken te interpreteren, zegt hij nog.
Hebben we dat nooit geleerd? Dat weet ik nog zo niet. Mijn leraren wiskunde bijvoorbeeld hebben mij uitgelegd wat een x-as en en y-as was, en al verwissel ik die twee wel eens, ik heb toch min of meer het principe begrepen. Mijn aardrijkskundeboeken stonden vol met grafieken van neerslag en andere gegevens. Op examens moest ik uit zo’n grafiek kunnen afleiden van welk continent of streek de gegevens waren afgebeeld. Ik geloof dat die x-as en y-as en die neerslaggrafieken nog altijd gangbaar zijn in ons onderwijs. Meer nog: de leerlingen van nu moeten zelf al eens zo’n grafiek maken met een elektronisch rekenblad. Zelfs ik, als leraar Nederlands, heb nog zulke grafieken laten maken door mijn leerlingen.
Van Bendegem schrijft dat mensen de ‘flattening the curve’-grafiek verkeerd kunnen interpreteren. Daar twijfel ik niet aan. Mensen kunnen álles verkeerd interpreteren. Je moet maar eens een stukje op facebook plaatsen om er de bewijzen van te zien. Toch geeft de professor eigenlijk geen voorbeelden van dergelijke verkeerde, of schadelijke interpretaties die uit déze grafiek kunnen worden afgeleid. Dat komt volgens mij omdat het een redelijk goede grafiek is.
Een groot deel van Van Bendegems kritiek betreft de vereenvoudigde voorstelling van de complexe werkelijkheid: mooie golvende lijnen, symmetrie in de stijging en daling, geen schaalverdeling met getallen die besmettingen en tijdsverloop weergeven. Om met dat laatste te beginnen: die getallen zijn nog altijd slecht gekend. Waarom zou je cijfers toevoegen die pure veronderstellingen zijn? Dat zou pas tot verkeerde interpretaties aanleiding geven. En met die symmetrie en mooie lijnen heb ik geen probleem. Je moet de zaken niet moeilijker maken dan nodig is in een bepaalde context. Niet makkelijker, maar ook niet moeilijker.
Op de grafiek worden de genezingen niet weergegeven, zegt Van Bendegem. Nee, die worden niet weergegeven. Ik zou ook niet weten hoe je daaraan moet beginnen. Als die genezingen zo belangrijk zijn, zou ik die in een aparte grafiek weergeven. Van Bendegem heeft zelf vier alternatieve grafiekjes getekend, maar daar staat evenmin iets in over genezingen. Hij zal het ook moeilijk hebben gevonden om die in zijn grafiekjes verwerkt te krijgen.
Bijzonder onrechtvaardig vind ik de opmerking over de kleuren. ‘Waarom zijn de oppervlaktes onder de curve gekleurd?’ vraagt Van Bendegem. ‘Dat is nergens voor nodig.’ Maar die kleuren zijn natuurlijk wel ergens voor nodig. Ze maken het veel gemakkelijker om de grafiek in één oogopslag te lezen. ‘Door het gebruik van de rode kleur wordt het signaal gegeven dat wat die curve aangeeft niet in orde is terwijl het groen positief is.’ Akkoord. Maar een besmettingsgraad die boven de capaciteit van het zorgsysteem komt is niet in orde. Waarom dat niet meteen met een alarmerende kleur weergeven? Dat je met die kleuren kunt overdrijven en manipuleren is natuurlijk waar, maar daar zijn betere voorbeelden van te vinden, in het klimaatdebat bijvoorbeeld (zie hier).
De grafiek laat de groene en rode gebieden met elkaar overlappen zodat de kleuren in elkaar vloeien en in het midden een bruin gebied ontstaat. Weer is de professor niet tevreden. ‘Dat suggereert dat de twee curves op elkaar inwerken,’ schrijft hij. Zelf zou ik zoiets nooit hebben gedacht. ’t Is mogelijk, natuurlijk, dat bij sommige mensen die suggestie wel wordt gewekt. Mensen die weinig van samengestelde kleuren afweten, of die héél logisch zijn ingesteld, héél veel van statistiek afweten, en héél weinig op hun intuïtie afgaan. Maar zulke mensen, dat weet de professor ook, zijn dun gezaaid.
Van Bendegem geeft ook commentaar op de vlakke stippellijn van de
zorgcapaciteit die horizontaal loopt. ‘Waarom wordt die capaciteit
verondersteld constant te zijn? Kan de overheid niet tussenkomen en de
capaciteit opdrijven?’ En om zijn punt te illustreren tekent hij zelf een
grafiek met een miraculeus oplopende stippellijn. Het is jammer, maar de
ervaringen van Italië tot België hebben laten zien dat een snelle
vermenigvuldiging van beademingstoestellen en verzorgend personeel niet voor de
hand ligt. Integendeel, omdat een deel van het verzorgend personeel zelf
ziek wordt, kan de zorgcapaciteit zelfs dalen. In die omstandigheden lijkt een
horizontale stippellijn een goed compromis.
Van Bendegem zoekt geen ruzie met de mensen van de grafiek. Hij betwist
hun boodschap niet. Zo zoek ik ook geen ruzie met Van Bendegem. Ik betwist zijn
boodschap evenmin. Mocht ik volgend jaar nog les geven, dan zou ik overwegen om
zijn tekst in mijn cursus op te nemen, omdat hij zo helder is, en een
interessant probleem aankaart. Maar door de keuze van zijn voorbeeld heeft de
professor zichzelf klemgereden en moet hij spijkers op laag water zoeken. Een beetje
zoals boekjes over drogredenen vol staan met voorbeelden die, goed beschouwd,
geen drogredenen zijn. Of zoals dat boekje ‘How to Lie with Statistcs’ vol staat met statistieken die,
goed beschouwd, niet leugenachtig zijn.
Spijkers op laag water dus. Maar in één geval gaat het om iets anders, namelijk
wanneer de professor de verhouding tussen de curves bespreekt. Dan zoekt hij geen spijkers meer, maar slaat op één ervan. Helaas komt hij, naar mijn smaak, uit net náást de kop. ‘Moet dan de piek van de rode curve
zo veel hoger liggen,’ zo vraagt hij zich af, ‘dan die van de groene? Nog los van
het feit dat men [niet weet] wat het maximaal aantal
besmettingen zou kunnen zijn.’ Dat is scherp opgemerkt. Als men noch de juiste
besmettelijkheid, noch het maximaal aantal besmettingen kent, kan men ook de
piek van de rode curve niet goed berekenen. En als men het effect van de maatregelen
niet kent, kan men de groene curve evenmin berekenen. Van Bendegem maakt dan weer
zelf een tekeningetje met een rode curve die amper boven de groene uitkomt.
Maar het onbedoelde resultaat is dat het groene gebied op de schets van de
professor veel groter wordt dan het rode gebied. Terwijl het groene gebied in
zo’n schets, waar geen andere variabelen in rekening worden gebracht, juist
gelijk zou moeten zijn aan het rode.
Kijken we nu even naar de oorspronkelijke grafiek die door Van Bendegem wordt bekritiseerd wordt. Daar zien we precies dezelfde fout optreden, maar dan in de omgekeerde richting. Het groene gebied is veel kleiner dan het rode. Het is eigenaardig dat Van Bendegem, die op alle slakken zout legt, daar niets over zegt. Hier is nu immers écht een bron van verkeerde interpretatie, vooral voor de optimisten onder ons. Dat kleinere groene gebied suggereert namelijk dat de maatregelen niet alleen zorgen voor een spreiding van de besmettingen over een langere periode, maar ook voor een vermindering in het aantal ervan. Zo’n vermindering zou wenselijk zijn, daar niet van, maar heeft op zich niets te maken met de capaciteit van ons zorgsysteem. Ik zou die complicatie er buiten laten en de oppervlakte van de twee gebieden, rood en groen, gelijk houden. Een grafiek moet eenvoudig zijn. Eén probleem tegelijk! Wie kwaad spreekt van vereenvoudiging, krijgt met mij te doen.
Kijken we nu even naar de oorspronkelijke grafiek die door Van Bendegem wordt bekritiseerd wordt. Daar zien we precies dezelfde fout optreden, maar dan in de omgekeerde richting. Het groene gebied is veel kleiner dan het rode. Het is eigenaardig dat Van Bendegem, die op alle slakken zout legt, daar niets over zegt. Hier is nu immers écht een bron van verkeerde interpretatie, vooral voor de optimisten onder ons. Dat kleinere groene gebied suggereert namelijk dat de maatregelen niet alleen zorgen voor een spreiding van de besmettingen over een langere periode, maar ook voor een vermindering in het aantal ervan. Zo’n vermindering zou wenselijk zijn, daar niet van, maar heeft op zich niets te maken met de capaciteit van ons zorgsysteem. Ik zou die complicatie er buiten laten en de oppervlakte van de twee gebieden, rood en groen, gelijk houden. Een grafiek moet eenvoudig zijn. Eén probleem tegelijk! Wie kwaad spreekt van vereenvoudiging, krijgt met mij te doen.
Geen opmerkingen:
Een reactie posten