De onenigheid

In de serie Denken in Tijden van Corona gaat het deze keer over De Onenigheid.

De onderstaande figuur is bekend als de Hasen-Enten-Kopf uit Fact and Fable in Psychology van de in Polen geboren Amerikaanse wetenschapper Joseph Jastrow (1863-1944).

De Figuur die Wittgenstein van Jastrow heeft overgenomen
(Philosophische Untersuchungen II-xi

Het is een plaatje dat ik al lange tijd met me meedraag en dat zo nu en dan oppopt. Kennelijk omdat het brein vindt dat het moment daar is om mij eraan te herinneren.

Voor wie in de figuur een hazekop ziet is het een tekening van een hazekop. Een ander kan er niets anders dan een eendekop in zien. De Oostenrijks-Britse filosoof Wittgenstein (1889-1951) spreekt hier van “het oplichten van verschillende aspecten“.

Wanneer spreker X er een haas inziet en dat meedeelt aan mens Y die er een eend inziet dan kan vrij gemakkelijk een dialoog ontstaan van de vorm: X: Haas! Y: Eend! X: Haas! Y :Eend…

Wat is er de oorzaak van dat de een er een haas, de ander, of misschien dezelfde persoon op een ander moment, er een eend in ziet? De vraag naar de oorzaak is de vraag naar inzicht in de werking van het onderliggende mechanisme dat resulteert in het beeld van een haas hetzij een eend. Voor zover ik weet is er nog geen bevredigende verklaring voor dit fenomeen geformuleerd. Geen verklaring waar de experts het over eens zijn.

Misschien moeten we het maar op toeval houden; wat dat ook moge zijn. Maar, als er sprake is van een oorzakelijk verband wat is dan oorzaak en wat is gevolg? Wat is mijn subjectieve persoonlijke bijdrage en wat is de bijdrage van het object dat ik waarneem zoals ik het waarneem, aan het oplichten van dit of dat bepaalde aspect?

Een Paradox

Ik moest onlangs weer aan dit plaatje denken, toen ik via een bericht in de sociale media door de wetenschapper Judea Pearl gewezen werd op de discussie omtrent Simpson’s paradox. De discussie wordt al een eeuw lang gevoerd. Ze is onlangs nieuw leven ingeblazen door het verschijnen van The Book of Why van Pearl. Het boek behandelt de Causale Revolutie in de wetenschap. Pearl doet in dit voor een breder publiek geschreven boek verslag van de ontwikkeling van zijn inzicht betreffende de relatie tussen causaliteit en waarschijnlijkheid. Aanvankelijk was hij van mening dat je op grond van statistische analyses zou kunnen komen tot conclusies omtrent causaliteit. Ofwel dat causaliteit reduceerbaar is tot waarschijnlijkheid. Nieuw inzicht leerde Pearl dat dit niet mogelijk is. Causaliteit is een veel fundamenteler begrip en het is principieel onmogelijk op grond van waarschijnlijkheden tot causaliteit te besluiten.

Zelfcensuur

Lange tijd heeft de wetenschap aan een vorm van zelfcensuur gedaan door niet te spreken over oorzaken als verklaring. Wij zien geen oorzaken, wij observeren slechts verschijnselen en proberen daarin patronen, regelmatigheden, te ontdekken. Wat de wetenschap maximaal kon doen was statistische verbanden (correlaties) aangeven tussen verschillende verschijnselen. Op grond van veel gegevens kan soms met aan zekerheid grenzende waarschijnlijkheid tot een causaal verband besloten worden. Causaliteit als een soort limiet van waarschijnlijkheid! Voor sommigen het maximaal haalbare. Voor anderen is zelfs dit geen verantwoord resultaat. Statistici spreken van al dan niet significante correlaties, op grond waarvan vooropgestelde hypotheses al dan niet verworpen zouden kunnen worden.

Kortom de discussie over de relatie tussen causaliteit en waarschijnlijkheid hield de gemoederen in de wetenschap al lange tijd bezig. Niet zo vreemd, want het gaat over fundamentele begrippen van onze moderne wetenschap die immers verschijnselen wil verklaren op grond van observaties. Of dat verklaren bevredigd kan worden door het zoeken en vinden van oorzaken? Dat is nou net de vraag. Misschien zoeken we wel iets dat er niet is en is er slechts een veelheid van verschijnselen die ons toevallen en moeten we deze toevallige gegevens wel nemen voor wat ze zijn. Het gegeven aanvaarden voor wat het is en er verder niets achter zoeken.

Pearl ontwikkelde een wiskundige theorie (Causal Inference) over causaliteit waarmee het weer mogelijk wordt op een verantwoorde wetenschappelijke wijze te komen tot uitspraken over causale relaties tussen verschijnselen of gebeurtenissen.

Aan een definitie van het begrip oorzaak waagt Pearl zich overigens niet. Een definitie zou namelijk een reductie van het begrip causaliteit inhouden tot iets anders in termen waarvan het gedefinieerd wordt. En dat lijkt hem niet gepast. Expert beschikken over het vermogen causale verbanden te zien. Hun inzicht in de causale relaties tussen twee verschijnselen worden in een causaal netwerk (een acyclische gerichte graaf) gerepresenteerd.

Pearl verdedigt zijn theorie met verve tegenover al dan niet vermeende tegenstanders die nog geen gebruik maken van de verworvenheden van de causale revolutie. Met name op het gebied van de AI moet volgens Pearl meer geld beschikbaar komen voor Causal Inference onderzoek. Teveel zou de nadruk liggen op onderzoek naar machine learning, deep neural networks en big data. Wil AI een stap voorwaarts maken dan moeten we de machine leren causaal te redeneren. Anders wordt het nooit wat.

Overigens is iedereen het er wel over eens dat wanneer uit tellingen blijkt dat scholieren die melk drinken betere wiskunderesultaten op school hebben dan kinderen die cola drinken je niet kunt controleren dat er een oorzakelijk verband is tussen het drinken van melk of cola en de schoolresultaten. Ook kunnen we op grond van het feit dat op iedere ochtend weer een avond volgt niet concluderen dat de avond een gevolg is van de ochtend. Of dat het dagelijkse kraaien van de haan de zon doet opkomen. Uit het simultaan of regelmatig na elkaar optreden van twee gebeurtenissen kunnen we niet concluderen tot een causaal verband tussen beide.

Hoewel we niet precies weten wat een causaal verband is, we weten in elk geval dat het gevolg niet vooraf kan gaan aan de oorzaak. Dit geldt niet voor doel-oorzaken, maar die zijn allang uit de moderne wetenschap verbannen. Wat is het kenmerk van die “moderne wetenschap”?

Functie

De lengte van deze staaf is veranderlijk, evenals zijn temperatuur veranderlijk is. Dat neemt niet weg dat deze staaf dezelfde staaf blijft. In de mathematische fysica gaan we er vanuit dat er een wiskundig verband is tussen de lengte en de temperatuur van deze staaf. Deze wordt uitgedrukt door een functie f : l = f(t), de lengte is een functie van de temperatuur.

Het woord “functio” werd in het wiskundig spraakgebruik ingevoerd door de Duitse rechtsgeleerde, wiskundige, filosoof en uitvinder Leibniz(1646-1716) om de afhankelijkheid van de lengte van een lijnstuk in een meetkundige figuur aan te geven wanneer je een punt ervan over een kromme verplaatst.

Het stuk dat de raaklijn in P aan een kromme van de y-as afsnijdt noemde Leibniz in een brief aan Bernouilli een functie van P

Sinds Galilei voelde men een behoefte om veranderingen in de natuur op wiskundige wijze te beschrijven. Dat is lastig, want wiskundige objecten zoals getallen en figuren zijn niet veranderlijk: 2 wordt nooit 3 en een driehoek wordt nooit een vierkant. Leibniz’ functie leek niet zo’n gek idee.

De rest is bekend: in de 20ste eeuw zijn er diverse pogingen gedaan de hele wiskunde op het functie-begrip te grondvesten, als alternatief voor een fundering op het verzameling-begrip. Uiteindelijk leidden deze pogingen tot de computer, de machine bij uitstek waarin alle mogelijke functies functioneren. Mits ze natuurlijk berekenbaar zijn. Maar dat is tautologisch. Niet alle functies zijn berekenbaar zoals Godfather Alan M. Turing bewees. Maar dat terzijde.

Het functie-resultaat l is functioneel afhankelijk van het argument t. Voor deze staaf geldt : l = l0 + a.t , waarbij a een constante (een getal) is die bepaald is door het materiaal van de staaf en l0 de basis-temperatuur. Deze functie is een lineaire functie. Bij de lineaire functie kan een inverse functie gevonden worden die aangeeft hoe de temperatuurwaarde van de lengtewaarde afhangt.

Op grond waarvan zeggen we eerder dat de lengte van de temperatuur afhangt dan omgekeerd dat de temperatuur van de lengte afhangt? De functie f hierboven suggereert een causale relatie waarbij de temperatuur als oorzaak en de lengte als gevolg optreedt. Let wel: suggereert. Waarom? Ik kan niet anders bedenken dan dat de reden is dat we de temperatuur van de staaf kunnen veranderen waarbij de verandering van de lengte als gevolg van dit ingrijpen wordt gezien. Een functionele relatie is een wiskundig object en geen fysisch causale relatie. Ik denk dat het goed is wiskunde van fysica, logica en psychologie te onderscheiden. Ook al zijn er wiskundige vormen van de laatste.

Op grond van het principe van de mathematische fysica stellen we dat er een functie of een ander soort wiskundig model (in het algemeen een structuur) bestaat dat het verband aangeeft tussen verschijnselen die we door metingen kwantificeren. Die metingen of observaties leveren gegevens op. Ook een vragenlijst die door mensen in een steekproef beantwoord wordt is een meting. Die gegevens proberen we te matchen met het model. Wanneer het model te veel afwijkt van de gegevens passen we het model aan. Sommige wetenschappers geloven dan de gegevens niet en gooien deze weg. Past het model redelijk goed dan kunnen we soms op grond daarvan uitspraken doen over nog niet gedane, hypothetische, observaties.

Het doen van experimenten en het opstellen van een wiskundig model zijn twee kanten van een zelfde wetenschappelijke manier van doen. Het experiment gaat uit van een verband tussen verschillende verschijnselen. Ook al hebben we nog geen idee wat het verband is we kunnen altijd gegevens verzamelen en op grond van onze intuitie classificeren.

Hume: Is dit brood gezond?

Hume vroeg zich af op grond waarvan hij kon concluderen dat dit brood goed was voor zijn gezondheid. Hij concludeerde dat hij geen inzicht had op grond waarvan hij op basis van eerdere ervaringen met het eten van brood kon concluderen dat dit brood goed voor hem was. Hij heeft natuurlijk gelijk: het brood kan vergiftigd zijn, een dodelijke schimmel bevatten. De kans is misschien klein, maar de mogelijkheid kan, eenmaal verzonnen, niet worden uitgesloten. Maar waarom noemt hij dit brood brood? Waarom vergelijken met andere broden? En waarom haalt hij daar zijn gezondheid bij? Waarom zou een brood gezond voor hem zijn? Of ongezond? Waarop berust deze gedachte?

Hume ontkende dat we inzicht in causaliteit hebben. Hij ontkende eigenlijk ook dat het niet mogelijk is van brood in het algemeen te spreken. We kennen slechts regelmatigheden. Toch voelde hij wel de behoefte aan een verklaring voor het feit dat we over oorzaken praten. Dat lijkt een beetje tegenstrijdig. Gelukkig kunnen we volgens hem een beroep doen op de Natuurlijke Harmonie tussen ons verstand en de natuurverschijnselen.

Op grond waarvan zou ik een uitspraak over de huidige lengte van deze staaf kunnen doen zonder deze te meten? Daarvoor heb ik de huidige temperatuur nodig en bovendien moet ik aannemen dat het wiskundige model (de functie die een lineair verband aangeeft tussen t en l) werkelijk geldt. Maar er kan iets merkwaardigs aan de hand zijn. Een uitzondering op de regel. Die kans is klein.

Merk op dat de kennis van de functionele relatie tussen temperstuur en lengte ons een instrument geeft om de temperatuur te meten op grond van de lengte. Techniek en experiment zijn twee kanten van de zelfde medaille: een geslaagd experiment geeft mogelijkheden voor handige instrumenten.

De Onenigheid

Pearl bespreekt in zijn boeken Çausality en The Book of Why Simpson’s paradox ter illustratie van zijn psychologische theorie over hoe mensen kansuitspraken interpreteren als causaliteitsuitspraken.

In een eerdere blog over Simpson’s Paradox heb ik Pearl’s visie uitvoerig besproken. Ik ben het niet met hem eens. Hij ziet processen in de hoofden van anderen, die hij niet kan zien. Soort van projectie, denk ik. Maar ik ben geen psycholoog.

De paradox komt volgens Pearl’s visie voort uit het feit dat mensen zonder het te beseffen een stelsel van probabilistische uitspraken zoals

P(E | C ) > P(E | ~C)

P(E | C,F) < P( E | ~C,F)

P(E | C,~F) < P(E | ~C,~F)

interpreteren als een stel causale uitspraken.

“Although such order reversal might not surprise students of probability, it is paradoxical when given causal interpretation.’’ (Causality, p.174; italics van mij)

Hoe kan een medische behandeling goed zijn voor mensen en tegelijk slecht zijn voor mannen en voor alle mensen die niet man zijn?

Dit is logisch onmogelijk. Niemand kan het hiermee oneens zijn.

De onenigheid betreft de interpretatie van de gegevens.

Voor wie de kansuitspraken niet als causale relaties ziet kan het paradoxale karakter van Simpson’s paradox niet door Pearl verklaard worden. Pearl houdt vast aan de idee dat degenen die Simpson’s paradox voor een paradox houden de kansenvergelijkingen interpreteren als causale uitspraken.

Toen ik voor het eerst kennis maakte met Simpson’s paradox was ik verrast. Maar na enige uitleg begreep ik dat mijn verrassing gebaseerd was op een foute aanname, eentje die je makkelijk kunt maken: namelijk dat het gemiddelde van de gemiddelden van twee of meer groepen getallen hetzelfde is als het gemiddelde van de hele groep. Dat heeft volgens mij niets te maken met een verborgen aanname over een causaal verband. De fysicus E.T. Jaynes wijst er in zijn boek Probability Theory (2003) op dat conditionele kansen niets met causale afhankelijkheden te maken hebben.

Voor Pearl gaat dit tegen de natuur van de menselijke intuitie in.

Hij postuleert “that human intuition is governed by causal calculus together with a persistent tendency to attribute causal interpretation to statistical associations. Without this postulate it is hard, if not impossible to explain the surprise part of Simpson’s paradox.”

Pearl ziet het als zijn taak mensen op deze verwarring te wijzen: correlatie betekent niet causaliteit; en uit statistieken alleen kun je geen “causale” conclusies trekken. Maar dit nobele streven betekent toch niet dat hij ons er eerst van moet overtuigen dat we lijden aan deze verwarring!

Zolang de beide partijen niet inzien dat de ander ook gelijk heeft is er onenigheid over deze kwestie. Het aardige is dat de tegenstanders van Pearl vaak met complexe theorieen aankomen om hun gelijk te bewijzen. Maar ze slaan natuurlijk de plank voortdurend mis. Zeker in de ogen van Pearl, die het soms kwaad te moede wordt. Hoe kun je iemand die een eend ziet in de figuur van Jastrow ervan overtuigen dat het een haas is? Of omgekeerd. Dat kan niet. Je moet gewoon wachten tot voor hem vanzelf een keer het andere aspect oplicht.

Er is wellicht behoefte aan een figuur als Anatevka uit The Fiddler on the Roof, die nadat hij de tegenstrijdige standpunten van de kibbelende partijen had vernomen, opmerkte: Maar jullie hebben allebei gelijk.

Het examen probleem

Hieronder is een voorbeeld van het verschijnsel dat aanleiding geeft tot Simpson’s observatie en die sommigen als paradoxaal ervaren. De tabel toont de resultaten van examens door studenten gedaan bij Prof A en Prof B.

De examenresultaten van bij de twee Professors. De onderste tabel toont de zelfde resultaten maar opgesplitst in twee deelgroepen: well-prepared en unprepared.

Uit de bovenste tabel halen we dat bij Prof B 2% van de studenten en bij Prof A 3% van de studenten zakt voor het examen. De onderste tabel toont de resultaten opgesplitst in de twee deelgroepen: de studenten die wel en die niet goed voorbereid waren op het examen. Enig rekenwerk laat zien dat voor beide deelgroepen de resultaten bij Prof A beter zijn dan bij Prof B. Dit lijkt paradoxaal. Hoe kan het zo zijn dat voor de hele groep studenten B beter is dan A, terwijl voor beide deelgroepen A beter is dan B?

Beide tabellen in het plaatje verwijzen naar dezelfde werkelijkheid. Zoals de visuele waarnemingen van de haas en de eend beide naar dezelfde werkelijkheid van de tekening verwijzen. Toch levert berekening een verschillend resultaat op.

Tot slot: een heel andere kwestie

Maar stel nu dat Professor B beweert dat hij de betere docent is refererend naar de eerste tabel. En stel dat Prof B daar bezwaar tegen maakt op grond van de tweede gesplitste tabel. Wie heeft er dan gelijk?

Nu halen de heren Professoren de causaliteit erbij! Professor B beweert dat hij de oorzaak is van de betere resultaten. Professor B claimt dat de betere resultaten op zijn conto komen. En zijn collega ontkent dit op grond van de gesplitste tabel.

Alsof iemand tegen Hume zegt: dit brood is gezond omdat het een brood is.

De theorie over Causal Inference van Pearl lijkt een oplossing voor het conflict onder de twee professoren te bieden. Dat kan het beste uitgelegd worden met een causaal diagram. In zo’n diagram geeft een pijl van knoop X naar knoop Y aan dat er een causale relatie is waarbij X als oorzaak en Y als gevolg wordt gezien.

Twee mogelijke causale netwerken voor het examen probleem

Beide causale netwerken zijn consistent met de data in de tabellen en kunnen dus de onderliggende werkelijkheid verbeelden. Het verschil is duidelijk: links is het op grond van het voorbereid zijn welke professor voor het examen gekozen is, terwijl rechts de professor bepaalt of de student goed voorbereid is of niet.

Wat is dus het antwoord op de vraag wie de prijs voor de beste prof verdient? Dat hangt ervan af welke van de twee netwerken de werkelijkheid weergeeft! Oftewel wat het onderliggende mechanisme is dat de examenresultaten produceert. Is het rechter netwerk de juiste weergave van de werkelijkheid dan heeft Professor B gelijk zijn claim. Maar niet als het linker model de werkelijkheid weergeeft.

Pearl heeft een wiskundige theorie ontwikkeld waarmee gegeven een causaal netwerk berekend kan worden wat de sterkte is van een causale afhankelijkheidsrelatie tussen knopen in het netwerk. Daarin speelt de doe-operator een centrale rol. Deze simuleert wat we doen als we een experiment uitvoeren om kennis te verwerven over causale verbanden in de werkelijkheid. We veranderen de waarde van een variabele, bijvoorbeeld de temperatuur, en meten het effect ervan op een andere, bijvoorbeeld de lengte. Daarbij moeten we er voorzorgen dat we niet via een achterdeur door onze activiteit andere processen in werking brengen die invloed hebben op de effect-variabele, bijvoorbeeld vochtigheid. Die moeten we daarom controleren. Dat kan door deze constant te houden, of door ze te randomiseren. Zo kan een randomized control trial (RCT) met behulp gesimuleerd worden.

Maar hoe weten we nu welk netwerk de realiteit weergeeft als we dit niet uit de gegevens (in de tabellen) kunnen halen? Die informatie moet van experts komen. Zij moeten op basis van hun kennis zeggen welke causale verbanden er gelden. Het is niet uitgesloten dat er nog andere factoren blijken mee te spelen. Pearl geeft in zijn The Book of Why historische voorbeelden van dergelijke kennisontwikkelingen.

In dit eenvoudige geval is de nodige kennis waarschijnlijk eenvoudig te verkrijgen, maar hoe zit dat bij complexe werkelijkheden waarin veel factoren een rol spelen? Dan wordt het lastiger.

Een causaal netwerk is een theorie die door ervaring moet worden getoetst aan de werkelijkheid. Het kan niet wiskundig bewezen worden of een model overeenkomt met de werkelijkheid. We kunnen hooguit zeggen of het past bij de beschikbare data.

Judea Pearl heeft een belangrijke bijdrage geleverd tot de wetenschap. Zijn causale diagrammen zijn, mits goed begrepen, een handig hulpmiddel voor het bespreken van causale modellen. Zijn theorie geeft een exacte definitie van het begrip “spurious relation”, een schijnbare causale relatie, bijvoorbeeld tussen iemand’s schoenmaat en diens intelligentie, die gesuggereerd wordt door een statistische correlatie.

Bronnen

E.T. Jaynes (2003) Probability Theory: the logic of science. Cambridge University Press, UK, 2003.

Judea Pearl(2001) Causality: models, reasoning, and inference. Cambridge University Press, UK, reprint 2001.

Judea Pearl and Dana Mackenzie(2019) The Book of Why: the new science of cause and effect. First published by Basic Books 2018. Published by Penguin Random House, UK, 2019.

Ludwig Wittgenstein (1945), Philosophische Untersuchungen. Suhrkamp Taschenbuch 14, Basic Blackwelll, 1958.

Published by

admin

Rieks op den Akker was onderzoeker en docent kunstmatige intelligentie, wiskunde en informatica aan de Universiteit Twente. Hij is gepensioneerd.

Leave a Reply