Voor menig student vormt Kansrekening en Statistiek een struikelvak. En dat geldt niet alleen voor de psychologie- en de sociologie-student. Ook menig wiskundestudent boezemt de statistiek ontzag in. Pas na vier examenpogingen haalde ik eindelijk een schamel zesje. Het kwartje wou maar niet vallen. Wat maakte dit vak nou zo anders en lastiger dan andere wiskunde en technische vakken? Ligt het aan de docenten? Vereist de oplossing van problemen in dit vakgebied een andere manier van denken, een manier die moeilijk is aan te leren, zoals ervaren docenten ons vertellen. Waarom is dat zo? Wat voor denkfouten vormen de valkuilen op het terrein van de kansrekening? Om die vragen te beantwoorden heb ik opnieuw gekeken naar een probleem waarmee ik tijdens mijn studie en ook daarna nog geworsteld heb. Ik was niet de enige. Het probleem staat bekend als het Probleem van de Drie Gevangenen. Voor ik het probleem presenteer volgt als inleiding een korte dialoog tussen Abe en Bea over kansen en loterijen.
Een dialoog over mogelijkheden
Abe: Stel je doet mee aan een loterij waarbij door middel van een trekking het enig winnende lotnummer bepaald wordt. Het aantal lotnummers is k. Je koopt één lot. Hoe groot is de kans dat je het winnende lot trekt?
Bea: Er van uitgaande dat elk lotnummer met evengrote kans getrokken kan worden is de kans dat ik het winnende lot heb 1/k.
Abe: Na de trekking deelt de loterij jou mede dat het lot is gevallen op jouw lotnummer. Hoe groot is nú de kans dat jouw lot het winnende lotnummer is?
Bea: [aarzelend] Uuuh..je bedoelt, ik weet dat mijn lotnummer de prijs heeft gewonnen? Dan is de kans daarop 1? Het is immers een feit.
Abe: Dus de kans dat jouw lot het winnende nummer is, is volgens jou veranderd toen de trekking plaats vond en je geinformeerd was over de uitslag?
Bea: Ja, ik denk het wel. Als bij de trekking niet mijn, maar een ander nummer uit de bus was gekomen dan was de kans op mijn lot 0 geworden, maar nu is die 1. Er zijn maar twee mogelijkheden.
Abe: Interessant. Maar volgens mij is de kans dat een bepaald lotnummer de prijs wint niet veranderd. Die was 1/k en die blijft 1/k. Na de trekking geldt dezelfde kansverdeling. De uitslag van een experiment laat de kans dat die uitslag optreedt onaangetast.
Bea: Dat snap ik niet. Maar, is er eigenlijk nog wel sprake van een kans op een bepaalde uitslag als de uitslag al bekend is?
Abe: Ja en nee. We moeten de mogelijke uitslag goed onderscheiden van de uitslag die zich feitelijk voordoet. Kansen hebben betrekking op mogelijke uitkomsten van trekkingen of experimenten. Als een mogelijkheid zich feitelijk voordoet dan verandert dat niets aan de mogelijkheden zoals die (vooraf) waren vastgelegd.
Bea: Anderzijds: als een bepaalde mogelijkheid werkelijk is geworden, dan zijn de andere mogelijkheden niet meer mogelijk. Er blijkt werkelijk slechts één mogelijk te zijn.
Abe: Je hebt helemaal gelijk.
Bea: Het lijkt erop dat we allebei gelijk hebben. Maar dat kan niet, want jij komt tot een andere conclusie dan ik.
Abe: Ja, daar lijkt het inderdaad wel op. Ik denk dat er twee mogelijkheidsbegrippen in het spel zijn. Laten we ze logisch mogelijk en werkelijk mogelijk noemen. Ik had dus moeten zeggen dat de logische mogelijkheid niet verandert door wat zich feitelijk voordoet. De kansverdeling heeft betrekking op de logische mogelijkheden. Die kansverdeling is wiskundig vastgelegd door een veld van (logische=denkbare) mogelijkheden met elk een bepaalde numerieke kans van optreden. Wiskundig is zo’n trekking niet een werkelijke trekking, maar een denkbeeldige trekking. Wiskundig beschouwd is zo’n experiment ook herhaalbaar, het is een abstract conceptueel iets, geen werkelijke gebeurtenis. En dat geldt ook voor het wiskundig kansbegrip.
Bea: Dus ook na de trekking moeten we nog steeds zeggen dat de kans dat op mijn lotnummer de prijs valt 1/k is. En niet 1.
Abe: Precies. De uitslag van een experiment verandert niets aan de kans op die uitslag. De werkelijkheid tast de logische wereld van mogelijkheden niet aan, zodra deze een keer is vastgelegd. Anderzijds als een schakelaar twee standen heeft dan sluit de ene feitelijke stand van de schakelaar de werkelijke(=fysische) mogelijkheid van de andere stand uit. Ze kunnen immers niet beide tegelijk voorkomen. Dus als je betrouwbare informatie hebt ontvangen dat het licht aan is, dan is het niet uit. We zeggen dan dat de ‘kans’ daarop dan 0 is. Maar dat is een ander ‘kans’-begrip. Jij hanteert dus een ander kansbegrip dan het wiskundige. Jij zegt zoals sommige fysici zeggen, dat de kansverdeling in elkaar klapt zodra een mogelijkheid werkelijk zich voordoet. Maar dan beschouw je die kansverdeling als iets objectiefs van de werkelijkheid. De wiskundige staat echter boven die werkelijkheid.
Deze conclusies nemen we mee bij de analyse van…
Het Probleem van De Drie Gevangenen
Drie gevangenen: A, B en C, wachten op de uitslag van hun proces. Ze weten dat twee van hen geexecuteerd zullen worden, de ander wordt vrijgesproken. Gevangene A weet niet wie van de drie wordt vrijgesproken. A overdenkt zijn overlevingskansen en komt met een voorstel bij de celwachter: “Omdat het wel zeker is dat óf B óf C gedood zal worden, geeft u mij geen nieuwe informatie met betrekking tot mijn kans om te blijven leven wanneer u me vertelt wie van beide, B of C, gedood zal worden.” De celwachter beaamt A’s stelling en antwoordt naar waarheid: “B zal geexecuteerd worden”.
Gegeven dit antwoord voelt A zich een stuk meer op zijn gemak. Immers, zo denkt hij, voor dat ik wist dat B gedood zal worden, was mijn kans gedood te worden 2/3, maar nu is die gedaald naar 1/2. Er zijn immers nog maar twee, hijzelf en C, die gedood kunnen worden.
De vraag is nu: heeft A gelijk dat zijn kansen om te overleven groter zijn geworden nadat hij de nieuwe informatie van de celwacht kreeg?
A zegt twee dingen: Eerst dat het antwoord van de celwacht dat B gedood zal worden hem geen nieuwe informatie geeft over zijn overlevingskans. Maar ook zegt hij dat met de informatie dat B gedood zal worden, er nog slechts twee kandidaten over zijn op wie het lot kan vallen zodat zijn overlevingskans is toegenomen. Die twee zijn natuurlijk met elkaar in tegenspraak. Waar zit de adder onder het gras?
Die zit bij de ‘kanswaarde’ van de informatie die de celwacht geeft wanneer deze A informeert” dat B gedood zal worden”. Zonder het proces in acht te nemen volgens welke de celwacht tot deze uitspraak komt, is het inderdaad zo dat A met een compleet nieuwe situatie te maken heeft waarin er slechts twee gevangen zijn in plaats van drie, zodat zijn overlevingskans 1/2 is geworden. Maar waarom zouden we dat keuzeproces in acht moeten nemen? Het korte antwoord is dat de celwacht niet willekeurig tot zijn antwoord dat B gedood wordt is gekomen. De celwacht weet welke twee gedood zullen worden. Hij zal nooit zeggen dat A gedood wordt als hij weet dat A gedood wordt. Dus als A gedood wordt zal hij de naam van de ander die gedood wordt noemen. Als A niet gedood wordt kan hij kiezen tussen B of C noemen, elk met gelijke kans. Dit proces bepaalt de ‘kanswaarde’ van de informatie die hij geeft wanneer hij zegt dat B gedood zal worden.
De conclusie van de dialoog tussen Abe en Bea was dat uitkomsten van trekkingen de kansverdeling niet verandert. Dat geldt ook voor onvolledige informatie over de trekking. Daarom: de kans dat A gedood zal worden lag al vast voordat de informatie over de uitslag van het proces bekend werd gemaakt door de celwacht. Deze blijft dus 2/3. Het zou anders zijn geweest wanneer A werd medegedeeld dat er een vergissing in het spel was en er slechts twee gevangen zijn, waarvan er een vrijkomt. Vergelijk dit met de situatie nadat bekend is gemaakt dat de helft van de niet winnende nummers uit de loterij zijn verwijderd. Je kans op een winnend lot is dan uiteraard gestegen omdat er veel minder (logisch) mogelijke uitkomsten zijn.
Het is misschien verhelderend om dit probleem te vergelijken met het
Drie Deuren Probleem
Achter twee van drie deuren bevindt zich een geit, achter de derde een dure auto. Nadat je een deur hebt gekozen, opent de quizmaster – die weet achter welke deur de auto zit – één van de twee andere deuren, maar niet een deur waarachter de auto zit. De geopende deur toont dus een geit. De quizmaster biedt je nu de mogelijkheid opnieuw een deur te kiezen. De vraag is nu: worden je kansen op de auto groter door te kiezen voor de andere deur?
In dit geval is worden je kansen vergroot door de andere deur te kiezen dan die je eerst koos. Ook hier is het van belang dat de quizmaster weet achter welke deur de auto zit. In tegenstelling tot in het Drie Gevangenen Probleem mag de deelnemer aan de quiz nu een tweede keer kiezen. Voor gevangene A viel er niets opnieuw te kiezen nadat hij wist dat B gedood zou worden. Zijn lot was daarvoor al bezegeld.
Dat in dit geval de kans op succes groter wordt kan als volgt inzichtelijk gemaakt worden. Stel dat er geen drie maar 1000 deuren zijn; achter één bevindt zich een auto. Nadat je een deur gekozen hebt, opent de quizmaster alle deuren waarachter geiten zitten, behalve eentje en de deur die je gekozen hebt. Blijf je dan bij je keus of kies je voor de andere nog gesloten deur? Het zal duidelijk zijn dat je beter voor de andere deur kunt gaan dan bij je eerste keus te blijven.
Maar hoe bereken je nu die verschillende kansen, want bij het vak Kansrekening wordt niet alleen om een redenering gevraagd maar ook om een berekening. Daarvoor moeten we het begrip conditionele kans uitleggen en hoe je die berekent.
Conditionele en gezamenlijke kansen
Q en R zijn beweringen. Q kan bijvoorbeeld zijn “A zal leven” en R kan zijn “De celwacht zegt dat B zal sterven”.
P(Q) is de kans dat Q waar is. Het is een getal tussen 0 en 1. In het voorbeeld van de Drie Gevangenen is gegeven dat P(“A zal leven”) = 1/3. We korten dit af tot P(leven A). Evenzo hebben we P(leven B) en P(leven C) voor de kansen dat B resp. C zal leven.
P(Q|R) is de (voorwaardelijke) kans dat Q waar is, gegeven dat R waar is. In het voorbeeld gaat het gevangene A om de kans P(“A zal leven”| “De celwacht zegt dat B zal sterven”). We korten dit af tot P(leven A|cel B).
P(Q&R) is de gezamenlijke kans dat zowel P als Q waar is. Dus P(“A zal leven” & “De celwacht zegt dat B zal sterven”) – afgekort P(leven A & cel B) – is een getal tussen 0 en 1 dat aangeeft hoe groot de kans is dat beide beweringen waar zijn.
De klassieke wiskundige (Pascalse) theorie van de kansrekening is gebaseerd op een aantal regels: 1) Als Q en R onafhankelijke gebeurtenissen aanduiden dan kan de gezamenlijke kans P(Q&R) berekend worden door het produkt te nemen van de beide kansen P(Q) en P(R). Het zal duidelijk zijn dat: P(Q&R) gelijk is aan P(R&Q).
Een belangrijke gelijkheid is P(Q&R) = P(Q) . P(R|Q) Uit deze gelijkheid en de gelijkheid van P(Q&R)=P(R&Q) volgt de belangrijke regel van Bayes.
(Bayes) P(Q|R) = P(R|Q) . P(Q)/P(R)
Met deze regels kunnen we aan de slag zodra we de kansen P(leven X) en P(cel Y) voor de verschillende waarden van X en Y hebben vastgelegd. Dat gebeurt in het kansmodel.
Het Kansmodel voor de Drie Gevangenen
Zoals boven gesteld bestaat zo’n kansmodel uit de verzameling van mogelijkheden die zich voordoen, met een kansverdeling over de mogelijkheden. Die verzameling bestaat uit alle mogelijke combinaties van gebeurtenissen (leven X & cel Y). Dat zijn er vier:
(leven ‘A’, cel ‘B’), (leven ‘A’), cel ‘C) , (leven ‘B’, cel ‘C’), (leven ‘C’, cel ‘B’).
De andere theoretisch mogelijke combinaties met ‘leven A’ doet zich niet voor, omdat gevangene A van de celwacht niet te horen krijgt dat hij zal leven.
Wat zijn de getalswaarden van deze gezamenlijke kansen? Die volgen direct uit het gegeven: als A zal blijven leven dan kiest de celwacht uit B en C (die beide immers zullen sterven) met een kans 1/2. Dit is de conditionele kans P(cel B | leven A).
De kans P(leven A & cel B) is dus P(leven A) . P(cel B|leven A) = 1/3 . 1/2 = 1/6.
Evenzo: P(cel C | leven A) = 1/6.
Voor de andere gezamenlijke kansen geldt
P( leven B, cel C) = P (leven B) P(cel C| leven B) = 1/3 . 1 . De kans P(cel C| leven B) = 1 omdat de celwacht verplicht is te zeggen dat C zal sterven als B zal leven. Het zelfde geldt voor de omgekeerde gebeurtenis (leven C, cel B). Ook die heeft kans P(leven B, cel C) = 1/3.
Omdat de drie gevangenen dezelfde kans hebben te blijven leven geldt: P(leven X = 1/3 voor alle drie waarden van X: A, B en C.
Met behulp van Bayes regel kunnen we nu de kans berekenen dat A zal leven gegeven dat de celwacht zegt dat B zal sterven.
Volgens Bayes geldt: P(Q|R) = P(R|Q) . P(Q)/P(R). Omdat: P(R|Q) = P(Q,R)/P(Q) hebben we P(Q|R) = P(Q,R)/P(R). Bovendien geldt P(R)= P(U&R) + P(V&R)+(W&R), als U, V en W de mogelijkheden zijn die de hele kansruimte opdeelt.
P(leven A| cel B) = P(leven A & cel B) / (P(leven A & cel B) + P(leven C, cel B)) = 1/6/(1/6+1/3) = 1/3
(NB: P(leven B & cel B) = 0 vandaar dat de som voor P(cel B) slechts uit twee delen bestaat)
De kans dat A zal sterven is dus 1-1/3 = 2/3. En die is dus precies zo groot als voor dat hij het antwoord van de celwacht had gekregen dat B zal sterven..
Wat kunnen we hieruit concluderen?
Dat als gevangene A het kansmodel accepteert als correct model van de situatie en hij de regels van de kansrekening volgt hij tot de conclusie moet komen dat zijn situatie niet verbeterd is. En dat komt overeen met het feit dat de kansen al vastlagen voordat het antwoord van de celwacht kwam. Precies zoals bij de loterij, waar geldt dat de uitslag van de trekking niets verandert aan de kans op het winnen van de loterij.
Klopt het wel?
Bea: En toch heb ik nog een vraag. Hoe weten we dat dit correct is? Ik bedoel hoe kun je checken dat het klopt dat die kans niet veranderd is? Ik kan checken of een dobbelsteen ‘eerlijk’ is door er heel vaak mee te gooien en de frequenties van de uitkomsten 1 t/m 6 te tellen. Die moeten voor alle mogelijke uitkomsten (ongeveer) gelijk zijn, namelijk 1/6 van het aantal worpen met de dobbelsteen. Maar hoe zit dat hier?
Abe: Ja, dat lijkt me in dit geval lastig te doen. Je moet dan herhaalbare experimenten doen. Je zou de situatie kunnen simuleren, maar dan leg je het model al vast in de computer. Wat je dan test is de kwaliteit van de randomgenerator die je gebruikt in je programma. Daar schiet je niks mee op. De frequentie-interpretatie van het kansbegrip dat refereert aan experimenten die herhaalbaar zijn en onder vergelijkbare omstandigheden worden uitgevoerd lijkt hier niet van toepassing te zijn. De vraag is dus of die kansrekening hier wel toepasbaar is.
Bea: Kansen hebben toch ook te maken met kennis en informatie en in welke mate je gelooft dat iets het geval is, op basis van de informatie die je hebt?
Abe: Ja, dat lijkt hier meer van toepassing. Misschien dat onze gevangene A die ‘Belief’-interpretatie wel toepaste toen hij zei dat zijn kans te overleven werkelijk groter was geworden nadat hij het antwoord van de celwacht hoorde. Zijn informatie-toestand over de wereld is immers veranderd door de nieuwe informatie die hij ontving.
Bea: Wat is die ‘kanswaarde’ van het antwoord dat de celwacht geeft. Hebben we die hierboven berekend als een conditionele kans op basis van de mogelijke uitkomstenruimte met die vier elementen? We concludeerden dat er niets veranderd is aan de kans. Maar A weet wel meer dan hij wist. A heeft meer informatie. Namelijk dat B zal sterven.
Abe: Maar in welke mate is dat nieuwe informatie voor hem? Hij wist immers al zeker dat B of C zal sterven?
Bea: Ik vind die ‘kanswaarde’ maar een lastig iets. Om terug te komen op de loterij. Als ik bericht heb dat ik het winnende lotnummer heb, dan weet ik toch zeker dat dat zo is. Er is dan toch geen sprake meer van een ‘kans’ in de zin van de frequentie-interpretatie? Als je al van een ‘kans’ wilt spreken dan is die simpelweg 1. En als ik hoor dat het lot op een ander nummer is gevallen is die kans 0.
Abe: Je hebt gelijk. Bayes regel wordt wel gezien als een regel voor wat heet ‘belief-updates’. De regel zegt hoe je gegeven nieuwe informatie de ‘mate van belief’ in zaken moet aanpassen. ‘Belief’ klinkt nogal psychologisch alsof het iets subjectiefs is. Daarom is het beter van een ‘informatie-toestand’ te spreken. Die verandert zodra er nieuwe informatie binnenkomt in een informatie-systeem. De fysicus E.T. Jaynes heeft in zijn boek over Probability als ‘logic of science’ aangetoond dat de meeste problemen succesvol kunen worden aangepakt met de regels van de kansrekening als we deze opvatten als informatie-update-regels. Volgens Jaynes leidt deze interpretatie, waarin de regel van Bayes, een sleutelrol speelt tot methodes die ook vaak toepasbaar als er geen sprake kan zijn van herhaalbare experimenten en er dus geen frequentietellingen mogelijk zijn. Ook aan unieke gebeurtenissen kun je een ‘kans’ toekennen. Het probleem is hoe je een kanswaarde toekent aan een mate van geloof.
Bea: Nou snap ik ook waarom ik zoveel problemen had met het vak Kansrekening en Statistiek. Waarschijnlijk verwarde ik twee kansbegrippen. Net als die gevangene. Hoe kan de docent het nu fout rekenen als een student als antwoord geeft dat voor A de kans een 1/2 is geworden?
Abe: Omdat hij vindt dat je zijn ‘klassieke’ interpretatie van het kansbegrip moet kennen en toepassen. Ook al kan hij nooit bewijzen dat ‘zijn’ antwoord 2/3 correct is. Aan het unieke historische feit dat A te horen krijgt dat hij zal leven kan je immers niet zien met welke kans dit optreedt. Uit het resultaat van één enkele worp met een dobbelsteen kun je ook niet concluderen hoe groot de kans is dat net dat resultaat optreedt. Daarvoor moet je heel veel van dezelfde situaties hebben en dan uitkomsten tellen.
Bea: Moeten we dan niet tot de conclusie komen dat het Drie Gevangen Probleem een probleem is dat nergens op slaat?
Abe: Ja, het lijkt me ook een onwerkelijk probleem waarmee de docenten de studenten opzadelen.
Conclusie over problemen met het vak Kansrekening en Statistiek
Het probleem van de Drie Gevangenen laat zien dat er verschillend gedacht kan worden over het kansbegrip. Het blijkt dat er verschillend gedacht kan worden over het begrip mogelijkheid en de interaktie tussen werkelijkheid en mogelijkheid. Waarom zou gevangene A zich moeten vasthouden aan het wiskundig vastgelegde kansmodel op grond waarvan zijn kans om te overleven 1/3 is, ook als hij weet dat er nog slechts twee kandidaten zijn, A en C, om te overleven? Waarom kunnen we de feiten zoals die ons worden medegedeeld niet nemen voor wat ze zijn – blote feiten -? Waarom moeten we rekening houden met het proces dat tot de mededeling van het feit heeft geleid?
Hier doemt een belangrijk inzicht op aangaande het wezen van informatie. Om informatie te wegen en te kwantificeren is het van het grootste gewicht niet alleen te zien wat er feitelijk gezegd wordt, maar ook wat er niet gezegd wordt en wat ook gezegd had kunnen worden. Nadat A daadwerkelijk zijn vraag gesteld heeft en het antwoord van de celwacht heeft gekregen is er ook werkelijk iets veranderd in de wereld. Daarom is A’s vertrouwen dat zijn overlevingskansen zijn toegenomen gerechtvaardigd. Net zo goed als het geloof dat je de loterij hebt gewonnen is toegenomen zodra de uitslag zegt dat je deze hebt gewonnen. De werkelijkheid trekt zich niets aan van hoe de wiskundige deze gemodelleerd heeft.
In het onderwijs werd geen aandacht besteed aan de problematiek van de verschillende interpretaties van het kansbegrip. Dat zou eigenlijk wel moeten om de student bewust te maken van de verschillen. Het Probleem van de Drie Gevangenen blijkt zich prima te lenen als uitgangspunt voor zo’n bewustwordingsproces.
Kunnen we elke situatie denken als instantie van een denkbeeldig mogelijkheidsveld?
Vele jaren geleden toen ik bovenstaand probleem voorlegde aan mijn filosofiedocent Louk Fleischhacker (ik had me door Jaynes laten overtuigen van de Bayesiaanse aanpak van statistische problemen) ontving ik van hem het volgende commentaar.
“Ik ben het met je eens dat de waarschijnlijkheidsleer PT de meest plausibele basis biedt voor een theorie over informatiecorrectie (om maar eens een andere vertaling van ‘belief revision’ voor te stellen die niet zo subjectivistisch en psychologisch klinkt, zodat je meteen weet waar mijn bedenkingen tegen het woord ‘belief’ liggen).
Maar ik ben ook een fervent voorstander van Kolmogorov. Ik zie PT als een mathematisch model van situaties waarin iets zo of anders kan zijn, en wel door dit zo of anders zijn voor te stellen als een veld van mogelijke actuele toestanden. Zoals Leibniz de geschapen wereld plaatste in een veld van mogelijke werelden. Hierin ligt de filosofische fout van het actualisme, maar die is bij mathematisering onvermijdelijk, want mathematisch denken berust op de denkbeeldige actualisering van iets potentieels, namelijk de structureerbaarheid van de ervaringswereld.
Nu zie ik de frequentie-interpretatie als een ‘mogelijkheidsvelds-model’, maar er is niets tegen om het bijbehorende formalisme als een logische calculus te zien waarvan dit model de semantiek is. Bij ‘frequentie’ hoef je dan niet meer aan feitelijke herhaalbaarheid te denken, het gaat slechts om frequenties in een puur denkbeeldig mathematisch universum. Bij een dergelijk model is er altijd de vraag in welke situaties het toepasbaar is. Volgens mij is het overal daar toepasbaar waar een toedracht opgevat kan worden als een kenmerk van andere toedrachten van een zeker type, die gedacht kunnen worden als gelijkwaardige instanties van een denkbeeldig mogelijkheidsveld.
Het gaat dus niet om wérkelijke ballen in wérkelijke urnen of om wérkelijke herhalingen van een experiment, maar om denkbeeldige.
Er zijn grenzen aan de mogelijkheid een situatie zo te denken. Denk maar aan de topologische zak met knikkers. Misschien geeft het probleem van de drie gevangenen zo’n grens aan, maar ik zou dit wel eens precies beredeneerd willen zien.”
Professor Willem Schaafsma, hoogleraar statistiek in Groningen, reageerde op mijn pleidooi om in het onderwijs meer aandacht te besteden aan de Bayesiaanse aanpak van Jaynes met de opmerking dat er een “vreselijk verschil is tussen kansrekening en statistiek”. Ook hij kwam met bovenstaande oplossing van het gevangenen probleem, maar wees op het feit dat Jaynes Bayesiaanse methode ook zijn grenzen kent. Hadden Schaafsma en Fleischhacker dezelfde grens op het oog?
Het actualisme van de wiskundige
De door Louk gevraagde redenering heb ik nog niet kunnen vinden. Ik denk ook dat het probleem van de drie gevangenen ergens anders in zit.
Wat het zo problematisch maakt is dat we te doen hebben met twee lagen van beschrijving. In de ene laag wordt beschreven dat er drie gevangenen zijn die gelijkwaardig zijn en ieder een kans maken te overleven. Op die laag is een tweede laag waarin we één van de drie gevangenen ontmoeten die zich tot zijn situatie beschreven in de eerste laag verhoudt. Die gevangene is als het reptiel in M.C. Escher’s Reptielen dat zich uit het platte vlak van de ets opricht en de wereld in gaat. De gevangene richt zich tot de celwachter om informatie in te winnen over zijn overlevingskansen. Die informatie ontvangt hij als antwoord op zijn verzoek aan de celwachter hem mede te delen of B dan wel C zal sterven. Deze informatie zal geen effect hebben op zijn situatie zo beweert A, want ook zonder deze informatie weet hij al dat B of C zal sterven. Als de celwachter hem meedeelt dat B zal sterven dan meent hij toch de conclusie te kunnen trekken dat zijn overlevingskansen verbeterd zijn. Hij concludeert namelijk dat er nog maar twee kandidaten zijn om te overleven en dat derhalve zijn kans is gestegen van 1/3 naar 1/2.
Er is een verband met het verschil tussen kansrekening en statistiek. Kansrekening is zuivere wiskunde, statistiek betreft het modelleren van kans-experimenten. Waar kansrekening uitgaat van een ‘eerlijke dobbelsteen’ (de kansen van de uitkomsten zijn gegeven), is het een statistisch probleem om gegeven een hoeveelheid data (de uitkomsten van worpen met een ‘echte dobbelsteen’) te bepalen of de dobbelsteen eerlijk genoemd mag worden, d.w.z. dat de verdeling die van het kansmodel benadert. Als gegeven is dat er met een eerlijke dobbelsteen wordt geworpen dan zijn de uitkomsten van de worpen onafhankelijk. Ook na 5 keer achterelkaar een 6 gegooid te hebben, is de kans dat een 6 gegooid wordt nog steeds 1/6. Maar wanneer we met een experiment te maken hebben dan zal de verwachting dat na 5 keer een zes weer een 6 geworpen wordt hoger zijn dan aan het begin.
Hierboven wezen we al op het problematische van de conclusie die de gevangene trekt. De informatie die hij van de celwacht ontvangt, dat B zal sterven, is ‘belast met onzekerheid’. Het is antwoord op de vraag of B dan wel C zal sterven. Wanneer de informatie “B is gestorven” onbelast was zouden er nog maar twee kandidaten zijn. Dan was de situatie werkelijk veranderd. Zonder het keuzeproces, dat aan het geven van informatie in de vorm van een mededeling voorafgaat, erbij te betrekken en alleen maar naar de inhoud van het bericht te kijken, trekken we ongerechtvaardigde conclusies. Betrekken we het keuzeproces van de informant bij de kansberekening dan is het resultaat ervan gelijk aan de kansen die op grond van de eerste laag van het verhaal is vastgelegd. Het informatiebegrip bevat beide kanten: een kwalitatieve, inhoudelijke, dat wat er wordt medegedeeld, en een kwantitatieve, de positie van de inhoudelijke mededeling in een veld van mogelijkheden. Die kan voor beide kanten van het communicatiekanaal: zender en ontvanger verschillend zijn.
Het lot van gevangene A is door de mathematische God van Leibniz vastgelegd in een door Hem geactualiseerde wereld. En dat geldt ook voor B en C. Daar valt door de gevangenen niets meer aan te veranderen. Het aardige is nu dat wanneer we rekening houden met het kansproces op grond waarvan de celwachter zijn informatie aan A verstrekt – een proces dat evenzeer al in de door Leibniz’ God gekozen wereld is vastgelegd – overeenkomt met de idee van het actualisme van de Mathematische Denker.
Bea: Hoe zit dat nu bij die loterij. Moet ik me bij de uitslag dat ik de prijs heb gewonnen ook afvragen wat het keuzeproces was dat tot de uitslag heeft geleid?
Abe: Je zou er inderdaad wel achterdochtig van worden als je eenmaal bedenkt dat informatie die je ontvangt belast is met een keuzeproces. Je weet pas zeker dat je gewonnen hebt als het bedrag is overgemaakt op je rekening.
In principe moeten we goed onderscheiden tussen het feit dat A het geval is en het feit dat iemand zegt dat A het geval is. Daar zit een mate van betrouwbaarheid tussen. Als we daar niets over weten, omdat we de informant niet kennen, dan zegt die informatie ons ook niets. We kunnen er niets mee. Doen we dat wel, bijvoorbeeld door de informatie door te geven, dan vervuilen we de werkelijkheid met onjuiste gegevens. Tegenwoordig met al die ondoorzichtige informanten op sociale media en die sprekende AI systemen zoals ChatGPT, is dit een serieus probleem. Het in onze cultuur zeer hoog ontwikkelde mathematische brein is nu eenmaal goed in het verzinnen van mogelijke werelden. Het is niet voor niets dat ‘hallicuneren‘ tot hét woord van 2025 is verkozen.