“Wie niet meer tot iets aangetrokken wordt is ernstig depressief. Anderzijds is het aangetrokken worden juist de oorzaak van veel problemen in ons leven.” (Louk Fleischhacker in: Liefde, begeerte en zelfbewustzijn)
Het is geen louter academische of filosofische kwestie, maar een vraag van het grootste praktische belang wat we moeten denken over de rol van de aantrekkingskrachten tot andere personen, daden, en omgevingen in ons leven. Hoe bepalen we onze koers in ons leven ten opzichte van al deze impulsen? En waar komen ze uit voort? Uit het zoeken naar ons zelf? Naar een zin in ons bestaan? Uit drift, begeerte, liefde? Wat maakt dat we ontvankelijk zijn of worden voor bepaalde idealen? Wanneer slaat het bezitten van een ideaal om in een toestand van bezetenheid door dat ideaal?
Het blijkt vaak dat de meeste harde strijd met de ander om erkenning van het zelf tevens de meeste innige liefdesband is. Niet zelden met de dood tot gevolg. Het is de kiem van alle banden en alle conflicten tussen personen en groeperingen, of dat nu voetbalsupporters, milieuactivisten of religieuze groeperingen zijn.
Wat leren we van ons zelf uit de gesprekken met de ander? Welke is de begeerte, de drift, de aantrekkingskracht van de ander, of is het zijn of haar begeerte, dat de gesprekspartners tot het gesprek voert?
Dit zijn de vragen waarmee ik vandaag aanvang met het lezen van het zojuist verschenen boek Radicale Verlossing over wat terroristen geloven. Historica Beatrice de Graaf is hierover in de gevangenissen met de huidige generatie terrorisme-gedetineerden in gesprek gegaan.
“Ze heeft geluisterd naar hun verhalen over frustratie met het eigen leven, woede om aangedaan onrecht en het besluit zich te mengen in de strijd. Uit die verhalen blijkt hoe cruciaal de actuele, geleefde en geloofde praktijk van radicale verlossing is voor het begrijpen van hun daden. Op basis van interviews met terrorismegedetineerden uit Nederland, Syrië, Pakistan en Indonesië – jihadisten en enkele rechts-extremisten – reconstrueert ze hun verhalen van overgave, strijd, opoffering en gehoopte beloning, en ontwerpt ze een manier om de samenhang van geloofsbeleving en terroristische activiteiten beter te begrijpen. Wanneer en hoe inspireren religieuze en ideologische overtuigingen jongeren nu tot een heilige strijd? En wat gebeurt er wanneer die verlangde verlossing uitblijft?” (Uit de aankondiging van het boek op de website van Boekhandel Broekhuis waar ik het bestelde. “Vanwege Koningsdag is de bestelling wat later. Excuses daarvoor”.)
Stel dat de waarheid een muis is. En waarom niet? Dan heb ik die toch maar mooi gevangen. Helaas is hij dood. (vrij naar F. Nietzsche)
Muizen hebben het gemunt op onze boontjes en peultjes. Ik zet een muizenval.
Een muizenval is een slim instrument: een originele door het verstand uitgedachte combinatie van natuurkrachten. Het is niet alleen de druk die de muis op het wippertje uitoefent waardoor het ijzeren staafje los raakt uit het metalen boogje. Het is ook de veerkracht in het verbogen metaaltje dat vervolgens ervoor zorgt dat de metalen klep omklapt en de muis klem zet. Meestal met de dood tot gevolg.
Maar er speelt nog een andere kracht een belangrijke rol. Zonder de aantrekkingskracht van de (pinda)kaas op de muis zou de muizenval niet werken. Het is deze slimme combinatie van fysische en biologische natuurkrachten die de muizenval tot een succesvol instrument maakt. De lokstof is een noodzakelijk onderdeel van de klapmuizenval, zoals de inkt een noodzakelijk onderdeel is van de balpen.
Je kunt deze in de vorm van een muizenval geobjectiveerde slimheid, voor een paar euro kopen in de dierenwinkel, waar men ook vogel- en visvoer verkoopt. Deze intelligentie is onderdeel van onze economie. (De lokstof zit er overigens niet bij).
Zoals iedere techniek maakt de muizenval gebruik van een aantal in onze natuur ingebouwde automatismen. Automatismen zijn werkingen die vanzelf gaan. We hebben er geen controle over. Ze zijn er in vele soorten. De reflexmatige spierwerkingen, zoals de kniereflex, de ongecontroleerde reflexmatige reacties als er gevaar dreigt, en talloze fysiologische levensprocessen, zoals het kloppen van het hart en de ademhaling. Ook de emotionele reacties, zoals het blozen bij het gevoel van schaamte gaan buiten onze directe wil om. Al deze bewegingen, volgens natuurwetten in de brede zin, zijn automatisch. Wat ook automatisch gaat, dat wil zeggen buiten de directe wil om, is het voor echt en waar houden van dingen die we ‘waarnemen’ en die we lezen of horen. Niemand zegt: als ik zeg dat het regent dan regent het ook. Men zegt: het regent. Of: “Ik heb een muis gevangen” en u gelooft dat onmiddellijk. Dat kan fatale gevolgen hebben, zoals de muis heeft ervaren (of juist niet). De taal zegt dingen die niet waar zijn.
De scholastici onderscheiden, in navolging van Aristoteles en de Arabische filosofen, de vis cogitativa, het vermogen tot objectivering op basis van de verschillende zintuiglijke indrukken, van de vis estimativa, de schattingszin, het vermogen de directe waarde van iets in te schatten. Deze laatste komt ook bij dieren voor, maar het vermogen tot objectiveren niet. Het dier is niet in staat het objectieve gegeven te onderscheiden van het vitale belang. De muis wordt bezeten door het vitale belang van de pindakaas. Zoals de wolf niet af te brengen is van ‘zijn kijk op de dingen’ en het schaap opvreet, zit ook de muis gevangen in zijn eigen driftleven.
Wanneer ik de muizenval een ‘slim instrument’ noem, dan gebruik ik deze term in overdrachtelijke zin. Hier is sprake van een analogie. De slimheid van het instrument verwijst naar de slimheid van de technische vinding. De slimheid zit in de doeltreffendheid die door een combinatie van natuurkrachten, eigenschappen van de natuurlijke materialen, verkregen wordt.
De rationele mens onderscheidt zich van het dier waar deze instrumenten kan maken die niet direct gebonden zijn aan het onmiddellijke gebruik voor de bevrediging van zijn behoeften. De mens maakt machines om andere machines of instrumenten te maken zoals muizenvallen, of elektronische chips-machines voor algemeen gebruik. Alleen de mens overstijgt zo het niveau van de natuurlijke automatismen en driften. De mens stelt zijn onmiddellijke behoeftebevrediging uit en maakt tijd vrij voor het maken van gereedschappen om die later te kunnen gebruiken in de arbeid waarin hij zichzelf ten dienste stelt van de economie om in zijn onderhoud en dat van de zijnen te voorzien.
Het technische ding ontleent zijn zelfstandigheid en identiteit aan het door de mens bedachte ontwerp. Dat ontwerp is een doelmatig samenspel van krachten, een verstandige ordening van regels en wetten. Die identiteit komt tot uitdrukking in het geven van een soortnaam aan het technische instrument. Deze naam drukt meestal op een of andere manier uit waarvoor het ding gebruikt wordt: ‘muizenval’, ‘televisie’. De naam refereert naar het gebruik, de functie van het instrument.
Uit bovenstaande wordt ook duidelijk wat het is dat het technische onderscheidt van het economische. Veel denkers over techniek verwarren die twee. Het technische betreft de slimheid van de constructie, de originele combinatie van krachten door het verstand uitgedacht in een technisch ontwerp. De mens die eeuwen later een verweerde muizenval tegenkomt zal eraan zien dat het geen natuurlijk ding is, maar een kunstmatige constructie gemaakt volgens een technisch idee. Hij zal de werking ervan wellicht kunnen reconstrueren. Het economische betreft het gebruik van middelen voor de bevrediging van behoeftes. In een door technologie ontwikkelde kennis-economie moeten de behoeftes aan specifieke middelen gemaakt (aangepraat) worden om de economie draaiende te houden. Het product moet aantrekkelijk gemaakt worden anders werkt de technologische kennis-economie niet.
Mensen hebben een zekere behoefte aan muizenvallen. Zoals de muis op de val afkomt aangetrokken door zijn behoefte aan voedsel, zo komt de mens op de muizenval af aangetrokken door de behoefte de muis te bestrijden. Deze behoefte is met de techniek tot stand gekomen. De techniek biedt de mogelijkheid van de muizenval.
Aan het gebruik van de muizenval kleeft ook een ethische kant. Dit aspect dringt zich op als we een muis hebben gevangen. Hadden we de muis niet levend kunnen vangen? Maar wat er dan mee te doen? Of, zoals mij laatst overkwam: als je een prachtig geel en wit vogeltje hebt gevangen. We hebben een eind gemaakt aan dit leven. Wat bezielt ons! Het a-morele van de techniek is dat het technische volstrekt onverschillig staat tegenover de morele waarde van het gebruik ervan. Het technische is in die zin ethisch neutraal. Die volstrekte onverschilligheid is kenmerk van de mathematische denkhouding die we bij het uitvinden van de technische dingen innemen. Het is deze mathematische denkhouding die in de natuur slechts verschijningen ziet van wetmatigheden. In die natuur is geen leven. Het mathematiseren van de werkelijkheid veronderstelt abstraheren van de eigen kwaliteit ervan.
Heeft de muis bewustzijn? Heeft dit vogeltje bewustzijn? Met dat ik in het gefladder van dit dier gevangen in de muizenval de strijd op leven en dood herken, is dit geen vraag meer. En met dat besef dat dit dier bewustzijn heeft sta ik voor een moreel probleem. De moraliteit is geen gevolg van de erkenning van de status van bewustzijn, noch omgekeerd is de moraliteit primair en de status van bewustzijn een gevolg daarvan. In de beleving is de confrontatie met dit andere leven dat getuigt van bewustzijn onmiddellijk een confrontatie in een moreel dilemma.
De rationele mens onderscheidt zich van het dier doordat het in staat is de natuurlijke behoeften van de mens te manipuleren. De muis wordt weliswaar aangetrokken door de geur van pindakaas, maar deze maakt zelf geen pindakaas. De mens wel. Daarbij maakt de mens ook de behoefte aan pindakaas. Want niemand heeft van nature behoefte aan pindakaas, noch aan muizenvallen. De mens maakt zijn producten aantrekkelijk. Niet alleen voor hemzelf maar ook voor anderen. De reclameindustrie ontwikkelt en gebruikt kennis van de menselijke natuur om nieuwe behoeften te maken op basis van bestaande automatismen.
De reclame- en propaganda behoren tot één van de drie toepassingsgebieden van het technische denken die Jacques Ellul, en in navolging van hem de socioloog Helmuth Schelsky onderscheidt (Ellul, La technique ou l’enjeu du sciècle, 1954; Schelsky, Der Mensch in der wissenschaftlichem Zivilisation, 1961). Deze technische kennis noemen we ‘Human Engineering’. De hype rondom AI is mederesultaat van deze toepassing: reclame mystificeert het aangeprezen produkt. Artificial intelligence dankt haar succes voor een groot deel aan de macht van de grote tech-bedrijven die ook de sociale media beheren, zoals Google en Microsoft. Het ophemelen van de mogelijkheden die de AI, nu al of in de toekomst, biedt is een onderdeel van de fantastische suggestieve wereld van de AI.
Productie en consumptie zijn de interacterende processen van de consumptiemaatschappij: de producent creëert de consumptie, de consumptie creëert de productie. De drugsverslaafde mens houdt de productie en criminele handel in drugs in stand. De producenten van drugs doen hun best om hun afzetmarkt te vergroten door de jeugd te verleiden toe te treden tot het drugscircuit. Formeel is er geen verschil tussen de illegale economie van de drugshandel en de legale economie van de productie van en de handel in bijvoorbeeld graan, olie of informatie.
Onze kenniseconomie werkt op basis van automatisering, een autonoom proces dat zichzelf in stand houdt door de mens en natuur steeds meer in zich op te nemen. De melkrobot vraagt om het fokken van een robotkoe, waarvan de spenen passen in de melkbekers van de robot, zoals de oplader in de smartphone. De wetenschappelijke farmacie vraagt om speciaal gekweekte laboratoriummuizen ten behoeve van een statistisch verantwoord onderzoek naar de werking van medicijnen. De samenleving wordt studieonderwerp van FieldLabs in de wetenschappelijke strijd tegen het virus.
Het heeft niet zoveel zin om tegen een specifieke technische toepassing te ageren. De technische houding is allesdoordringend en kent geen grenzen. De enige zinvolle manier om de problemen van de techniek op te lossen is door inzicht in de eigen aard van de technoligie. Daardoor kunnen we deze relativeren. Het gaat erom de technische ontwikkeling zelf te controleren en zo bevrijdt te worden van de automatismen van een op technologische ‘vooruitgang’ gebaseerde economie.
Voor wat betreft de historische ontwikkeling van de techniek is de programmeerbare computer het typische kenmerk van onze op kennis en techniek gebaseerde economie. Het is een taalmachine. Niet alleen omdat het ding een programmeertaal heeft waarin het door de designer geprogrammeerd wordt, maar ook om het gebruik ervan door de eindgebruiker bij zijn automatismen aan te laten sluiten. De human interface is taal. Je spreekt het ding aan en het zegt iets terug. De woorden functioneren als sleutels die toegang geven tot bepaalde fysische processen, die wij zien als de uitvoering van een opdracht, het beantwoorden van een vraag. In de tekens die op het scherm verschijnen zien we ons bekende karakters, woorden en zinnen.
De economische macht is in handen van die bedrijven die niet alleen muizenvallen maken maar ook nieuwe behoeftes creëren en in staat zijn de individuele burger te zeggen hoe ze zich zelf kunnen worden, aan welk beeld van zichzelf ze willen of moeten voldoen. Deze bedrijven meten de gedragingen van het individu en leiden daaruit af hoe ze producten kunnen maken die matchen met een door hen zelf van de burger gemaakt profiel.
De naar individuele zelfstandigheid strevende ‘muizenmensen’ menen in het door de marktwerking voor hen gecreëerde beeld zichzelf te vinden. De economie en de bijbehorende participatiewet, volgens welke iedereen mee doet of hij wil of niet, werken als een muizenval voor de door het systeem gecreëerde behoeftige burger.
Pas door inzicht in het virtuele karakter van deze door middel van mediatechniek in stand gehouden werkelijkheid kan de mens zich werkelijk bevrijden uit deze uitbuiting van de natuur. De mens is immers niet puur rationeel denkende geest, maar ook als lichamelijk wezen onderdeel van de natuur.
Communicatie is niet iets dat op een uitwendige wijze tot stand wordt gebracht. Het is altijd al aanwezig en voorondersteld. We moeten opnieuw nadenken over de bijzondere relaties van eenheid en veelheid zoals die concreet tussen het individu en de samenleving bestaat. Dit nadenken zal de oppositie van de rationele mens tegenover de natuur die aan het technische denken ten grondslag ligt moeten overstijgen.
Demystificatie van AI. Hoe dan ?
Over Kunstmatige Intelligentie (Artificial Intelligence, kortweg AI) doen allerlei beelden de ronde. Die beelden betreffen de werking van AI, de gevolgen van AI voor de samenleving, de mensheid en de ontwikkeling van digitale technologie in het algemeen. De Wetenschappelijke Raad voor het Regeringsbeleid (WRR, website wrr.nl) onderscheidt in haar rapport Opgave AI – De nieuwe systeemtechnologie acht mythes over AI. De technologie zou bijvoorbeeld altijd neutraal en rationeel zijn. Maar er zijn ook allerlei angsten dat AI bijvoorbeeld zelfbewust wordt en zich tegen de mens kan keren. Te groot optimisme en overtrokken angsten acht de WRR ‘niet functioneel’. De WRR vindt Demystificatie van AI belangrijk om te zorgen dat de juiste vragen in de maatschappelijke discussie worden gesteld. Het gaat erom de verschillende beeldende verhalen die er van AI rondzingen tot begrip te komen.
Aan die demystificatie van AI wil ik graag een bijdrage leveren. Ook ik ben van mening dat er veel misverstanden bestaan als het om kunstmatige intelligentie gaat. Maar het gaat mij niet alleen om het ophelderen van wat AI is, maar ook om het ophelderen van de misverstanden zelf. Er zijn verschillende standpunten over de mogelijkheden van AI. Vanuit die verschillende standpunten wordt verschillend geoordeeld over de mate waarin AI technologie zelfstandig is of kan worden in het uitvoeren van processen, en in het nemen van beslissingen.
De toenemende mate van zelfstandigheid (autonomie) is een opvallend kenmerk van de technische ontwikkeling. Maar wat houdt die ‘zelfstandigheid’ precies in? In welke zin zijn een programmeerbare robot en autonome auto ‘zelfstandiger’ dan een muizenval, een nietmachine of een handzaag?
Het is duidelijk dat het hier om een relatieve zelfstandigheid gaat. De machine is zelfstandig in relatie tot de mens voor wie de fysische processen betekenisvol en doelmatig zijn. Een vallende appel heeft niet een door ons bedachte doelmatige werking, maar een vallende bom heeft dat wel. De informatieverwerkende (programmeerbare) machine onderscheidt zich van de klassieke machine hierin dat het bij de laatste om de fysische processen zelf te doen is (het produkt is iets materieels) terwijl het bij de informatieverwerkende machine om de betekenissen van de toestanden van fysiche processen gaat, waarbij het eigenlijke materiële niet van belang is. Het gaat om de structuur, de betekenis van de tekens, die geproduceerd wordt. De fysische processen zijn slechts als dragers van betekenis, als tekens, signalen, van belang. Daardoor schijnen deze nieuwe klasse van machines een hogere graad van zelfstandigheid te bezitten dan de klassieke machine, zoals de stoommachine. Deze machines zijn werkende tekens, betekenisvolle informatieprocessen. Ze hebben dus de relatieve zelfstandigheid van de taal als tekensysteem. Zonder de taalgemeenschap waarin deze machines, zoals ChatGPT of de sprekende sociale robots, functioneren zouden deze machines niet zijn wat ze zijn. We vergeten van het relatieve karakter van de relateive zelfstandigheid van de technische dingen, en denken ervoer alsof het absoluut zelfstandige artefacten zijn die buiten de relatie tot de mens zijn wat ze slechts in die relatie zijn. We vergelijken dan mens en machine, mens en AI, door ze tegenover elkaar als zelfstandige entiteiten te zien en ze zo beschouwd met elkaar te vergelijken. We zeggen dan bijvoorbeeld: de machine kan beter rekenen of beter schaken dan de mens. Die schijnbare zelfstandigheid is nou juist ook het wezen van de techniek. Daar is het ons om te doen. We willen dat de techniek zoveel mogelijk ons werk overneemt. Maar het is slechts een schijnbare zelfstandigheid. Deze zelfstandigheid van het technische ding, is dus van een andere soort dan de zelfstandigheid van de natuur, waar we gebruik van maken in de techniek. Zo gebruiken we natuurlijke mechanismen, zoals de hevelwerking, de hefboomwerking, de lenswerking, als technische middelen.
Dit is wat Jan Hollak (zie: Van Causa sui tot Automatie) bedoelt als hij zegt dat als we van een machine zeggen dat deze ‘denkt’, of ‘bewustzijn heeft’, dat we dan altijd het ‘intentionele correlaat’ van onze cognitieve relatie, ons bewustzijn, bedoelen. In die zelfde intentionele zin bedoelen woorden, of zeggen woorden, ons wat ze zeggen.
AI komt niet uit de lucht vallen. Het is mensenwerk. Demystificatie van AI kan door te laten zien hoe deze technologie de voortzetting is van een historische ontwikkeling van techniek. Het is resultaat van en stadium in een ontwikkeling die al vele eeuwen gaande is. Bij techniek gaat het altijd om het gebruik van natuur en mens als middel om iets zinvols te doen. Dat doel kan praktisch zijn of theoretisch. Een voorbeeld van een concreet technisch middel met een praktisch doel is een ploeg. Een voorbeeld van een concreet technisch middel met een theoretisch doel is een telescoop. Bij een praktisch doel gaat het primair om het bewerken van iets materieels. Bij een theoretisch doel gaat het om kennis op te doen van de natuur. De technologische ontwikkeling is in een stroomversnelling geraakt toen techniek wetenschappelijk werd en belangrijk werd voor de econonomie van een samenleving. Kennis van de regels volgens welke de natuur ‘werkt’ wordt gebruikt om een nieuwe gereedschappen, instrumenten en machines te maken. De werkelijkheid van de wetenschap is die van de kwantummechanica, de microbiologie en de genetica. Ver verwijderd van onze directe levenservaring, maar indirect via haar toepassingen van grote invloed op ons leven.
Zoals gezegd gaat het ons om meer begrip van AI. We kunnen grofweg drie begripsmatige fasen in de ontwikkeling van de techniek die geleid heeft tot de AI onderscheiden. De eerste is die van het werktuig. Typische voorbeelden zijn de hamer en de ploeg. Kenmerkend is dat het werktuig in zijn primitieve vorm gestalte krijgt door en in het gebruik ervan.
Een muizenval is een slim instrument. We zeiden al dat het hier om een analogie gaat. In de zelfde analoge zin noemen we een machine ‘intelligent’. We vatten een muizenval gewoonlijk niet onder de noemer van AI. Maar mischien is het goed om vanuit de AI nog eens naar de muizenval te kijken. Herkennen we dan aspecten van AI die eerst nog impliciet zijn?
De WRR hanteert in haar rapport voor AI de volgende definitie van de Europese High-Level Expert Group on AI:
“Systemen die intelligent gedrag vertonen door hun omgeving te analyseren en – met enige graad van autonomie – actie te ondernemen om specifieke doelen te bereiken.”
Laten we vanuit deze beschrijving van AI eens kijken naar de muizeval.
Het gedrag dat de muizeval vertoont is het vangen van een muis. Dit is het specifieke doel dat de muizeval wil bereiken. Daarvoor heeft het een zekere mate van gevoeligheid: de muizenval reageert op aanraking van het klepje door de muis wanneer deze van de pindakaas eet. (Zoals het ‘gevoelige plantje’ mimosa pudica, het kruidje-roer-me-niet, haar bladeren opvouwt wanneer het wordt aangeraakt). Dit is een soort van sensor dat de omgeving als het ware analyseert op aanraking. De intelligentie van de muizeval zit hem zowel in het feit dat deze gebruik maakt van pindakaas, iets dat de muis aantrekkelijk vindt, als in het zelfstandige fysische proces dat ervoor zorgt dat de muis gevangen wordt, wanneer de veer ontspant en het metalen boogje dichtklapt.
Op deze manier kunnen we de muizeval zien als een stukje kunstmatige intelligentie. We zien verschillende aanknopingspunten om de muizenval intelligenter te maken. Soms vangt de muizeval een meesje of een vinkje. Zo’n bedrijfsongeval moeten we natuurlijk zien te voorkomen. Of dit gebeurt is een kwestie van afweging van kosten en baten. Wat kost het leven van dit vogeltje? Dit is een morele vraag. Wat leveren we persoonlijk als mens in als we dit leven opofferen voor onze oogst?
De muizeval maakt gebruik van natuurwetten die we uitdrukken in conditionele ‘als dan’ regels. Als aan bepaalde condities A voldaan wordt dan gebeurt B. Deze kennis is het resultaat van ervaring en systematisch experimenteel wetenschappelijk onderzoek.
We bekijken nu de volgende stap in de ontwikkeling van de techniek, de informatietechnologie. We kunnen de werking van de muizenval beschrijven een vorm van informatieverwerking. De sensor, het klepje, informeert nu het stangetje dat er een muis aanwezig is. Deze informatie wordt door de beugel verwerkt en deze reageert met een actie, het dichtklappen van de beugel. Zo kunnen we ieder instrument, iedere machine, net als ons eigen lichaam, zien als een informatieverwerkend systeem met sensoren en actoren als deelsystemen. De informatie betreft de toestand van een deel van het systeem of (via een interface of sensor) van de buitenwereld. Waar de werking berust op informatieuitwisseling tussen componenten van een systeem, kan het mechanische of chemische systeem vervangen worden door een electrisch systeem. Het gaat immers voor het functioneren om de betekenis van een toestand en niet om de fysische realisatie van het teken. Meerdere toestanden of signalen kunnen in combinatie gezamenlijk de toestand van andere deelsystemen bepalen volgens een regel waarvan de algemene vorm is : Als A dan B.
Een computer bevat talloze logische schakelingen. Waarom heet een logische schakeling ‘logisch‘ ? Ieder instrument, ook een muizeval, zit logisch in elkaar, we kunnen snappen waarom het ding zo inelkaar zit als het is. We redeneren dan: als dit gebeurt dan gebeurt er dat en dan… enzovoort. Maar een logische schakeling is logisch op een bijzondere manier: de beschrijving van de functionele relatie tussen de invoersignalen x en y en de uitvoer z ervan is een logische regel: als x en y dan z.
Fysische toestanden staan voor waarden (0 en 1) van wiskundige variabelen en de causale relaties tussen fysische toestanden staan voor wiskundige operaties op die variabelen. Een logische AND-schakeling voldoet aan de beschrijving van de logische regel: de uitvoer is 1 dan en slechts dan als de twee invoerwaarden 1 zijn en anders 0.
Met de logische schakeling kunnen we expliciet de algemene ‘als dan’ regel maken, de regel die impliciet gebruikt wordt in het maken en gebruiken van slimme instrumenten. Door deze explicitering kunnen we netwerken van schakelingen maken die ieder door ons gewenste functionele relatie tussen invoerwaarden en uitvoerwaarden realiseren. De programmeerbare machine die zo verkregen wordt is dus niet meer gebonden aan de feitelijke in de natuur voorkomende functionele als-dan-relaties. We kunnen nu zelf iedere combinatie van ‘krachten’ ontwerpen en door de machine laten uitwerken.
De programmeerbare machine rekent met tekens die voor de mens verwijzen naar zinvolle toedrachten (grootheden) in de werkelijkheid.
Het mathematiseren van het denken
Machines kunnen slechts rekenen. Dat komt omdat rekenen een vorm van denken is dat machinaal verloopt: volgens eenzinnige regels worden tekens gemanipuleerd. Dat rekenende denken gaat over wiskundige objecten, getallen, verzamelingen, in het algemeen: elementen van structuren. Daar verwijzen de tekens naar die op zich zelf ook als elementen van een structuur, een formele taal, worden opgevat.
Voordat een machine kan redeneren zoals wij, moet dit ‘redenerende denken’ dus omgezet worden in rekenen. Dat gaat via de taal, de uitdrukking van het denken als denken. De Duitse wiskundige en filosoof Gottlob Frege heeft een belangrijke stap gezet in het omdenken (formaliseren) van denken naar rekenen. Hij redeneerde aldus. Onze gedachten drukken we uit in taal. Maar onze taal is veelzinnig. Bijvoorbeeld: het woord ‘slim’ is veelzinnig, net als ‘intelligent’ of ‘gezond’. De betekenis hangt af van waar je het over hebt. Analoog taalgebruik is een voorbeeld van gebruik van veelzinnige woorden. De taal van de wiskunde is eenzinnig. Onze dagelijkse omgangstaal bevat veel woorden waarvan de betekenis vaag is. Daar kun je niet mee rekenen.
Door de veelzinnigheid van de taal maken we vaak denkfouten. Zo redeneerde Frege. Hij stelde zich als doel een kunsttaal te ontwikkelen waarin alle termen een precieze ondubbelzinnige betekenis hebben: Begriffschrift. Het zou het begin worden van de meta-mathematica en de mathematische logica. De wiskunde van de structuur van het wiskundig redeneren. Frege beschouwde het begrip als functie. Een functie is een uitdrukking met een open plaats (zeg x) die zegt hoe de functiewaarde wordt bepaald wanneer voor de open plek x een waarde wordt ingevuld. Bijvoorbeeld: 3 * x + 5.
Begrip drukken we uit in een oordeelszin: “Deze rood is rood”. Hij zag het predikaat ‘x is rood’ als een functie-uitdrukking die als waarde ‘waar’ of ‘onwaar’ heeft (hij zag deze als wiskundige objecten) afhankelijk van de waarde van het argument (het subject van de bewering.). Frege zette daarmee de subject-predikaat-verhouding in het oordeel zoals we die sinds Aristoteles kenden op zijn kop. De functie, dat is het predicaat, wordt bij Frege het substantiële. Het toepassen of gebruik van een functie is uitdrukking van begrip: “deze roos is rood” is het toepassen van de functie “x is rood” op het object ‘deze roos’.
De formele logica maakt een strikt onderscheid tussen algemene denkregels en de denkinhouden. Er vindt geen interaktie plaats tussen de roos en het rood, ook al is het rood van de roos een ander rood dan dat van het bloed in het vloerkleed of het rood van de wijnvlek op de tafel in het licht van de ochtendzon. Het predikaat is rood is een eenzinnig predikaat, een functie die toegepast op een argument de waarde waar of onwaar heeft.
Wittgenstein zou deze gedachte van Frege voortzetten. De betekenis van de woorden en zinnen wordt bepaald door het gebruik. Een zuiver functionele opvatting van taal. De taal speelt een rol in een taalspel, regelsysteem dat hoort bij een levensvorm (form of life). Een woord begrijpen betekent weten hoe je het gebruikt (in een taalspel). Het verwoordingskarakter van de taal (in taal verwoorden wij onze relatie tot de werkelijkheid) is in deze functionele opvatting van taal uit het zicht verdwenen. Woorden worden toegepast. Als instrumenten die klaar liggen voor gebruik.
Een computer is nu een fysische realisatie van een wiskundige functie. Deze functie vastgelegd in het programma zegt hoe bij een bepaalde invoer de werking verloopt die tot een bepaalde uitvoer leidt. De toestanden die het machinale proces doorloopt staan voor de stappen in het rekenproces.
Frege spreekt nog op informele wijze over functies. Later kwam Church met de lambda-notatie voor functies, waarmee functies zelf wiskundige objecten werden, net zoals getallen. De lambda-calculus is de rekenkunde voor het rekenen met functies gerepresenteerd door hun λ-term.
λx. 3 * x + 5 is de λ-term die staat voor de functie f, gedefinieerd door f(x) = 3 * x + 5. De functie-applicatie is de operatie die staat voor het toepassen van de functie op een argument. De berekening van de waarde gaat via een herschrijfproces. De term ( λx. 3 * x + 5 ) 8 wordt herschreven door substitutie van het argument 8 voor de door lambda gebonden variabele x. Het resultaat is de term 3 * 8 + 5 die volgens standaardregels van de rekenkunde herschreven wordt tot 24 + 5 en tot 29.
Via de functietermen kan er nu mee gerekend worden door ze in de machine als interne toestanden te representeren.
In de lambda-calculus kunnen alle mogelijke berekenbare functies worden beschreven. Dat betekent dat ieder computerprogramma als λ-term geschreven kan worden. De functionele programmeertalen, zoals Haskell en Miranda zijn gebaseerd op deze calculus.
Machines verwoorden niet hoe ze zich tot de werkelijkheid verhouden. Hun gebruik zegt wel iets over onze verhouding tot de werkelijkheid. Zoals het gebruik van de muizenval wel iets zegt over hoe wij ons tot onze werkelijkheid, de natuur, het leven, verhouden.
In sommige culturen worden sommige technische constructies als een soort van levende wezens of goden gezien. Denk aan de zeven wereldwonderen. Daarin komt naar voren dat het technische weliswaar door ons bedacht en gemaakt is, maar dat we in het resultaat niettemin een toegift herkennen, iets dat het maakbare overstijgt.
Niet alleen in de piramide huist de ziel. Ook in zoiets schijnbaar eenvoudigs als een muizenval.
Wat (de aantrekkingskracht van) het stukje kaas is voor de werking van de muizenval, dat is (de aantrekkingskracht van) de taal voor de kunstmatige intelligentie.
Bronnen
AI (2021). Opgave AI. De nieuwe systeemtechnologie. Rapport 105 van de Wetenschappelijke Raad voor het Regeringsbeleid. Op 11 november 2021 door de WRR aangeboden aan de regering. Het rapport kan gratis worden gedownload van wrr.nl.
Het zoveelste rapport over het onrecht dat het Algoritme in dienst van De Instanties, publiek of privaat, de burger als individu aandoet heeft onlangs het licht gezien.
Nu is het de Rekenkamer Rotterdam die in Gekleurde Technologie wijst op de ethische aspecten van De Algoritmes.
Recent verscheen Algoritmische beslisregels vanuit constitutioneel oogpunt (Goossens et al, 2012) een publicatie over de rechtstatelijke risico’s ten gevolge van het gebruik van algoritmes door de verschillende overheidsinstanties.
De focus van deze studie ligt op “de fundamentele tweedeling tussen algemene regels en de concrete toepassing via individuele beslissingen alsmede, in het licht daarvan, de wisselwerking tussen normen en feiten.”
“De bevoegdheid voor het bestuur om in individuele gevallen concrete besluiten te nemen dient steeds een grondslag te hebben in algemene regels vastgesteld door een democratisch gelegitimeerd orgaan. De besluitvorming van het bestuur in individuele gevallen vindt echter al geruime tijd steeds vaker (deels) geautomatiseerd plaats op basis van algoritmische beslisregels. Hierdoor kan de relatie vertroebelen tussen enerzijds een concreet besluit dat het resultaat is van de toepassing van een algoritmische beslisregel en anderzijds de algemene regels die oorspronkelijk ten grondslag liggen aan de bevoegdheid van het bestuur om in individuele gevallen concrete besluiten te nemen.”
Verder merken ook de schrijvers van dit artikel op dat de toenemende complexiteit haar eigen problemen met zich mee brengt. “De complexiteit en ondoorzichtigheid van algoritmische besluitvorming kunnen voorts de democratische en rechterlijke controle op de toepassing van algemene regels bemoeilijken.”
Een verkenning van het gebruik van algoritmes binnen de gemeente Rotterdam bevestigt het beeld dat uit talloze eerdere onderzoeken is ontstaan, namelijk dat het gebruik van algoritmes soms tot vooroordelen en tot discriminatie leidt.
Het zal niemand verbazen wanneer een vergelijkbare conclusie zal kunnen worden getrokken wanneer het gebruik van algoritmes binnen de gemeente Twenterand of Leeuwarden, of willekeurig welk andere gemeente dan ook, wordt onderzocht.
De conclusies van eerdere onderzoeken naar het gebruik van algoritmes bij overheidsinstanties als de Belastingdienst hebben tot dezelfde conclusies geleid.
Zie bijvoorbeeld het in Januari 2021 verschenen rapport Aandacht voor Algoritmes van de Algemene Rekenkamer, waarin een ethisch toetsingskader voor het beoordelen van (het werken met) algoritmes wordt gepresenteerd.
Ondanks alle goede voornemens blijken steeds vaker mensen problemen te hebben met algoritmes.
Hoe komt dat? Waar zit de schuldige? Waarom hebben we eigenlijk algoritmes?
Om met die laatste vraag te beginnen. We gebruiken algoritmes, dat zijn algemene procedures om dingen te berekenen of te classificeren, uit economische overwegingen. Het is een ingebakken gewoonte die aansluit bij het feit dat we in de chaotische veelheid van verschillende dingen en zaken enige orde aanbrengen: dit is een stoel en dat ook; dit is een fiets en dat ook. Dat werkt handiger dan wanneer je elke stoel en elk fiets weer apart een naam moet geven en apart moet leren behandelen. Zo werkt het ook met mensen: dit is een mens en dat ook.
Wanneer je met een paar mensen samen leeft en beslissingen moet nemen over wat iedereen toekomt of moet inbrengen dan heb je geen algoritme nodig. Maar zodra de aantallen groeien moeten er regels worden opgesteld. Een belangrijk principe van rechtvaardigheid is dat van gelijkwaardigheid. “Ieder het zijne”. We willen mensen gelijk behandelen. Maar omdat niet iedereen gelijk is wordt het ook vaak als onrechtvaardig gezien om iedereen als gelijke te behandelen. Vandaar dat er allerlei opdelingen gemaakt worden om recht te doen aan individuele verschillen die er toe doen. Een verschil dat er toe doet bij het recht op een werkloosheidsuitkering wordt bijvoorbeeld bepaald door de leeftijd: ben je ouder dan de AOW-leeftijd dan heb je geen recht op deze uitkering.
Het aantal eigenschappen die er toe doen en die we in een regel op willen nemen om een rechtvaardige beslissing te kunnen nemen, neemt geleidelijk aan toe. Gelukkig zijn er computers die de pijn verzachten, ze hebben geen last van hoofdpijn en rekenen met hun algoritmes uit wat iedere individu volgens de regels toekomt. De computer werkt met identifiers, ziet geen mensen, alleen BSNs. Een inwoner van Rotterdam is een object in een data-structuur een pakketje informatie.
Een verschil dat er toe doet, dat heet informatie. Computer algoritmes verwerken informatie. So far so good.
‘Lerende’ algoritmes
Met ‘algoritme’ wordt tegenwoordig vaak een bepaald soort algoritme aangeduid: de zogenaamd ‘lerende’ algoritmes. Die ‘leren’ regels op grond van een hoeveelheid gegevens. Dat heet inductie. Het trekken van algemene conclusies over een groep op grond van een beperkt aantal gegevens over die groep. Bijvoorbeeld: als blijkt uit heel veel gegevens (‘Big Data’ heet dat) dat mensen die van Brinta pap houden vaak blauw haar en hamertenen hebben dan wordt de algemene regel afgeleid dat als een bepaald persoon blauw haar heeft en hamertenen dat deze van Brinta pap houdt. Voor ‘van Brinta pap houden’ mag u ook ‘frauderen met uitkeringen‘ en voor ‘blauw haar’ en ‘hamertenen’ mag u ‘heeft dubbel paspoort‘, respectievelijk ‘bezit een dikke BMW‘ invullen.
De keerzijde van de algemene regels waarmee de computer werkt is de individuele burger. Die is namelijk als unicum niet volledig te identificeren als een ‘snijpunt’ van welke verzameling van regels en beschrijvingen ook.
Dat is het probleem waar Aristoteles en na hem John Venn en Hans Reichenbach al op wezen. De algemene regels zijn vaak van toepassing, vaak of soms ook niet.
John Venn stelde in 1876 that “every single thing or event has an indefinite number of properties or attributes observable in it, and might therefore be considered as belonging to an indefinite number of different classes of things“.
Het probleem is dus waar we een bepaald individu onder moeten scharen.
Stel u krijgt te horen dat een willekeurige inwoner van Nederland een kans van 0.01 heeft om te overlijden aan een bepaalde ziekte. Wat zegt dat over de kans dat u of uw dochter aan de ziekte overlijdt? U wilt meer informatie. U doet elke dag aan sport. Helpt dat? U drinkt niet. Maakt dat verschil voor de kans dat u aan de ziekte overlijdt? Welke regels en welke statistieken zijn op u van toepassing?
Het probleem van de Referentie klasse noemde de natuurkundige en filosoof Hans Reichenbach (1891-1953) dit. Hij promoveerde op het gebied van de kansberekening.
“If we are asked to find the probability holding for an individual future event, we must first incorporate the event into a suitable reference class. An individual thing or event may be incorporated in many reference classes, from which different probabilities will result.”
Afhankelijk van welke referentieklasse je kiest voor een bepaald individu (de BMW rijders, de voetbalsupporters, de diabetici, de gescheiden vrouwen van middelbare leeftijd, etc.) komt je tot andere statistische conclusies.
Reichenbach’s Probleem van de Referentieklasse is onoplosbaar.
Dat algoritmes tekort schieten is dus een inherent probleem van elk systeem waarin met algemene regels en statistieken gewerkt wordt.
De onrechtvaardigheid van zo’n systeem is de keerzijde van de rechtvaardigheid die het motief is voor het invoeren van algemene regels en wetten.
Het onrecht zit er in dat de uitvoerders, de mensen die regels en algoritmes toepassen, dit feit zich niet realiseren en blind vertrouwen op de rechtvaardigheid van de regels. Alsof ze in alle gevallen de juiste conclusies trekken. Alsof deze algoritmes voor eens voor altijd de definitie van een begrip als ‘fraudeur’ hebben geleerd en precies weten op welke burgers dit wel en niet van toepassing is.
De filosoof Ludwig Wittgenstein merkte over het wisselvallige van wetenschappelijke definities het volgende op:
“Wat vandaag op grond van ervaring geldt als begeleidend verschijnsel van het fenomeen A, wordt morgen voor de definitie van ‘A’ gebruikt.”
“Zeg wat je wilt, zolang dat je niet verhindert te zien hoe de feiten liggen. (En als je dat ziet, zul je van alles niet zeggen.)” (Ludwig Wittgenstein, Filosofische Onderzoekingen 79)
Helaas kennen de informatie-systemen de ‘feiten’ niet en moeten de dienstdoende ambtenaren wel iets zeggen. Ze moeten iedere burger immers volgens de regels classificeren in een voorgedefinieerde categorie.
Deze problemen hebben alles te maken met de afstand tussen de beslissers en de mensen waarover besloten wordt. De beslisser rechtvaardigt zijn besluit door iedereen volgens dezelfde algemene regels te behandelen. De burger waarover besloten wordt wijst de beslisser erop dat hij niet te reduceren is tot een waarde van een variabele in zijn administratief systeem. Hij is meer dan een pakketje informatie.
Het rapport van de Rekenkamer Rotterdam komt met een baaierd aan aanbevelingen om de ambtenaren en de burger uit de beklemmende greep van de algoritmes te bevrijden. Die zullen weinig helpen zolang de kern van het probleem dat inherent is aan het gebruik van algoritmes niet wordt aangepakt.
De enige oplossing is dat de verantwoordelijke uitvoerder van de dienst met de persoon waarover het gaat in gesprek gaat zodat deze kan ‘zien hoe de feiten liggen’ en of het algoritme niet iets over het hoofd heeft gezien dat het verschil maakt.
Die gesprekken kosten tijd. En tijd is geld. Uiteindelijk is het dus een kwestie van economie. Precies daar waar de reden bestaat voor de invoering van algemene definities, wetten en regels. De politieke beleidsmakers moeten beslissen wat ze belangrijker vinden. Voldoen aan uitsluitend statistische doelen waarbij ‘niet-normale’ gevallen buiten de boot vallen. Of aandacht besteden aan ieder geval in het besef dat ‘normale’ mensen niet bestaan.
In de economie keert de wal het schip. Pas wanneer fouten ten gevolge van het ondoordacht gebruik van algoritmes een gemeente op hoge kosten jaagt, bijvoorbeeld vanwege claims van slachtoffers, zal deze bereid zijn werkelijk te investeren in een werkende oplossing: het gesprek met de individuele burger.
In het eerder genoemde artikel van Goossens et al (2012) merken de auteurs op “dat de inzet (van algoritmes) ook mogelijkheden biedt voor een betere toerusting van burgers. De vooruitzichten daarop zullen echter afhangen van de mogelijkheid of algoritmen minstens indirect tot ieders beschikking staan – wellicht in democratische, controleerbare structuren – dan wel of zij worden gecontroleerd door al dominerende en hegemoniale machten.”
Daarbij heb ik een paar bedenkingen.
De controle op de uitvoeringsorganen van de overheid ligt voor een belangrijk deel bij de volksvertegenwoordiging. Uit o.m. de ‘toeslagenaffaire’ blijkt dat deze onvoldoende geinformeerd wordt en onvoldoende capaciteit en kennis heeft om deze taak naar behoren uit te voeren.
Veel individuele burgers zijn niet of nauwelijks in staat om voor hun rechten op te komen. Bijna een kwart van de Nederlandse bevolking beschikt niet over de daarvoor vereiste taalvaardigheid.
Het is primair de verantwoordelijkheid van de overheid die allerlei intelligente technologie inzet ervoor te zorgen dat de toepassing daarvan op de besluitvorming m.b.t. de individuele burger recht doet aan de burger. Het gaat niet aan de achteloze burger te frustreren en buiten spel te zetten door deze te confronteren met de complexe implementatiedetails van de middelen die het bestuur vanwege economische motieven voor de uitoefening van haar taken aanwendt.
Over het begrip ‘toepassing van regels’
Er dient onderscheid gemaakt te worden tussen enerzijds het toepassen van een regel of functie in wiskundige zin, zoals dat door een ‘machine’ gebeurt op basis van een algoritme, en het toepassen van een rechtsregel in de rechtspraak anderzijds.
Een functie of regel zegt van zichzelf niet wanneer deze kan of moet worden toegepast (Wittgenstein). Daarvoor zullen weer andere functies of regels moeten worden opgesteld. Dit leidt tot het inzicht dat de uiteindelijke toepassing een impliciete kennis omtrent de rechtvaardige inschatting van de concrete situatie veronderstelt. Dat kan alleen door in gesprek te gaan met de betrokken burger in de concrete situatie.
In zijn Filosofische Onderzoekingen bewijst Wittgenstein zich ervan bewust te zijn dat de explicitering van begripsinhouden en regels altijd al het gebruik in de praktijk veronderstelt. De expliciet regels kunnen dus de praktijk niet funderen. Zodra impliciete kennis wordt uitgedrukt in expliciete oordelen en regels krijgt de inhoud een ander karakter. De keninhoud verandert.
“Datgene waardoor de praktijk functioneert, ligt als het ware op een dieper niveau, dat steeds wezenlijk impliciet blijft.” en “Ons expliciete weten is het topje van de ijsberg. In de omvang van deze laatste vergissen wij, slachtoffers van het rationalisme, ons dan ook deerlijk.” Zo schrijft Louk Fleischhacker in De Henide als Paradigma.
Wanneer het om de toepassing van algemene regels in concrete gevallen gaat merken de auteurs op “Dat wat we ‘toepassing’ noemen, raakt ook de toegepaste regel”.(p.6). De regels van een algoritme uitgedrukt in een programmeertaal veroorzaken het ‘gedrag’, de werking, van de machine. Dit is het kenmerkende taal/sleutel karakter van het eenzinnige mathematische teken zoals dat in de machine functioneert. Daarentegen veroorzaken de rechtsregels het gedrag van mensen niet zelf.
Nu ‘intelligente’ machines het nemen van beslissingen overnemen krijgen we steeds meer te maken met ‘automation bias’, het psychologische verschijnsel waarbij menselijke besluitvormers geneigd zijn algoritmische output te volgen en onvoldoende oog te hebben voor afwijkende niet-geautomatiseerde informatie. Dit is waar B,J, Fogg, de vader van de Persuasive Technology in zijn bekende boek al op wees. Computers hebben voor veel mensen iets magisch. Mensen hebben vaak meer vertrouwen in wat er op een beeldscherm verschijnt dan in wat mensen zeggen. Daarom herhaal ik als tegengif nog eens de volgende stelling bij mijn proefschrift:
“Op een computer kun je wel rekenen, maar je kunt er niet op vertrouwen”
Het onethische van de automatie
Er wordt wel gesproken van autonome technologie. In de opvatting dat technische artefacten autonoom zouden zijn of kunnen zijn schuilt een niet te verwaarlozen gevaar. Ze berust op een misvatting over de aard van de zelfstandigheid van de techniek. De identiteit van het technische artefact heeft een wiskundig karakter.
Als we de autonome machine zijn eigen gang laten gaan dan gaan we er kennelijk vanuit dat we voor eens en voor altijd expliciet in een wiskundig model en een daarop gebaseerd programma hebben kunnen vastleggen wat deze moet doen. Dat kan echter alleen als we afzien van het feit dat onze explicitering van kennis in een bepaald domein altijd voorlopig is en dat we deze zullen moeten en willen aanpassen op basis van nieuwe ervaringen die we opdoen.
Ethiek gaat om de waarde van het unieke andere dat gegeven is; om dat wat niet tot het bekende te reduceren is. De rechtvaardigheid vereist dat de rechter de regels interpreteert in de concrete gegeven situatie, dan wel dat hij die regels toepast die in de gegeven situatie van toepassing zijn. Het unieke individuele is niet in regels te vatten.
Machines die leren uit gegevens (big data) en de door (statistische) inductie geleerde regels of modellen toepassen op nieuwe gevallen negeren het unieke nieuwe van de situatie of persoon waarop ze worden toegepast. In die zin staat de ‘blinde’ (want in zichzelf gesloten) automatie als meest expliciete uitdrukking van het wiskundig denken en van de idealiteit van de producten van het mathematische denken op gespannen voet met het ethische principe dat vereist dat we recht doen aan de waarde van de concrete andere situatie, die juist als anders niet te reduceren is tot de kennis die op grond van ervaringen in het verleden is opgebouwd.
Literatuur
Cathy O’Neil (2016) Weapons of Math Destruction, How big data increases inequality and threatens democracy. Penguin Books, 2016.
Colyan et al. (2001). Is it a crime to belong to a reference class? The Journal of Political Philosophy, Volume 2, Number 2, pages 168-181, 2001.
Goossens, J., Hirsch Ballin, E., van Vugt, E. (2021). Algoritmische beslisregels vanuit constitutioneel oogpunt: Tweedeling tussen algemene regels en concrete toepassing onder druk. Tijdschrift voor constitutioneel recht, 12(1), 4-19.
“La liberté est donc un fait et, parmis les faits, que l’on constate, il n’en est pas de plus clair.” (Bergson)
Vrijheid is een feit: het kan niet ontkend worden, zonder het daadwerkelijk te bevestigen. De filosofen zien de vrije wil als een wezenlijk en onderscheidend kenmerk van de diersoort mens. De wil wil vrij zijn. Maar dat de vrijheid geen vanzelfsprekendheid is dat blijkt uit de dagelijkse gebeurtenissen waarin individuen en groepen mensen opkomen voor hun vrijheid. De vrijheid wordt voortdurend bedreigd. Het gevecht om de verwerkelijking van de vrijheid lijkt een constante van de geschiedenis van de mensheid.
“Wat betekent het om vrij te zijn in een samenleving of als samenleving?”
Historica Annelien de Dijn (1977), nu hoogleraar moderne politieke geschiedenis in Utrecht, besloot een tiental jaren van haar leven te besteden aan het schrijven van de geschiedenis van De Vrijheid en een antwoord te vinden op deze vraag. Het resultaat is Vrijheid – een woelige geschiedenis (Alfabet Uitg. 2021). Het is een prachtig en in zekere zin ook wel een indrukwekkend boek geworden.
“Vrijheid was eeuwenlang een emancipatorisch ideaal in wiens naam de heerschappij van politieke en economische elites werd aangevochten. Maar in de loop van de negentiende en twintigste eeuw werd dit begrip steeds vaker ingezet om de belangen van de geprivilegieerde minderheden te beschermen.”
Zo’n geschiedenisboek is weer eens wat anders dan Heyting’s “Projectieve Meetkunde”, Spinoza’s “Ethica”, of Wittgenstein’s “Tractatus-Logico-Philosophicus”. Hier valt immers niets te bewijzen. Of toch?
Het moeilijkste van zo’n project lijkt me om enige orde aan te brengen in de chaos van feiten die de geschiedenis van de vrijheid ons toont. Hoe orden je dat zootje? Hoe breng je enige systematiek in al die titels, documenten, ideeën en ‘feiten’? En is er al niet genoeg over de vrijheid geschreven? Is een nieuwe orde nog denkbaar?
Die orde wordt geschapen door de vragen die de schrijfster hebben gemotiveerd zich aan dit project te zetten. Wat betekent ‘vrijheid’ in een samenleving of als samenleving? De tweeledige vraag snijdt meteen al een kernthema aan: hoe verhoudt de vrijheid van het individu, als onderdeel van een samenleving zich tot de vrijheid van die samenleving als geheel? Hoe verhoudt het individu dat zijn vrijheid wil zich tegenover de (zelfgekozen, democratische of aristocratische) macht van de staat? De vraag dringt zich meer dan ooit op nu een pandemie ‘de vrijheid’, en dat is de individuele vrijheid van de burger, lijkt te bedreigen. Die vereist immers een sterke centrale aanpak van de Nationale overheden, idealiter waar nodig aangestuurd en begeleid door supra-nationale overheden (zoals de EU) en instituties (zoals de WHO). Het virus trekt zich nu eenmaal niet veel aan van landsgrenzen. Die aanpak, die soms diep ingrijpt in het leven van de burger, is voor velen van hen moeilijk te verteren. Ze zien dit als beperking van de keuzevrijheid, wat het ook is. Maar we moeten vrijheid uiteraard niet identificeren met keuzevrijheid.
Tegenwoordig, zo stelt AD, betekent vrijheid voor veel mensen vooral het bezit van allerlei individuele rechten, waaronder het recht op privacy en bescherming van het persoonlijke domein, tegen inmenging van de overheid.
Een illustratie van deze opvatting van vrijheid las ik onlangs in het kader van het debat over de corona-maatregelen van de overheid.
“Vrijheid wordt daarbij opgevat in de rijke zin zoals dat in de sociaal-democratische traditie gebruikelijk is: als iets wat niet alleen te maken heeft met de afwezigheid van overheidsbemoeienis, maar ook met de aanwezigheid van waardevolle kansen; met democratisch zelfbestuur; met morele verantwoordelijkheid voor anderen.” (Politiek filosoof Josette Daemen in een bijdrage voor de Wiardi Beckman Stichting.)
“De afwezigheid van overheidsbemoeienis” wordt hier als een vanzelfsprekend onderdeel gezien van vrijheid.
Dat is niet altijd zo geweest. Ooit werd de vrijheid van de mensen door westerse denkers en politici primair gezien als controle door het volk van de manier waarop het wordt geregeerd. De centrale vraag die AD probeert te beantwoorden is dan ook hoe het moderne idee van een in zekere zin anti-democratische ‘negatieve’ (Isaiha Berlin) vrijheid in de Westerse wereld ontstaan is.
Haar zoektocht begint in het oude Griekenland. Op de reis langs talloze denkers over vrijheid en langs talloze politici beschrijft de auteur de ideeën van Plato, Cicero, Locke, Rousseau en vele anderen. Het boek dat zo’n 460 pagina’s telt, barst uit haar voegen van de historische anekdotes gelardeerd met vele citaten. Het telt alleen al 60 pagina’s met notities, waarin een verbluffende hoeveelheid referenties naar historische teksten. De naïeve lezer, zoals ik, heeft er geen idee van hoeveel boeken, artikelen en traktaten er zijn geschreven over de vrijheid.
Afgezien van het centrale thema: de verandering van het vrijheidsbegrip als verhouding tussen de macht en autonomie van het individu, de algemene wil van het volk en de rol van het door het volk of door de traditie gekozen machthebbers, zit er niet veel logica in het verhaal van de geschiedenis.
Het boek Vrijheid nodigt uit om Hegel’s Grundlinien der Philosophie des Rechts, waarin het recht als het ‘Dasein der Freiheit‘ wordt behandeld, en zijn Philosophie der Geschichte nog eens door te worstelen. De Vrijheid van de Dijn leent zich uitstekend als verzameling van voetnoten bij deze wat systematischer behandeling van de historische ontwikkeling van het moderne vrijheidsbegrip, zoals door Hegel bij de aanvang van de 19de eeuw beschreven.
Of doe ik haar project hiermee te kort? Dit is geen ideeëngeschiedenis. Hoe verhoudt de inzet van historische figuren die strijd voerden voor de vrijheid zich ten opzichte van de historische ontwikkeling van het idee van vrijheid? In de Inleiding gaat De Dijn op deze kwestie en het gevaar van mythologisering van de ideeëngeschiedenis in.
“Zolang ideeënhistorici onthouden dat de geschiedenis die ze vertellen een geschiedenis is die door mannen en vrouwen is voortgebracht om hun eigen particuliere aan context gebonden redenen, zou het mogelijk moeten zijn de valkuilen van mythologisering te omzeilen.”
De dialectiek zit hem er in dat die ‘context gebonden redenen’ juist niet particulier zijn. (En niet toevallig?) Het zijn de ideeën die in de tijd leven die de mannen en vrouwen weer aanzetten de geschiedenis op een bepaalde wijze voort te brengen. Die dialectiek neemt Hegel mee in zijn opvatting van geschiedenis. Zo schrijft hij over de rol van de individuen in de wereldgeschiedenis in de ‘Grundlinien der Philosophie des Rechts:
“An der Spitze aller Handlungen, somit auch der welthistorischen, stehen Individuen als die das Substantielle verwirklichenden Subjektivitäten.” (par. 348)
De Dijn voert de historische figuren ten tonele vanwege de waarde van hun ideeën over vrijheid en hun politieke idealen in de context van haar systematische zoektocht naar een antwoord op de vragen die haar hiertoe brachten.
De rol van de ideeën komt duidelijk naar voren in de betekenis die het historisch materiaal speelt in De Dijn’s onderzoek.
De dubbele rol van de documenten
De historische documenten spelen een dubbele rol in het boek van De Dijn. Niet alleen om zelf te vernemen wat er ‘feitelijk’ (volgens anderen) gebeurd is, maar vooral ook om te zien hoe historische figuren via documenten ‘feitelijk’ kennis namen van ideeën over de vrijheid en de politiek en hoe deze ideeën hun standpunten en oproer beïnvloed hebben. Deze documentale geschiedenis levert de Dijn bewijsmateriaal voor haar inzichten in de motieven die een rol hebben gespeeld. Zo schrijft ze in de Inleiding.
“Als ik bijvoorbeeld beweer dat achttiende-eeuwse revolutionairen zich baseerden op het antieke concept van vrijheid, kan ik aantonen dat ze toegang hadden tot antieke teksten waarin het concept van vrijheid een cruciale rol speelde, en dat zij zelf dachten dat ze bezig waren een met de oudheid geassocieerd concept van vrijheid te doen herleven.” (p.19)
Aantonen is nog geen bewijzen. Het is het bewijzen zoals dat in de rechtszaal gebeurt, niet het bewijzen zoals van de Stelling van Pappos in de projectieve meetkunde. Bewijzen is hier aannemelijk maken; het gaat in de geschiedeniswetenschap om ‘probable’, niet om ‘provable’.
De Dijn’s documentale geschiedenis kan gezien worden als de bemiddeling van de verhalende geschiedenis die vertelt over historische figuren met de ideeëngeschiedenis door aan te tonen hoe ideeën via de historische documenten (media) het gedoe van de historische figuren in hun feitelijke omstandigheden hebben bepaalt. Daarmee ontmythologiseert ze enerzijds de ontaarde ideeëngeschiedenis en schept ze anderzijds enige orde en begrip in het toevallige en chaotische karakter van het gedoe.
Wat is vrijheid?
Ik ben vrij als ik weet wat ik wil en datgene doe waarvan ik inzie dat het noodzakelijk is gezien de sociale en politieke omstandigheden waarin ik verkeer.
Het is zo invoelbaar, het enthousiasme waarmee de vrijheidsstrijders ten strijde gingen en nog steeds gaan, voor de ‘goede zaak’, voor God en vaderland. Het enthousiasme waarmee tien of honderd duizenden jonge mannen zich aanmelden in Engeland en andere landen in Europa om mee te strijden in de Grote Oorlog.
Maar ook de ellende is dat. Wij kennen de beelden. Tegenwoordig real-time via de nieuwsmedia. Hoeveel doden heeft de strijd voor de vrijheid niet opgeleverd? Is de strijd, eventueel tot de dood erop volgt, onlosmakelijk verbonden met vrijheid en heeft wie niet strijd voor zijn vrijheid zich feitelijk al ten dode opgeschreven?
Is het beeld dat De Dijn schetst waarheidsgetrouw?
Bestaat er waarheid in de geschiedenis? Bestaan er feiten? Is Asterix en Obelix waarheidsgetrouw?
Neem Vercingetorix (ca. 82 – 46 v.Chr.) de Gallische koning uit Auvergne die aan het hoofd stond van de Gallische Opstand tegen de Romeinen in 53 – 52 v.Chr. , een historische figuur. Nadat hij lange tijd in vergetelheid was geraakt vond de ‘herontdekking’ van Vercingetorix plaats onder het bewind van Napoleon III. De keizer schijnt enige historische belangstelling te hebben gehad. De historische figuur van Vercingetorix bleek een uitstekend middel om de nederlaag van Frankrijk tegen Pruisen van 1871 te verwerken. Hij werd een held. Maar of Asterix en Obelix waarheidsgetrouw is? Hoe waarheidsgetrouw is de presentatie van het Marconi schandaal in the TV-serie Downton Abbey? Ik vind dat nogal irritant, die films of tv-series die suggereren een waarheidsgetrouw beeld van de ‘echte’ geschiedenis te schetsen. Ik moet me dan altijd bij de lurven pakken en denken dit beeld is een onderdeel van de geschiedenis. Je zit er midden in!
Historici als De Dijn kunnen op grond van uitvoerig bronnenonderzoek, als een soort van detective, de ‘waarheid’ zien te achterhalen. Maar de vraag of er geen ander materiaal is dat anders aantoont zal wel tot in de eeuwigheid blijven bestaan. En historici zullen elkaar met de feiten om de oren slaan. Ik ben geen historicus.
Ik sta er helemaal blanco in, in deze geschiedschrijving over de vrijheid. Ik heb dan ook niets inhoudelijks toe te voegen aan, of op te merken over de interpretaties die de schrijfster van de politieke ideeën en schermutselingen tussen revolutionairen, anti-revolutionairen, Jakobiners en monarchisten te berde brengt. Ik neem alles zoals ze het beschrijft en ik raak erdoor geboeid. Alles is immers mogelijk en alles is wel eens gebeurd of gezegd als het over de vrijheid gaat.
Ik snap wel dat wanneer het volk zijn eigen regering kiest er van de weeromstuit eens een overheid aan de macht komt die blijkt in de ogen van het volk zich tegen de wil van het volk te keren. Ik snap ook dat er een elite kan zijn die vindt dat het klootjesvolk, de plebejers, niet te veel macht moeten hebben omdat ze immers dom zijn. De verlichte idee van Descartes dat het verstand het best verdeelde goed ter wereld is, wordt niet door iedereen altijd gedeeld. Bovendien, je moet je verstand natuurlijk wel goed gebruiken.
Ik snap dat wie de vrijheid als bezit ziet, op den duur door de vrijheid bezeten kan worden, zodat de vrijheid in haar tegendeel verkeert. Het is de dialectiek van de meester en de knecht, van het volk en de staat die de sociale en politieke werkelijkheid van de vrijheid uitmaakt.
Wat de betrokkenheid van De Dijn bij de strijd om de vrijheid betreft, die is van een heel ander karakter dan die van de schrijfster van Het Hooge Nest bijvoorbeeld, of van de schrijver van Is dit een Mens? (Primo Levi). Het is de betrokkenheid van een student die uren, dagen en nachten doorbrengt in de universiteitsbibliotheken van Berkeley, Berlijn, London en Parijs op zoek naar historische documentatie die relevant is voor het verhaal dat ze vertellen wil, voor haar project. Er spreekt een professionele distantie uit.
Maar moet die gaan zonder directe betrokkenheid? Misschien is het modern, deze opvatting over geschiedschrijving als professie en dat professionaliteit distantie vereist. Zoals de triagist bij code zwart niet als internist direct betrokken mag zijn bij de covid patiënt waarover ze moet beslissen. De emotionele betrokkenheid staat immers een eerlijke besluitvorming in de weg. Die laten we liever over aan de subjectloze procedures. Professionaliteit is werken volgens procedures, met distantie.
Wanneer je Marx’ geschiedenis van de arbeid en het kapitalisme leest of Hegel’s fenomenologie van de objectieve geest dan voel je de betrokkenheid bij de historische situatie waarin deze verkeerden en hun werk schreven. Je ziet hoe Hegel, die net zijn Phänomenologie des Geistes had afgerond, met instemming de intocht van zijn held Napoleon in Jena (1806), de ‘wereldziel’, aanschouwt. “Het is inderdaad een wonderlijke ervaring om zo’n individu te zien, dat hier op een punt geconcentreerd zittend op een paard, de hele wereld omvat en beheerst.” schrijft Hegel.
Je ziet hoe Marx de ellende die de industriële revolutie in Engeland (door Hegel zo bewonderd!) de arbeiders heeft gebracht en hoe die hem dwingt zijn historische project af te maken. Bij De Dijn ‘s Vrijheid heb ik die emotionele drive, gevoed door de huidige staat van de sociale en politieke vrijheid in haar eigentijdse wereld niet gevonden.
Naschrift: In een interview met Trouw komt die persoonlijke betrokkenheid van de schrijfster veel meer tot zijn recht.
Daarin zegt ze:
“Toen ik aan dit project begon, dacht ik: zou er niet eens iemand een lange geschiedenis van de vrijheid moeten schrijven? Zo stapte ik erin, neutraal dus, ik wilde geen punt maken. Maar toen ik de teksten uit de 19de eeuw ging lezen, begon ik me kwaad te maken. De vrijheid is gekaapt.”
Wat hebben we geleerd van de geschiedenis?
Is er vooruitgang in de geschiedenis van de vrijheid? Is er een ontwikkeling van het vrijheidsbegrip? Leren we iets van het verleden? Wat leert De Dijn’s Vrijheid ons? Wat heeft de burger, de PvdA, de VVD, de PVV aan haar analyses? Het zijn vragen die niet aan de orde komen in dit boek.
Het vooruitgangsidee is een moderne idee. Hier heerst de Hegeliaanse idee van de wereldgeschiedenis als “der Fortschritt im Bewustsein der Freiheit“. Wellicht heeft dit te maken met de waarde die de moderne mens hecht aan de technologie en de wetenschap. Wat heerst is een drang om nieuws om vernieuwing. Wetenschap, techniek en economie zijn nauw met elkaar verweven.
Wat werkelijk nieuw is, is dat we de tijd hebben omgedraaid. Het beeld dat onze moderne samenleving aan de monitor ligt is versterkt door de pandemie. Het nieuwe normaal is dat we onze geschiedenis vooruit plannen. We meten van alles, stikstof, zuurstof, virussen, contacten, klimaatveranderingen, weidevogels, en zetten piketpaaltjes in de toekomst waar we onze plannen op in richten. Alles voor de bestendigheid van het leven. Niet ons leven, niet alleen het leven van de huidige generatie maar van het leven tout court. Zo schrijven we de geschiedenis van de vrijheid nog voordat we hem beleven.
Is ‘vrijheid’ een constante?
De historicus David Wootton wijst er in zijn “The Invention of Science. A new history of the scientific revolution” op dat kennis niet altijd is geweest wat het nu is. De taal verandert, vrijheid heeft niet altijd hetzelfde betekent. Voor 1700 waren er volgens hem geen feiten. Dat wil zeggen er waren wel feiten, maar deze werden niet als feiten gezien. In die zin was er dus ook geen informatie. Het is lastig om ons in te denken in andere tijden, en in het denken van mensen uit andere tijden. We kunnen hen niet onze maat, onze kijk op de werkelijkheid, opleggen.
De Dijn is een historicus, geen antropoloog, geen filosoof. Volgens Weber is rationaliteit de sleutel voor het begrip van wat er in een samenleving gebeurt. Maar wat is rationeel in andere tijden, in andere culturen? De antropoloog E. Evans-Pritchard rapporteert in Witchcraft, Oracles and Magic among the Azande (1937) over rationaliteit in de cultuur van de Azande van binnenuit. Hoe ze denken en wat ze doen hoe ze gebeurtenissen en eigen handelen verklaren door middel van heksen, orakels en wonderen is voor hen rationeel. Voor de buitenstaander is hun wereld volstrekt irrationeel.
Kunnen we het label ‘vrijheid’ wel plakken op zulke verschillende samenlevingen als die welke De Dijn in haar boek noemt? Is vrijheid hetzelfde in een samenlevingsvorm van 30 mannen, vrouwen en kinderen, in een Griekse stadstaat waarin er een aangeboren onderscheid is tussen slaven en vrijgestelden? Doet de verandering van het vrijheidsbegrip zoals De Dijn die illustreert wel recht aan de veranderlijkheid van de idee vrijheid door de verschillende samenlevingsvormen heen? Is er geen tijd geweest waarin vrijheid helemaal niet bestond, zoals er geen feiten en geen informatie bestond? Wij proberen vooral vrij te worden van onze tradities, van onze aangeboren eindigheid, van onze genen, van de culturele beperkingen die met ons aangeboren geslacht samengaan. Wij bepalen zelf wel hoe wij willen leven en wie we zijn voor anderen.
Onze vrijheid in het rijke Westen staat niet los van de (on)vrijheid van de mannen, vrouwen en kinderen in de sloppenwijken van India en China die er voor zorgen dat wij voor een paar luizige centen ieder jaar een nieuw mobieltje kunnen aanschaffen. Dat we elk jaar (maand?, week?) nieuwe kleren kunnen kopen voor een paar euro bij de Primark.
Onze economie wordt niet meer gedreven door de arbeid zoals in Marx’ tijd. Wij leven in een samenleving waarin kennis en technologie de belangrijkste motor van de economie zijn geworden. De arbeid is uit onze samenleving weggewerkt door automatisering en export. De sociale media hebben de rol die de arbeid als sociaal medium speelde in de tijd van de fabrieksarbeid overgenomen. De strijd voor de vrijheid zal een rechtstreeks gevolg zijn van deze nieuwe feiten. De strijd tussen het rijke Westen en de Anderen.
De Amsterdamse filosoof en antropoloog Jan Hollak heeft in verschillende artikelen geschreven over de betekenis van de moderne technologie voor de moderne opvatting van de vrijheid als zelfstandigheid (autonomie). Men leze bijvoorbeeld zijn Hegel, Marx en de Cybernetica of zijn magistrale rede Van Causa sui tot Automatie, werken die hij schreef in de woelige jaren 60 waarin nieuwe generaties studenten universiteitsgebouwen bezettend vochten voor hun vrijheid. In een tijd waarin KU Nijmegen, waar Hollak in 68 zijn inaugurele rede hield, nog een Marxistisch-Leninistisch rood bolwerk was. Een heel andere geschiedenis van de vrijheid. Hoe verhoudt De Dijns geschiedenis van de Vrijheid zich tot deze geschiedenis van het wetenschappelijk denken en technologie in dienst van de naar autonomie strevende moderne mens? Het ideaal van autonomie is het ideaal van de negatieve vrijheid van Berlin, waarin het gaat om vrij zijn van inmenging door de overheid. Een geschiedenis van de vrijheid zou een verband moeten leggen tussen de opkomst van de op de experimentele wetenschappen en de technologie gebaseerde kenniseconomie in de westerse samenleving en de inzet van de strijd voor de vrijheid. Ik denk met name aan de strijd voor het recht op privacy en de macht van de grote bedrijven als Google, Microsoft en Amazon.
Misschien dat De Dijn nog eens boek schrijft dat over de geschiedenis van nu gaat. Waarin het over een thema gaat waarbij ze meer schrijft op een persoonlijke manier niet alleen als professionele historica die het verleden van een afstand bestudeert en optekent, maar als individu dat in deze moderne tijd die beheerst wordt door het wetenschappelijk en technologisch denken probeert vrij te zijn.
In het Trouw interview geeft De Dijn te kennen tegenstander te zijn van het moderne anti-democratische ideaal van een kleine overheid.
“Ik denk niet dat een kleine overheid het menselijk potentieel optimaal benut. De acties van individuen zijn niet in staat om de klimaatcrisis te keren. Je hebt dus een sterke staat nodig. Niet als een Chinese dictator, maar als een slagvaardige staat die onder onze collectieve controle staat. Zo bewaar je je vrijheid én heb je een slagvaardige overheid.”
Er zijn twee redenen waarom deze uitspraak iets zegt. De eerste reden is dat het ook niet waar kan zijn en daarmee bedoel ik dat informatie wel bestaat. De tweede reden waarom deze uitspraak iets zegt is dat er mensen zijn die beweerd hebben dat informatie bestaat, het tegendeel van wat ik hier wil verantwoorden.
Ik zeg dit vanwege het volgende.
Het is volgens de informatie-theorie gebruikelijk te zeggen dat de hoeveelheid informatie die een bericht bevat bepaald wordt tegen de achtergrond van het aantal mogelijke alternatieven. Zo berekenen we de gewenste capaciteit van het communicatiekanaal dat aan een zekere snelheid moet voldoen op basis van het aantal mogelijke berichten dat de gebruikers ervan over het kanaal willen versturen.
Shannon was als communicatie-ingenieur evenmin geïnteresseerd in de inhoud van de berichten als de statistici van het RIVM zijn in de uitslag van mijn PCR-test. Ik haal dat erbij omdat ik (en niet alleen ik) als individu die zo’n test-uitslag krijgt met daarbij de disclaimer dat een test nooit helemaal 100% betrouwbaar is en dat ook bij een negatieve uitslag er geen garantie is dat ik niet besmet ben met het corona virus ook niet weet wat ik aan zo’n statistiek heb. De vraag die zich dan immers voor doet is: wat betekent zo’n statistische uitspraak voor mij, als een feitelijk een unicum, met een bepaalde lengte en een bepaald gewicht, en andere bepaalde relevante fysische constantes (BMI, genetische code, etc); constantes die allen met zekerheid afwijken van ‘de gemiddelden’ die de statistici voor “de Nederlanders”, waartoe ik behoor, hebben berekend. Gemiddeldes bestaan niet, net zo min als de Nederlander. Ik wel.
Tot welke klasse ik mij, met hulp van vele medisch relevante gegevens, ook indeel, ik zal daarmee nooit dat unieke gegeven kunnen beschrijven dat ik ben. Zoals de Groningse statisticus Willem Schaafsma mij eens toevertrouwde: Reichenbach’s probleem van de referentieklasse is niet oplosbaar.
Google weet dat hoeveel gegevens ze ook over u verzamelen en hoe intelligent hun machine learning algoritmes ook zijn ze u als uniek individu nooit zullen beschrijven. Google weet niet wie u bent. Google kent u niet. De Belastingdienst ook niet; ook al noemt ze u ‘fraudeur’.
Informatie bestaat niet.
Dat ik deze uitspraak doe daarvoor heb ik een reden en een bedoeling. De reden is dat het waar is wat ik zeg en het doel is dat ik het van belang vind dit op te merken. En dat heeft te maken met de bovengenoemde twee redenen waarom deze uitspraak ook iets zegt: het niet waar kunnen zijn en er zijn er die anders beweren, zoals o.a. Luciano Floridi, primus inter pares onder de informatie-filosofen.
De reden is de oorzaak en de waarheid van het oordeel.
Voor u als lezer of ontvanger van het bericht is de uitspraak “Informatie bestaat niet” iets anders dan voor mij. Het is belangrijk dat we ons dat realiseren! U kijkt daar namelijk anders tegen aan. Laat ik zeggen van buiten af. Voor de ontvanger geldt dat een mogelijkheid is wat voor mij een noodzakelijk feit is. Het doel van communicatie is dat beide kanten overeenstemming hebben over de noodzakelijkheid. Dat doel motiveert de communicatie, het is er de motor van. Het bestaat slechts als vermogen, niet feitelijk. Dit geldt ook voor het observeren van de werkelijkheid: wat voor deze noodzakelijk feit is, is voor u een mogelijkheid. Het komt erop aan de noodzakelijkheid in te zien. Niet om het feit weg te verklaren als teken van iets anders. Het gegeven feit is zichzelf voldoende grond.
Elke feitelijk gebeuren heeft deze twee kanten. Enerzijds is het een onmiddellijk noodzakelijk gegeven, anderzijds is het iets dat tegen de achtergrond van alternatieve mogelijkheden bekeken kan worden. Dan is het gegeven iets “dat zich nog bewijzen moet”. We zeggen dan: “Laten we maar eens zien of dit werkelijk waar is”. “Wat heeft dit te betekenen?”
Wanneer ik zeg dat Informatie niet bestaat dan beweer ik dat informatie dit proces is, een gebeuren dat bemiddelt tussen de waarheid en noodzakelijkheid van het bericht voor de spreker/zender en het bericht als mogelijkheid tegen een achtergrond van de kennis van de luisteraar/ontvanger. Deze kennis is grotendeels impliciet, iets dat we geloven of aangenomen hebben zo te zijn. Een nieuw bericht kan dat tegen (lijken te) spreken. Zoals bijvoorbeeld het bericht dat informatie niet bestaat uw geloof dat informatie wel degelijk bestaat in de verkeerde war kan schoppen. (Merk op dat dit volgens de wet van Bayes niet kan. Exit reverend Thomas Bayes !)
Er wordt wel beweert dat informatie bestaat. Dat het een economisch goed is (een çommodity’), iets objectiefs. Floridi is van mening dat informatie alleen informatie is als het waar is. Ik meen dat waarheid niet een eigenschap van informatie is, maar van een bewering of oordeel of van kennis die in een bewering wordt uitgedrukt. Informatie is betrouwbaar of onbetrouwbaar.
Het Schandaal van Deductie houdt in dat een bewering die logisch volgt uit een bekende theorie geen nieuwe informatie bevat. Zo’n bewering heeft geen informatieinhoud voor de ontvanger (Hintikka). Om dezelfde reden geeft de uitkomst van een berekening of de oplossing van een puzzel geen nieuwe informatie. En toch rekenen we een ingewikkelde integraal uit omdat we willen weten hoe groot de uitkomst is in voor ons begrijpelijke termen. De inhoud van een elk nog leeg hokje van een sudoku puzzel ligt vast (deze volgt uit de gegeven cijfers en de regels van het spel) maar we weten nog niet welk getal er in een bepaald leeg hokje moet komen te staan.
Floridi ontwikkelt een kwantitatieve theorie van Strongly Semantic Information (TSSI, zie Floridi 2004) die een oplossing biedt voor de paradox van Bar-Hillel en Carnap, een gevolg van de probabilistische informatietheorie die zegt dat hoe groter de kans dat een bewering waar is hoe minder informatief deze is het Schandaal van Deductie (een bewering die logisch volgt uit een bekende theorie geeft geen nieuwe informstie Hintikka). Een contradictie zou dan maximaal informatief zijn.
Deze theorie gaat over een informatie begrip dat in tegenstelling tot wat hij beoogt niet voldoet aan wat we in het gewone spraakgebruik onder informatie verstaan. Dat gewone spraakgebruik heeft het namelijk ook over onbetrouwbare informatie. Floridi gaat echter uit van een ruisvrij communicatiekanaal tussen een betrouwbare (“bona fide”) zender en een ideale ontvanger. Dit informatie begrip impliceert waarheid. Valse informatie is geen informatie. Floridi gaat er vanuit dat de ontvanger de informatieinhoud van een bericht (infon) kan bepalen omdat deze volledige kennis heeft van de wereld die als referentie model geldt en waar de gegeven informatie betrekking op heeft (“localized omniscience”). Daarmee is deze ontvanger in staat de graad van discrepantie van de informatie-inhoud met deze wereld te meten.
Floridi’s kwantitatieve theorie van sterke semantische informatie gaat ervan it dat sommige beweringen meer waar zijn dan andere. De bewering “Hij heeft drie euro” is meer waar dan “Hij heeft zes euro” wanneer ‘hij’ feitelijk 4 euro heeft. Een andere ordening op beweringen is op basis van mate van bepaaldheid of vaagheid. “Hij heeft weinig geld” is minder informatief dan “Hij heeft minder dan 3 euro”.
Pragmatisch gezien heb je meer aan een onware bewering die vlak naast de waarheid zit, dan aan een ware bewering die niets zegt, omdat deze teveel in het midden laat (randgeval: een tautologie). Je kunt echter alleen zeggen hoe ver iemand er naast zit als je weet wat het geval is. Maar dan hoeft er niet meer gecommuniceerd te worden!
Dit is het “selectieve informatiebegrip”. Het gaat om het identificeren van een element uit een gegeven (eindige) verzameling van elementen. Informatie wordt als iets puur kwantitatiefs opgevat: iets dat volledig bepaald is door dat wat het niet is.
Maar een feit is meer dan realisatie van een mogelijkheid uit een veld van vooraf gegeven mogelijkheden. Dat iets is en wat het is staan volgens deze theorie volstrekt tegenover elkaar. Dit is een typische kenmerk van het mathematische.
Over de onbegrijpelijkheid van het feitelijke gaat het volgende.
Obama, het alarm, en het fietsslot
Iemand vroeg zich eens af hoe het toch komt dat de batterij van het brandalarmapparaat altijd midden in de nacht op is (het ding maakt dan een hels lawaai). Ik had een soortgelijke vraag: waarom zit er altijd net een spaak in de weg als ik mijn fiets op slot wil zetten? De Nederlandse cabaretier Erik van Muiswinkel merkte in een show eens op dat hij precies op dezelfde dag geboren is als de president van Amerika Barack Obama (die was toen president). De cabaretier merkte daarover het volgende op: “Als dit geen toeval is, dan is het wel heel toevallig”. Wat is hier aan de hand?
Bias. De verklaring van deze toevalligheden die geen toeval zijn is bias. Het wordt namelijk opgemerkt omdat het opmerkelijk is. Het is niet aan de orde om het verschijnsel tegen de achtergrond van alternatieven te bekijken omdat het om feiten gaat die door het achterliggende mechanisme al uitgefilterd zijn. Wanneer ik zoek naar iemand die op mijn geboortedag 10 januari geboren is vind ik Donald Knuth, wel de ‘vader van de informatica’ genoemd. Wanneer is dat toeval? Wat is dan het toevallige?
Toeval bestaat niet, zoals Bruno De Finetti al zei. Net zo min als informatie bestaat.
Over het verschil tussen een gevangene en een deur
Wat is verschil tussen het probleem van de drie gevangenen en het probleem van de drie deuren?
Bij het eerste probleem is de vraag of de kans dat gevangene A wordt vrijgelaten verandert nadat deze weet of het B of C is die wordt vrijgelaten. Was deze kans eerst 1/3. De vraag is wordt deze 1/2 of blijft deze gelijk?
Bij het drie deuren probleem is de vraag nadat de deelnemer A had gekozen en de quizzmaster een deur heeft geopend die niet A is en waar geen auto achter zit of de deelnemer er beter aan doet van keus te veranderen of dat hij A blijft kiezen?
Volgens de meeste geleerden is het antwoord bij de gevangen dat de nieuwe informatie geen verschil maakt voor de kansen van gevangene A. Deze blijft 1/3; er is niets verandert. Maar de deelnemer aan de quiz kan beter de andere deur nemen want de informatie die de geopende deur hem biedt veranderen de kans dat A de deur is met de auto.
Wat is het verschil dat dit verschil verklaart?
Kans of feit?
Er is een onoverbrugbare kloof tussen uitspraken over een veelheid en uitspraken over de individuen die deze veelheid uitmaken. De bewering dat de gemiddelde lengte van “de Nederlander” 1.75 m is” is het resultaat van een schattingsproces waarbij de gemiddeldes van groepen van Nederlanders berekend zijn. Het gaat hier om het zo goed mogelijk bepalen van de kans dat een bepaalde ‘fysische’ constante in een zeker waardebereik ligt. De kans kan benaderd worden als soort van limiet van een rij gemiddelden. Wat herhaald kan worden is het selecteren van een deelgroep, waarvan we aannemen dat deze representatief is voor “de Nederlanders”.
Bij het bepalen van de kans dat we met een dobbelsteen een 6 gooien is het experiment het werpen met de dobbelsteen “onder gelijke omstandigheden”.
In beide gevallen speelt impliciete kennis (‘inzicht’) in wat als ‘gelijke gevallen’ beschouwd kan worden een rol.
Altijd speelt impliciete kennis een rol van betekenis bij het bepalen van de informatie-inhoud van een gegeven of bericht.
Informatie bestaat niet, noch als iets fysisch, noch als iets mathematisch; het is iets dat slechts in het intersubjectieve verkeer bepaald wordt.
Bronnen
Floridi, L. Outline of a Theory of Strongly Semantic Information. Minds and Machines14, 197–221 (2004).
“The more we know, the less we know” (Marion Koopmans, Twitter, 8-4-2021)
Wat zegt ze daar? “The more we know, the less we know”? Wat is dat voor logica! Dat moet wel een vrouw zijn. Het is in een tweet van onze nationale huiskamer-viroloog en corona virus vraagbaak Marion Koopmans. Een wijze vrouw.
(Mijn zoons wijzen mij er regelmatig op: “Grijze haren zijn geen teken van wijsheid, maar van ouderdom.” Marion Koopmans is het levende bewijs dat grijsheid de wijsheid ook niet uitsluit.)
Wat volgt is een voetnoot bij de uitspraak dat door nieuwe informatie onze kennis soms vermindert.
Mijn docent Dirk Kleima wees ons er al op tijdens het college Informatietheorie, waarin hij o.a. Shannon and Weavers klassieker “The Mathematical Theory of Communication” en het Maxwell duiveltje behandelde, om aan te tonen dat informatie uitwisselen energie kost. Hoe dan?
De kerngedachte is dit: nieuwe informatie vermeerdert de kennis omtrent een bepaald gebied van de werkelijkheid. Daardoor verandert ons inzicht in wat mogelijk is en wat niet. Maar ook wat meer en wat minder waarschijnlijk is. Onze voorspellingen omtrent de werkelijkheid veranderen.
De verwachtingen en mogelijkheden worden wiskundig uitgedrukt in een kans-verdeling. Wetenschappers, virologen, etc, maken zulke kans-modellen.
Zo’n kans-model heeft een entropie. Dat is een maat voor wanorde, chaos. Kennis schept orde in de chaos van de ruwe natuur. Gisteren viel bij ons een meer dan 80 jaar oude dikke wilg om. Dan heb je chaos in je tuin.
Dat kans-model, uitdrukking van onze kennis op een bepaald moment, geef ik aan met P(K) waarbij K de (impliciete) kennis van het domein is en P staat voor een probability, een kansfunctie. Bij iedere mogelijkheid die zich voordoet (denk aan uitkomsten van een test of worp met dobbelsteen) geeft de functie P(K) een waarde, zeg P(K)(x) van mogelijkheid (event) x.
Die kansverdeling heeft een entropie-waarde die je met een logaritmische functie berekent. Doet er hier niet toe hoe dat gaat, maar het is een getal dat aangeeft hoeveel bits je gemiddeld minimaal nodig hebt om het bericht dat een bepaalde mogelijkheid zich voor doet door het kanaal van Shannon te sturen. Als alles even kansrijk is, is de chaos maximaal: je weet dan weinig of niets, je kunt alles verwachten.
Je zou dus verwachten dat nieuwe kennis minder chaos en dus een lagere entropie oplevert. Immers je weet meer.
Nee, zegt Marion: “The more we know, the less we know“. Hoe meer informatie des te minder weten we. Inderdaad Dirk Kleima (“bewijstechniek is net zo belangrijk als soldeertechniek“) gaf een bewijs van zijn bewering dat informatie de entropie van je kansverdeling kan vermeerderen.
Na nieuwe informatie E (evidence) wordt de nieuwe kansverdeling P(K) (x|E), spreek uit: de kans op event x gegeven de informatie E. Die kansverdeling kan behoorlijk verschillen van de oude. Eenvoudig voorbeeld: eerst was de kans op een 6 bij het gooien met een eerlijke dobbelsteen 1/6. Maar als je informatie krijgt dat de uitkomst even is, dan is de kans op een 6 al 1/3.
In dit voorbeeld is de entropie al niet eens verandert. Maar docent Kleima gaf dus een voorbeeld waarin de chaos/entropie toenam. Binnen een bepaalde deelgroep van Nederlanders, bijvoorbeeld die met blauwe ogen, kan de verdeling van haarkleur best uniformer zijn dan in de hele bevolking van Nederland. Met als gevolg dat informatie dat iemand tot die deelgroep behoort (blauwe ogen heeft) je minder zeker maakt over de haarkleur van die persoon. De entropie is toegenomen.
Ik heb altijd vermoed: hier wringt een schoen. Dat vond Luciano Floridi ook toen hij vernam hoe Bar-Hillel en Carnap kansen aan kennis en belief-updates koppelden. Hij noemt dit fenomeen de Bar-Hillel-Carnap paradox. Deze zou voortkomen uit de Inverse Probability These: hoe kleiner de kans op een event is, des te meer informatie geeft het je wanneer deze event optreedt. En hij meende dat dit betekent dat als je een uitspraak hebt die nooit waar kan zijn (“het regent en het regent niet”), dat deze dan maximale informatie-oplevert. Deze stap is voor Floridi’s rekening. Maar ook anderen maken die.
De oorzaak van de ‘paradox’ is echter een verwarring van twee betekenissen van ‘mogelijk zijn’. Eenvoudig voorbeeld: we zeggen dat een licht-schakelaar twee mogelijke standen heeft (aan / uit) of dat een bewering twee mogelijke waarheidswaarden heeft (true/false, ook wel: 1 of 0). Dat is de ene betekenis van mogelijk zijn. De andere is deze: als een schakelaar in stand ‘aan’ staat dan is dit kennelijk de enig mogelijke stand; de andere stand is niet mogelijk. Dat is zeg maar fysische of werkelijke mogelijkheid.
Als er iets, een event, gebeurt dan wordt iets dat (kennelijk) mogelijk was ook werkelijk. Daarmee zijn alle andere mogelijke events van het wiskundige kansmodel opgeheven. Die zijn niet meer mogelijk. Dat lijkt mij klontjes. Maar zo denkt de wiskundig aangelegde wetenschapper (en iedere ‘moderne’ wetenschapper heeft een tik van de wiskunde gehad) niet. Die denken niet aan mogelijkheden die werkelijk worden. Worden bestaat niet in de wiskunde.
De wiskundige en de wetenschapper die de wiskundige modellering voor de ideale kennisvorm houdt, berekent na event E gezien te hebben vrolijk P(K)(x|E), de nieuwe kansverdeling van x gegeven E op basis van zijn kansmodel P(K) dat hij ooit gemaakt had vanwege zijn (impliciete) kennis K van het domein.
Hoe logisch is dat? Waarom houdt de wiskundige vast aan zijn oude model? Waarom zegt de wetenschapper niet: ik moet mijn oude model P(K) aanpassen, want ik heb nu informatie I over event E. Die I(E) levert mij nieuwe kennis K: dat wordt K+(I(E) . Dit is een nieuwe kansverdeling P(K+I(E)(x).
In plaats van wat men standaard doet: P(K)(x|E).
Omdat de wetenschapper denkt: informatie is nog geen kennis. Die kennis is meer iets subjectiefs en impliciet. We moeten die nieuwe informatie eerst wegen. (Kijk maar wat de wetenschap voortdurende doet met de Lareb-gegevens van Astrid Kant en andere labs).
Voor Luciano Floridi is de Bar-Hillel-Carnap paradox – ofwel in de woorden van Marion Koopmans: het “The more we know, the less we know” reden om te zeggen; informatie is pas betekenisvolle informatie als het waar is. En daarmee zegt hij eigenlijk: wat jullie nieuwe informatie noemen is pas echte informatie als blijkt waar te zijn wat er gezegd wordt. Helaas weet ook Floridi niet te zeggen wanneer dat is, want dat is een onbereikbaar ideaal.
Alsof onze kennis groeit totdat er niets meer te weten over blijft.
De werkelijkheid zegt niet als een bepaalde event E optreedt dat E mogelijk is, de werkelijkheid toont dat E het geval is. De wiskunde kent echter alleen mogelijkheden en kan niet en het werkelijk worden van iets of de groei van kennis als zodanig modelleren. Alles wat de wiskunde voor waar houdt volgt uit de axioma’s die een keer aangenomen zijn. Feiten zijn niet inhoudelijk onderscheiden van de andere mogelijkheden uit het ‘veld van mogelijkheden’ uit het wiskundig kansmodel.
De praktijk is echter dat we voortdurend nieuwe informatie krijgen waarvan we nog maar moeten afwachten of en wat voor nieuwe kennis het oplevert. Informatie is toetsbaar en dus slechts potentieel waar. We moeten die nog verwerken. Dat gebeurt in een confrontatie met alle reeds voor waar aangenomen informatie en met informatie die we bewaarden maar waar we nog niets mee wisten te doen. De waarheid is het doel van de dialoog tussen de waarheid zoekende wetenschappers.
Naar een unificerende theorie van informatie
De scepsis dat een werkelijk begrip van informatie niet voor de mens is weggelegd, zoals onder andere door Floridi en Mingers uitgesproken, berust op de verwarring van de twee betekenissen van mogelijk die het wiskundige begrip van mogelijkheid uit de kansrekening en statistiek aankleven. Informatie is een begrip dat tot de intersubjectiviteit behoort, niet tot de wiskunde of de fysica.
We zien de verwarring van “denken in het model” met “denken over het model” voortdurend optreden wanneer mensen het hebben over intelligente machines. Alsof de mens zelf als maker van de machine (het model) in de machine zit.
Laten we hopen dat Marion’s wijze tweet: “The less we know the more we know” zo aanleiding is niet alleen de idee van “groei van kennis” maar ook de geschiedenis van de moderne wetenschap te heroverdenken.
Daar is nu de gelegenheid en de tijd voor. Nu de machines het werk doen en het virus ons thuis houdt.
Ik sluit af met een citaat uit Frank Ramsey’s Truth and Probability.
“The degree of belief in p given q is not the same as the degree to which a subject would believe p, if he believed q for certain; for knowledge of q might for psychological reasons profoundly alter his whole system of beliefs.”
In de serie Denken in Tijden van Corona deze keer een briefje aan Kim de Jong
Beste Kim,
Wat een interessant en leerzaam artikel! Het geeft een verrassend overzicht over het onderzoek naar de effecten van positieve feedback als onderdeel van behandelingen in de psychologische klinische praktijk. Ik ga echt niet in op de statistieken want dat vind ik het saaiste wat er is. Ik neem aan dat reviewers van het artikel daar goed naar gekeken hebben. Nee, ik heb een paar andersoortige opmerkingen en vragen die bij het lezen van je artikel bij me opkwamen. Ik heb ongeveer vanaf 1952 met feedback te maken gehad en er ook wel wat over gelezen, maar ik leer er steeds nog weer wat bij.
De eerste vraag is: wat is de rol van de ander? In deze tijden van Corona hoor je dat meer mensen eenzaam zijn omdat ze alleen zijn. Praten mensen die alleen zijn meer met en tegen zichzelf? Kijken ze meer in de spiegel? Van wie krijgen ze feedback?
Ik zie de ander toch als het (ge)weten van je zelf. De ander maakt je bewust zijn. Ik bedoel dat (het besef van) de aanwezigheid van de ander (ook al zegt ie niks) maakt dat je je bewust bent van je eigen aanwezigheid en van wat je doet.
Ik denk dat dat de meest primitieve vorm is van feedback.
Er is immers iets wezenlijks aan de hand wanneer je iemand iets ziet doen. Dat doen wordt opgemerkt en eventueel benoemt als een activiteit waardoor het voor de toeschouwer al niet meer is wat het op zich voor de ander was, namelijk gewoon een bezigheid. Het oog van de ander maakt dus de bezigheid tot een benoemde daad. De volgende stap is dan dat je denkt dat de ander het daar om te doen is, terwijl deze misschien gewoon maar wat deed.
Je artikel verrast me omdat ik me niet kon voorstellen dat er klinische praktijken zijn waarin er geen feedback gegeven wordt. De therapeut doet toch niet zomaar wat. Mag je hopen. Maar misschien haal ik de verschillende impliciete en expliciete vormen van feedback wel door elkaar. Daarmee bedoel ik dit.
Als ik op een toets druk (bij het tikken van deze brief aan jou) dan krijg ik ‘feedback’ van de toets. Dat noem ik zo sinds ik van Norbert Wiener heb gehoord dat dat zo heet. Newton zou zeggen actie = min reactie, wat ik nog op school leerde. Dit is een vorm van feedback. Een meer expliciet vorm is als mijn computer zegt “Wilt u een shortcut definiëren?” (omdat ik kennelijk een bepaalde combinatie van toetsen vaak gebruik). Ik denk dan: verrek ik gebruik kennelijk een bepaalde combinatie van toetsen heel vaak. Wist ik niet. Dat is ook feedback.
Sinds Wiener’s Cybernetica zien we overal feedback in. Verpleegkundigen leerden de zelfzorgmethode van Orem. Dat is een systeemtheorie voor verpleegkundigen waarin feedback ook een belangrijke rol speelt. Ik heb wel onderzoek gedaan naar feedback in coaching systemen op mobieltjes voor jeugdige diabetes patiënten en voor wetenschappers om ze achter het beeldscherm weg te krijgen en meer te bewegen.
Positieve feedback is één van de standaard gereedschappen uit de kist van de makers van Behaviour Change Support Systemen. Jouw artikel gaat daar niet specifiek over. Het leek me meer over het ‘ouderwetse’ (geen pejoratief) handwerk te gaan.
Waarom is de ander zo belangrijk bij feedback? Je ziet toch zelf als therapeut wat je doet aan het effect van je handelen? Dat effect, het gevolg van de behandeling, is toch de feedback. Of vergis ik me? Misschien denk ik te technisch en autistisch, maar die stoommachine met de Watt-regulateur had toch ook geen ander nodig om zichzelf te blijven in zijn interactie met de omgeving en om niet te exploderen.
Of misschien is daar toch de mens als ander van de machine nodig om de zaak in de hand te houden?
Bij het lezen van je artikel realiseerde ik me weer hoe zeer feedback en de cybernetische (zich zelf controlerende) machine te maken heeft met en gebaseerd is op de psychologie van het ontwikkelen van het zelfbewustzijn. En daarmee van de rol van de wetenschap in interactie met de praktijk. Veel mensen beseffen zich niet hoe belangrijk feedback is voor bewustzijn.
De rol van de ander voor en als je (ge)weten van jezelf, dat is toch waar het in de moraliteit van ons leven om gaat. Lijkt me.
Ik snap nu ook dat die cybernetische machine van Wiener (wij zeggen tegenwoordig computer, avatar of robot) door sommige filosofen als de uitwendige objectivatie van het zelfbewustzijn van de moderne autonome mens gezien wordt.
De robot, de kunstmatige intelligentie, de mobiele coaching systemen, houden ons een spiegel voor en geven ons daarmee feedback.
Het is wel begrijpelijk dat Jan Hollak in de cybernetische techniek van de programmeerbare machine de realisatie zag van de Hegelse filosofie van de zelfbewuste geest.
Ik had mij zelf belooft het niet te lang te maken.
Tot slot nog een vraag: wat is de feedback rol van je artikel en in welke systeem?
Nogmaals heel veel dank voor je inspirerende artikel. En nog veel succes met je onderzoek.
Rieks
Het artikel van Kim:
Kim de Jong et al. (2021). Using progress feedback to improve outcomes and reduce drop-out, treatment duration, and deterioration: A multilevel meta-analysis, Clinical Psychology Review. https://doi.org/10.1016/j.cpr.2021.102002
Definitie van waar het over gaat:
“Progress Feedback (sometimes called “client feedback”) refers to the continuous monitoring of client perceptions of benefit throughout therapy and a real-time comparison with an expected treatment response to gauge client progress and signal when change is not occurring as predicted. With this alert, clinicians and clients have an opportunity to shift focus, revisit goals, or alter interventions before deterioration or dropout.” (Barry Duncan, The Partners for Change Outcome Management System.)
“He thought he saw an Argument that proved he was the Pope: He looked again and found it was a Bar of Mottled Soap. “A fact so dread” he faintly said, “extinguishes all hope.”(Lewis Carroll, Alice in Wonderland)
Het praktische probleem
De Minister zegt, namens het RIVM, over de Corona zelftest dat je niet helemaal kunt vertrouwen op de uitkomst van de test. Bij een positieve testuitslag moet je alsnog naar de GGD voor een ‘echte’ PCR test. Bij een negatieve uitslag, zo zegt de Minister, “is de kans dat je toch besmet bent nog 20%”.
Wat moet je hiermee? En dan bedoel ik: wat moet ‘ik’ of ‘jij’ hiermee? Volgens een interpretatie van kans (kans is relatieve frequentie) zou één op de vijf keer dat ik een negatieve testuitslag heb de test er naast zitten en ben ik toch besmet. Maar welke keer? Daar zit ik mooi mee, want ik heb maar één kans, één leven. Ik moet immers nu beslissen wat ik er mee moet. Of, een andere interpretatie: van iedere vijf mensen die een negatieve uitslag krijgen is er een die wel besmet is. Maar ben ik dan die ene? Met zo’n kans-uitspraak sturen de Minister en de Wetenschap (de Statistiek) ons toch maar mooi met een kluitje in het riet!
Een vergelijkbaar probleem heeft Joe opgevoerd in (Dekkers en Mulder, 2020). Joe wil graag een individuele op zijn geval gerichte cardiovasculaire risicoberekening zien. Het beste antwoord dat hij krijgt is dat de kans dat hij binnen 5 jaar een infarct krijgt 5.8 % is. Joe realiseert zich dat het hier om een gemiddelde gaat berekend voor een bepaalde populatie. Ook Joe is niet tevreden:
‘Now I know I’m one of those seventeen identical copies. But why is it not possible to tell me which one of those I am? Why can’t you provide me with a truly individualized risk?’
En als ik me nou niet had getest was dan ook de kans dat ik besmet was 20% ? Of is dat fout redeneren? Het aantal besmettelijke mensen is in Nederland een kleine 200.000 (Het Corona dashboard: 161.000). Dat is lang niet 1 op de 5. Wat is hier mis? Die 20 % false negatives wil zeggen dat van de 100 mensen die getest worden en die wel besmet zijn de test 20 keer zegt dat ze niet besmet zijn. Dat is dus heel wat anders.
De vraag is wat ik moet geloven als ik een negatieve testuitslag krijg waarvan ik weet dat deze niet 100% betrouwbaar is? Het antwoord hangt globaal af van het antwoord op twee vragen. De eerste is: hoe overtuigd ben ik ervan dat ik besmet ben (zonder de testuitslag mee te nemen)? De tweede is: hoe betrouwbaar vind ik de informatie die de testuitslag mij geeft? Kunnen we hiermee de mate van geloof die ik heb dat ik wel of niet besmet ben niet berekenen?
Een andere kwestie is of de uitslag van de test niet zo gegeven kan worden dat deze wat meer op mijn geval toegesneden is?
Wat betekent een kans voor een individu?
De vraag van het individu aan de wetenschapper “maar wat betekent dit voor mij?” brengt de wetenschapper in verlegenheid. Die komt met uitspraken over kansen van verschillende mogelijke ontwikkelingen en oorzaken.
Aristoteles stelde al in zijn Rhetorica dat de wetenschapper geen uitspraken doet over individuele personen. De medische wetenschap, bijvoorbeeld, zegt niets over Socrates. Deze gaat over bepaalde ziektes en symptomen, over abstracte categorieën. De huisarts onderzoekt individuele patiënten. Hij kan op grond van bepaalde symptomen misschien zeggen welke kwaal een patiënt die bij hem komt heeft (is het alleen de leeftijd, of zijn het de genen, een virus, slijtage of is het verbeelding?). De arts heeft met individuele personen te maken. De wetenschapper heeft met de mens en zijn ziektes in het algemeen te maken. Samen met de technicus ontwikkelt deze instrumenten om te meten en instrumenten en medicijnen om eventueel in te grijpen. Die instrumenten werken in principe voor iedereen, omdat ze gebaseerd zijn op algemene eigenschappen waaraan een patiënt voldoet. Daar zit ook een economisch en ecologisch motief: het instrument moet herhaaldelijk toepasbaar zijn. Als het om grote aantallen gaat, om veel mensen, om veel herhaalde toepassingen, dan kun je aan statistiek doen: gemiddelden en variaties berekenen. Dat is nodig omdat niet iedereen hetzelfde is, en omdat er meetfouten gemaakt worden.
Die statistieken zijn leuk voor de wetenschap, de verzekeringsmaatschappijen en voor overheden maar niet voor de individuele burger zoals ik. Om mij te dienen proberen Google en de Belastingdienst mij op grond van een aantal eigenschappen (leeftijd, geslacht, postcode, wat ik gekocht heb) in een bepaalde klasse in te delen. Maar dat gaat soms heel erg fout, weten we uit ervaring. Ook de behandelend arts zit er wel eens naast. Omdat ik nou net niet voldeed aan wat ‘normaal’ wordt gevonden.
Kan het niet anders? Kan de wetenschap niet op een andere manier met onzekerheid rekenen zodat ik, als individuele burger, er in de praktijk ook wat aan heb? Zo’n alternatief lijkt er te zijn.
Hoe bruin wilt u het hebben?
Stel u gaat naar de bakker voor een brood. Stel u houdt niet van wit brood. U wilt een bruin brood. Maar wat is ‘bruin’? Helaas zijn er veel broden die noch echt wit, noch echt bruin zijn. Deze zijn in zekere mate ‘bruin’. U komt bij de bakker en daar staat u voor de keuze. Er staan twee manden met broden. In de ene mand, ik noem hem de kansmand, zitten witte en echt bruine broden, van elke soort evenveel. In de andere mand, ik noem deze de ‘vage mand’, zitten allemaal dezelfde soort broden, die in de mate 0.5 bruin zijn (dat is precies tussen wit en echt bruin in. Een echt bruin brood is bruin in de mate 1, een wit brood is bruin in mate 0). We gaan er vanuit dat u weet wat de bakker onder een bruinig brood 0.5 verstaat. Uit welke mand neemt u een brood? U mag niet in de kansmand kijken wanneer u daar een brood uitneemt.
Neemt u een brood uit de kansmand dan loopt u het risico een wit brood aan te treffen. Maar u kunt ook een bruin brood te pakken hebben. Neemt u een brood uit de vage mand dan bent u er zeker van een brood te hebben, maar dat is slechts bruinig 0.5.
Is het echt een verbetering om met vage maten te werken dan met kansuitspraken? Had de Corona zelftest beter kunnen zeggen: “U bent 0.2 besmettelijk” in plaats van: “U bent positief getest maar er is een kans van 20 % dat dit fout is”. Of maakt het niet uit? Laten we even onder de hoed van de zelftest kijken.
Onder de hoed van de Corona test
Testen zijn nooit 100% betrouwbaar. Je zou zeggen je bent zwanger of je bent het niet, maar ook een zwangerschapstest, die meestal in een vroeg stadium van een vermoedelijke zwangerschap afgenomen wordt, kent valse positieven en valse negatieven. Deze testen meten de aanwezigheid van een speciaal hormoon dat alleen aanwezig is als er sprake is van zwangerschap. Maar ‘zwanger zijn’ is iets anders dan de aanwezigheid van dat hormoon. De aanwezigheid van het hormoon kan ook op iets anders duiden. Vandaar dat er in zeldzame gevallen foute uitslagen zijn. Sommige zelftest geven zelfs een indicatie hoe zeker de meting is. Maar je kunt niet een beetje zwanger zijn. Zo’n indicatie is wel specifiek op de persoon gericht bij wie de test is afgenomen. Kan dat bij de Corona test ook niet?
Op grond waarvan geeft de Corona (zelf)test een negatieve of positieve uitslag?
De PCR-test (polymerase chain reaction-test) toont de aanwezigheid van een stukje genetisch materiaal van het coronavirus SARS-2 aan in neus- en keelslijm. Het is de meest gebruikte en tot nu toe meest betrouwbare test voor het virus. De PCR-test wordt daarom als ‘gouden standaard’ gebruikt om andere testen mee te ijken op hun betrouwbaarheid (Bron: RIVM ). Zoals je een standaard-meter (of modernere standaard lengtemaat) gebruikt om een meetlat mee te ijken.
Bij een virus test wordt het aantal virus-deeltjes in het ‘materiaal’ uit uw neus of keel geteld. Maar hoeveel mogen dat er zijn opdat nog een negatieve uitslag wordt vastgesteld? Is één virus-deeltje al reden voor een positieve uitkomst? De wetenschap legt ergens een grenswaarde x vast. Is het aantal deeltjes kleiner dan x dan is de test negatief. Bij het bepalen van de grenswaarde spelen verschillende overwegingen een rol. Bijvoorbeeld wat zijn de ‘kosten’ van een verkeerde negatieve uitslag. En wat zijn de ‘kosten’ van een verkeerde positieve uitslag? Maar in de eerste plaats hangt deze grenswaarde af van de ervaring met het verloop van het virus; het proces. De grenswaarde is resultaat van een leerproces en wordt dus op grond van nieuwe gegevens eventueel aangepast. Door de ontwikkeling van het virus te volgen kunnen we eerdere metingen interpreteren vanuit een later stadium.
Bij de ‘standaard’ PCR-test van de GGD wordt gekeken hoe vaak het gekweekte materiaal verdubbeld moet worden voordat besloten kan worden dat er een voldoende hoeveelheid erfelijk virus-materiaal in het materiaal aanwezig is, de Cycle-treshold-waarde. Bij een hoge Ct-waarde waren er minder virusdeeltjes in het monster aanwezig, waardoor er veel cycli nodig waren om het virus aan te tonen.
“Aan het begin van de COVID-19 epidemie heeft het RIVM geadviseerd om bij monsters met een Ct-waarde groter dan 30 nauwkeurig te kijken naar het PCR-resultaat. Inmiddels hebben we meer ervaring met de PCR-test voor SARS-CoV-2 en weten we dat de resultaten onder een Ct-waarde van 35 volledig betrouwbaar zijn. Het is dus pas nuttig om bij Ct-waarden van 35 of meer extra nauwkeurig te kijken of er ook een goede S-curve te zien is. Het verschuiven van de waarschuwingswaarde van Ct 30 naar Ct 35 levert niet meer positieve resultaten op, maar scheelt laboranten wel veel tijd.” (Bron: RIVM).
Ook bij deze wijze van meten moet dus altijd ergens een grenswaarde worden gekozen waar er sprake is van een positieve test-uitslag.
De antigeentest toont bepaalde eiwitten van het virus aan in neus- en/of keelslijm. Zo weet je snel of je nu het virus bij je draagt. Er wordt niet gekweekt. De test geeft sneller uitslag dan de PCR test, maar is wel minder gevoelig. Dat is de oorzaak van de vrij hoge waarde van valse negatieven in vergelijking met de PCR-test.
Zo’n test meet dus aanwezigheid van virus-materiaal in het slijm op het moment van de test. Het is, net als de zwangerschapstest, een moment-opname. Omdat de toestand van het lichaam voortdurend verandert kan het zijn dat het materiaal dat afgenomen is bij de test oud is, of nog te weinig virus-deeltjes bevat, omdat de besmetting juist heel recent heeft plaatsgevonden. Dat kan dus tot ‘foute’ uitslagen leiden. Als je twee metingen verricht met een kleine tijd er tussen dan is er altijd een kans op twee verschillende uitslagen. Een andere oorzaak voor een foute testuitslag is een meetfout: er is bijvoorbeeld niet goed met het wattenstaafje gewerkt. Of de testlocatie heeft een administratieve fout gemaakt: de labmedewerker was misschien wel oververmoeid.
In feite hebben we hier ook te maken met vaagheid. besmet zijn is een vage term. De oude Grieken worstelden al met dit soort vage problemen. Hoeveel graankorrels vormen nog een hoop? Drie? Twintig? Honderd? Als je meet wil je iets kwalitatiefs op een kwantitatieve manier, door middel van een getal of met een andere wiskundige structurele grootheid, vastleggen. En dat is lastig omdat de werkelijkheid niet op gaat in zijn meetbaarheid. De werkelijkheid heeft een structuur, maar is het niet.
Kunnen we nu niet beter in plaats van te zeggen: de test is negatief (maar let wel in 20% van de gevallen zitten we er naast) een meer op de individuele persoon gerichte uitspraak doen en zeggen: uw score is 2 (op een schaal van 0 tot 10)?
Dat is lastig omdat er zoveel verschillende oorzaken zijn van de statistische fout. Als het alleen een kwestie was van het aantal Ct-cycles dat nodig was om de besmetting waar te nemen dan zou je in plaats van de uitslag is positief of negatief de Ct-waarde kunnen rapporteren. Maar dat is dus niet de enige onderliggende factor die telt bij het bepalen van de foutmarge.
Bij een foute negatieve testuitslag is de test negatief omdat er misschien nog te weinig virus-materiaal in het slijm op het wattenstaafje zat, terwijl je wel besmet bent. Dat je wel besmet bent weet je dus op grond van andere metingen. Bijvoorbeeld: door de redenering dat als je twee dagen later de ziekte blijkt te hebben dan was je daarvoor waarschijnlijk al besmet. Als je bij een groep mensen die een aantal specifieke COVID-19 symptomen hebben (slechte reuk, keelpijn, hoofdpijn, kortademig) de test afneemt dan is het percentage foute negatieve uitslagen hoger dan bij gezonde mensen.
Om te bepalen of ondanks de negatieve testuitslag iemand toch besmet is en de ziekte heeft moet je dus meer metingen doen. Heeft de persoon andere symptomen die op de ziekte wijzen?
Als ik suikerziekte heb of ‘te zwaar’ ben en ik weet dat mensen die deze eigenschappen hebben een grotere kans hebben ziek te worden nadat ze besmet zijn dan zal ik meer zekerheid willen hebben dan de ene zelftest mij biedt. Maar dat bepaalt niet hoe groot de kans is dat ik besmet ben. Die wordt bijvoorbeeld bepaald door dat mensen in mijn omgeving de ziekte hebben. Of door het feit dat ik andere symptomen van de ziekte heb. Die te samen bepalen mijn a priori geloof dat ik besmet ben, dwz de kans dat ik besmet ben voordat ik de testuitslag krijg.
Met de regel van Bayes’ wordt in de kansrekening nu de a posteriori kans berekend. Op die manier kan ik toch iets met die testuitslag doen. Maar klopt die kanstheorie wel? En hoe kom ik aan die eerste a priori kans?
Vage dingen
In de jaren 80 kwam Lofti Zadeh met een wiskundige theorie en een logica op de proppen om met vage eigenschappen, zoals bruin, kaal, volwassen, besmet, te rekenen en te redeneren. Vage verzamelingenleer en vage logica raakten in zwang. (Er is overigens niets vaags aan beide; het is gewoon harde wiskunde over softe dingen.) Het doel van Zadeh was om de computer te leren om met en over uitspraken in de gewone (natuurlijke) taal te redeneren. Zijn fuzzy logic werd toegepast in controle systemen van apparaten zoals was-machines, maar ook in systemen waarin je met een verzameling van zoektermen kunt zoeken in gegevens-banken.
Sommige mensen waren enthousiast over deze nieuwe theorie om met onzekerheid om te gaan. Anderen vonden het maar niks. Daar was ook wel reden voor. Volgens de normale logica geldt dat als A = B en B = C dan geldt ook A = C. Maar voor vage gelijkheden, zeg maar ‘de lijkt op’ relatie geldt dit niet: als A op B lijkt en B lijkt op C dan hoeft A nog niet op C te lijken. Vage logica’s hebben daar last van.
De fysicus E.T. Jaynes moest er ook niets van hebben. Volgens hem was er maar één logische theorie voor het redeneren en rekenen met onzekerheden en dat is Probability Theory, de klassieke standaard waarschijnlijkheidsrekening, de kansrekening van Pascal. Ook Sir Harold Jeffrey’s en Peter Cheeseman waren die mening toegedaan. Cheeseman baseerde zijn expert- en classificatie-systemen op de Bayesiaanse methodes van de kansrekening. Er ontspon zich een echte schoolstrijd tussen voor- en tegenstanders van de verschillende methodes om met onzekerheid te redeneren, waarin wetenschappers elkaar met argumenten en demonstraties van toepassingen om de oren sloegen. Cheeseman schreef in een mail-uitwisseling dat er met die fuzzyci, de aanhangers van fuzzy logic, niet redelijk meer gepraat kon worden. Wetenschappelijke overtuigingen hebben soms het karakter van een religie.
Mijn interesse voor de Bayesiaanse methode werd gewekt door Jaynes’ Probability Theory. Jaynes was een fanatiek Bayesiaan, een volgeling van Harold Jeffreys, niet te verwarren met de Princeton filosoof R.C. Jeffreys, een ‘afvallige’ die zich volgens Jaynes schuldig maakte aan ‘ad-hoc’ oplossingen.
Hypothese testen – Bayesiaanse wijze
Ik was overtuigd van de mogelijkheden van Jaynes’ direct op de kansrekening van Pascal gebaseerde methode om hypotheses te toetsen. Stel je hebt een zootje gegevens D en je hebt hypotheses H1 en H2. Dan bereken je de kans P(H1|D) en de kans P(H2|D) (de kans dat H1, resp. H2 het geval is gegeven de data D) en je kiest voor die hypothese die de grootste kans heeft. We pasten in ons onderzoek de Bayesiaanse ‘causale’ netwerken methodes van Judea Pearl (2001,2018) toe in onze systemen voor het identificeren van taalhandelingen in dialoog-systemen. De computer kon met zo’n netwerk en de bijbehorende algoritmes berekenen of de spreker met de uiting “U hebt nog bruin brood.” een vraag stelt of een statement maakt. (Ik zet dat ‘causale’ tussen aanhalingstekens want over dat begrip causaliteit van Pearl, daarover is het laatste woord nog niet gesproken.)
Voor echte Bayesianen is Probability Theory (PT) dé enige manier om logisch te redeneren in de experimentele wetenschappen. Voor Jaynes is PT de Logic of Science. Daarin sloot hij zich aan bij geleerden van het caliber Leibniz en Maxwell. Door het lezen van Jaynes’ werk begon ik eindelijk iets van statistiek te snappen.
Wanneer je met de regel van Bayes van Pascals kansrekening rekent heb je een apriori kansverdeling nodig, een zogenaamde ‘prior’. Jaynes heeft een theorie over welke daarvoor te nemen. Jaynes is van oorsprong fysicus, student van Oppenheimer, en de man van het Maximum Entropie Principe. Dit principe zegt dat je bij de keuze van zo’n kansverdeling je moet houden aan de data en díe verdeling moet nemen die de maximale entropie (een soort van onzekerheidsmaat voor kansverdelingen) heeft. Om een heel simpel voorbeeld te nemen. Als je een dobbelsteen met zes kanten hebt en je hebt er helemaal geen kennis van of ervaring mee, dan neem je als prior de uniforme verdeling: de kans op elke uitkomst van een worp met de dobbelsteen is dan 1/6, voor alle gelijk. Deze heeft de maximale entropie. Ik vond het principe van Jaynes zeer plausibel.
Bovendien waren die Bayesiaanse netwerken van Pearl nog inzichtelijk en toepasbaar ook. (Zie mijn blog over causale netwerken.) Ik begreep dan ook niet waarom onze studenten nog steeds lastig werden gevallen met de klassieke statistiek, waarin p-values werden berekend omdat deze iets zouden zeggen over de kans dat een hypothese verworpen moest worden. Volgens deze schoolse methode van de universiteit moest je namelijk P(D|H) berekenen, de kans dat de data gegenereerd wordt als hypothese H het geval is. Hoe onlogisch kun je zijn! Niet H, maar D is immers gegeven! Je moet dus niet P(D|H), maar P(H|D) berekenen, zoals Bayes zei. Geen speld tussen te krijgen. Maar de wiskundige kan zonder enig probleem een hypothese, dat is een wiskundig model, als een gegeven beschouwen dat dezelfde status heeft als de resultaten van metingen. Hij zegt dan: stel dat het model H waar is, hoe groot is dan de kans dat D wordt gemeten.
Ik begon aan een kruistocht om de universiteit vrij te maken van de dwaling. Weg met de p-values! Er moest Bayesiaans geredeneerd worden met onzekerheden. Ook in de rechtszaal want daar was het ook helemaal fout gegaan waardoor bijvoorbeeld de verpleegster Lucia de B. ten onrechte in de gevangenis belandde. Helaas. Het bleek voor veel studenten al knap lastig het verschil tussen P(H|D), de kans dat H geldt, gegeven D en P(D|H), de kans dat D geldt gegeven H uit elkaar te houden. En niet alleen voor studenten. Ook in de rechtszaal worden deze twee al te makkelijk verwisseld: de beruchte Prosecutor’s Fallacy is een hardnekkig fenomeen.
Ik schreef een stukje “What is probability theory about” waarin ik mijn enthousiasme voor Jaynes’ benadering probeerde over te brengen. Men was in Twente niet geïnteresseerd. Op één collega na, met wie ik programmeeronderwijs gaf, hij had een luisterend oor. Maar hij vond Fuzzy Logic veel interessanter dan Bayesiaanse netwerken. Ik probeerde Jaynes’ en Cheeseman’s standpunt te verdedigen. Je kunt, had ik van een Russische wiskundige geleerd (Loginov, 1966), vaagheid definiëren in termen van kansen. Dat is gebaseerd op de gedachte dat de mate waarin een brood bruin is, gezien kan worden als de kans dat iemand in een groep mensen die brood eten, verkopen of bakken, een brood als ‘bruin’ aanmerken. Je vraagt heel veel mensen: is dit brood bruin? Zeggen 60 van de 100 ondervraagden “ja”, dan verklaar je dat brood 0.6 bruin en daarmee 0.4 wit omdat dat het tegengestelde is. Je zegt dan in feite dat iets een bepaalde eigenschap heeft (een brood is bruin), als voldoende mensen zeggen dat het die eigenschap heeft (het brood bruin noemen).
Deze methode hebben we nog eens toegepast om de agreement van beoordelingen van mensen over gedrag van verdachten in politieverhoren te meten (Op den Akker, 2013). Die beoordelingen werden namelijk gedaan door vage labels als ‘vriendelijk’ , ‘aardig’ , ‘meelevend’, ‘dominant’, etc. aan het gedrag op te plakken. Om te berekenen (je bent wiskundige of je bent het niet) of twee beoordelaars het gedrag van een verdachte hetzelfde beoordelen moest er een afstandsmaat tussen de verschillende labels worden gedefinieerd. ‘Vriendelijk’ ligt dichter bij ‘aardig’ dan bij ‘dominant’. Dat deden we met deze kansmaat. Agreement tussen veel beoordelaars moet je meten omdat je de gelabelde data wilt gebruiken om de computer te leren wat ‘vriendelijk’ en wat ‘dominant’ betekent (zie Krippendorff, 2004) . Uit ons onderzoek bleek bijvoorbeeld dat als je de computer leert wat ‘agressief’ gedrag is en je doet dat met door politieagenten beoordeelde trainingsdata je een veel mildere computer krijgt dan wanneer je de computer traint met gegevens die door willekeurige burgers van gedragslabel zijn voorzien. Politiemensen vinden gedrag niet zo snel ‘agressief’ als de gemiddelde burger. Waarschijnlijk omdat ze wel wat gewend zijn. Een machine neemt dus altijd de ‘subjectieve’ beoordeling van mensen over. Dat verklaart het ‘subjective machines’ in de titel van een proefschrift dat over deze materie gaat (Reidsma, 2008).
De collega die van fuzzy logic hield confronteerde mij met een keuzeprobleem zoals dat met de twee manden met ‘bruin’ brood. Waar het mij hier om gaat is de vraag naar het fundamentele verschil tussen die twee wijzen van onzekerheid. Kun je vaagheid reduceren tot kansen en omgekeerd is kans zelf te definiëren zonder vaagheid?
Volgens de methode van de rus Loginov kun je vaagheid van begrippen zoals ‘bruin’ door middel van een enquete over het gebruik van het woord bruin als een kanswaarde definiëren: de kans dat men een brood ‘bruin’ noemt. Hier lijkt echter hetzelfde probleem op te duiken waarmee we begonnen: hoe moet ik een uitspraak die afgeleid is van wat een groep mensen vindt interpreteren?
Immers wie zegt dat ik het eens ben met hoe anderen (‘men’) het woord ‘bruin’ gebruiken? De veronderstelling is dat ik behoor tot een taalgemeenschap waarvan de leden dezelfde begrippen hanteren. Maar misschien heb ik wel een afwijkend kleurbegrip of woordgebruik. Studenten van de Politieacademie gebruikten het woord ‘agressief’ anders dan studenten van de Universiteit Twente. En om terug te komen op het virus: misschien werkt dat bij mij wel net iets anders dan bij al die ‘normale’ Nederlanders, zodat die grenswaarde voor mij de plank mis slaat.
Het probleem
Bij het redeneren over kansen volgens de gangbare kansrekening doet zich een probleem voor wanneer we kansuitspraken willen gebruiken om iets te zeggen over een individueel geval. De keuze van het brood uit de vage mand lijkt je volstrekte zekerheid te bieden over wat je krijgt. Anders dan bij de kansmand. Maar bij de vage mand krijg je nooit iets wat echt bruin is, het is altijd 0.5 bruin. Je zou kunnen zeggen dat volgens de fuzzy theorie de mate van bruinheid in het individuele brood is geobjectiveerd, terwijl het volgens de kanstheorie een eigenschap is van de verzameling van alle broden. Zo kan een fabrikant van een sneltest wel iets algemeens zeggen dat voor de hele samenleving geldt, maar niets over een enkel individu.
Je zou bijna zeggen: de samenleving heeft wel wat aan statistiek, maar de individuele mensen hebben er niets aan.
Dat klinkt als een tegenspraak. De samenleving bestaat immers uit individuen. De fuzzy methode werkt voor zover we ons willen confirmeren aan het ‘normale’ gebruik van de ‘vage’ taal. Ook die werkt dus alleen voor normale mensen en die bestaan al net zo min als gemiddelde mensen.
Er zijn nog andere wiskundige theorieën ontwikkeld om met onzekerheden of plausibiliteit te kunnen rekenen. Wolfgang Spohn ontwikkelde een alternatieve theorie die is gebaseerd op het idee dat informatie zelf al bevat hoe betrouwbaar het is: rank theorie. Zijn theorie is een model voor het verrassingsgehalte van nieuwe informatie. Een rang is een soort inverse van kans: hoe kleiner de kans is dat iets optreedt hoe groter de verrassing is als het optreedt.
Twee wijzen van mogelijkheid
Volgens het begrip kans in de kanstheorie moeten we eerst een ‘veld van mogelijkheden‘ bepalen. Aan iedere mogelijkheid, de uitkomst van een experiment, zoals een worp met een dobbelsteen, wordt dan een kans toegekend. De kans dat die mogelijkheid optreedt. Wanneer een mogelijkheid zich niet kan voordoen dan geven we die de kans 0. Maar waarom zouden we mogelijkheden die zich niet kunnen voordoen in eerste instantie opnemen in ons kansmodel, in de verzameling van mogelijkheden? Omdat we misschien pas later op grond van nieuwe informatie moeten besluiten dat die ‘mogelijkheid’ niet (meer) mogelijk is. De kans P(A) kan groter dan nul zijn maar de kans P(A | B) kan wel nul zijn omdat het gegeven B de mogelijkheid van A uitsluit. Bijvoorbeeld als je ziet dat het regent, dan is de kans dat het niet regent nul. Merk op dat hier sprake is van twee soorten van ‘mogelijkheid’. De eerste soort bepaalt het kansmodel. Het tweede soort bepaalt de kansen in het model. Die twee mogen niet verward worden.
Mogelijk of mogelijk?
Er spelen twee begrippen ‘mogelijk’ een rol die gemakkelijk verward worden. Wanneer een bepaalde gebeurtenis zich voordoet dan is die mogelijk. Je zou hieruit kunnen concluderen dat die gebeurtenis dus ook in de toekomst mogelijk kan optreden. Dat hangt ervan af wat je onder die ‘gebeurtenis’ verstaat. Iedere historische gebeurtenis is immers uniek en kan dus nooit nog een keer optreden. Maar als je deze beschrijft dan hebben we het over een abstract algemene gebeurtenis: “het gooien van een zes met een dobbelsteen”. In de kansrekening zijn dat de mogelijke events van het kansmodel. Als we zeggen dat het feit dat het regent het onmogelijk maakt dat de gebeurtenis ‘het regent niet’ het geval kan zijn, dan hebben we het over fysisch of werkelijk mogelijk. In die zin kan niet zowel “het regent” als “het regent niet” mogelijk zijn. De wiskunde kent geen tijd: in het kansmodel blijven beide logisch mogelijk.
Wanneer we dus op grond van het optreden van een gebeurtenis, nieuwe informatie E, zeggen dat andere gebeurtenissen, zoals niet-E niet meer kunnen optreden en daarom kans nul krijgen, dan is dat iets anders dan wanneer we zeggen dat deze andere gebeurtenissen helemaal nooit meer kunnen optreden. Ze zijn door het optreden van dit event weliswaar nu onmogelijk, maar niet in principe. Het is verwarrend en fout spraakgebruik om te zeggen dat iets dat nu optreedt kans 1 heeft en iets dat nu niet mogelijk is omdat iets anders zich nu voordoet dat dit uitsluit daarom kans 0 heeft.
Kans: frequentie of plausibiliteit?
Het onderscheid tussen de abstract algemene ‘gebeurtenis’ (het event) en de concrete instantie van gebeurtenis, het optreden nu, wordt toegepast wanneer we zeggen dat een zelfde gebeurtenis herhaaldelijk kan optreden. Hierop berust de frequentie betekenis van het logische kans-begrip.
Wiskundig wordt de kans op een bepaalde uitkomst van een experiment gedefinieerd als de limiet (of ratio) van het aantal keren dat deze uitkomst optreedt in verhouding tot het aantal experimenten onder gelijke omstandigheden uitgevoerd. Hier wordt kans dus gedefinieerd met behulp van het vage begrip ‘gelijkheid’ (in de zin van ‘similar’). In de praktijk zullen de experimenten of metingen altijd verschillen. Ze zijn nooit exact gelijk.
Dit kansbegrip en de regels van de kansrekening zijn dus van toepassing in die situaties waarin er in principe sprake is van (oneindig) herhaalbare experimenten in ‘gelijke’ omstandigheden. Bij het gooien met een dobbelsteen mogen we er vanuit gaan dat de dobbelsteen dezelfde blijft en kunnen we afzien van de manier waarop het gooien met de dobbelsteen de uitkomst bepaalt. Het schudden voor het gooien is een vorm van randomiseren: je gelooft dan dat alle mogelijke beginsituaties dezelfde kans van optreden hebben.
Wetenschapper maken modellen en onderscheiden strict het redeneren binnen het model van het redeneren dat nodig is om het model zelf te evalueren. Wetenschappelijke kennis wordt in modellen uitgedrukt. Modellen zijn theorieën, ze staan voor wat we weten over een bepaald domein. Ze zijn het beeld dat de wetenschap van het kennisdomein heeft ontwikkeld. Het nadenken en open zijn over de aannames van je model is nog iets anders dan na te denken over wat je model nu precies modelleert.
Nog een andere kwestie is of je kennis van je model als kennis, dus eigenlijk de kenner die kent, in je model kunt stoppen. Wat je waarneemt (meet of hoort) hangt immers af van het de positie en het perspectief dat je inneemt. Sommige geleerden, zoals Luciano Floridi en Max Tegmark proberen het kennend subject mee te nemen in het model. Ze hebben zo’n model nodig omdat ze zo kunstmatige intelligentie (Floridi’s intelligent agent model) of het universum (Tegmark, zie zijn ‘Our Mathematical Universe’) willen beschrijven.
Het advies Willem Schaafsma
Een profeet vindt zelden gehoor in eigen kring. Enthousiast over de Bayesiaanse aanpak en de methode van Jaynes schreef ik een brief naar Professor Willem Schaafsma, de aimabele statisticus die aan de Universiteit te Groningen de leerstoel van de beroemde Groninger Daniel Bernoulli bezette.
Ik kreeg een met de hand geschreven brief van 12 kantjes terug die hij aanving met ‘Beste collega, Wat een mooie brief!’ Maar verder was het wel duidelijk dat hij vond dat ik een toontje lager moest zingen. Dat ‘gedoe van Jaynes’ was wel aardig maar ik moest me goed realiseren dat het mogelijk is dat die prior van Jaynes in strijd kan zijn met de data. Hij beëindigde de brief met:
“Onderschat die kansrekening en de daarop gebaseerde mathematische statistiek s.v.p. niet. Men probeert daar volstrekt expliciet alle in en outs te specificeren. Maar inderdaad: de statistiek kan niet zonder ‘Deus ex Machina’s’.
Met vriendelijke groet, Willem (ik bel je wel eens).
De Drie Gevangenen: een leerzame denkfout
Ik stuurde hem mijn stukje “What is probability theory about” waarin ik o.a. in ging op het beroemde probleem van de Drie Gevangenen.
Gevangenen A,B en C zitten in hun cellen. Ze weten dat één van de drie zal worden geëxecuteerd, de andere twee worden dan vrijgelaten. Alleen de gouverneur weet wie de ongelukkige is. Gevangene A vraagt de bewaker een gunst: vraagt u de gouverneur wie veroordeeld zal worden en laat dan één van de twee, B of C, weten dat hij vrijgelaten zal worden. De bewaker doet het en komt A later vertellen dat hij B heeft gezegd dat ie vrijgelaten wordt.
Wat is de kans dat A wordt geëxecuteerd gegeven deze nieuwe informatie van de bewaker? Verandert de informatie iets aan het geloof van A?
Er zijn verschillende opties.
Omdat A van te voren al wist dat B of C vrijgelaten zou worden is de informatie dat B het is voor A niet relevant. Zijn kans blijft dus hetzelfde.
Anderzijds: omdat er na het bericht van de bewaker nog slechts twee mogelijkheden zijn (A of C), is de kans dat A het is die geëxecuteerd wordt niet meer 1/3, maar 1/2 .
Volgens Gardner en anderen moeten we Bayes rule toepassen en is het correcte antwoord 1/3. De kansen veranderen niet door de informatie van de bewaker aan A.
Ik was het er niet mee eens.
Ik meende dat wanneer de gevangene in het verhaal nieuwe informatie krijgt van de bewaker hij een nieuw kansmodel zou moeten maken. En met dat model de nieuwe kans dat hij vrijgesproken zal worden kan berekenen. Waarom zou de gevangene dat niet doen? Ik toog naar Groningen waar de professor elke donderdagmiddag een soort van inloop-spreekuur hield. Iedereen kon daar terecht met een statistiekprobleem. Of zo maar, voor een kopje koffie. Daar ontmoette ik ook Dirk Kleima, mijn vroegere docent Informatietheorie, bij toeval. En Casper Alberts die bezig was met zijn promotieonderzoek bij Willem Schaafsma. De professor had Casper mijn stukje gegeven. Hij kende het dilemma van de gevangenen niet, maar vond het wel interessant. Hij besteedt er nog aandacht aan in zijn proefschrift.
De mathematicus probeert “alle ins en outs” expliciet te specificeren, schreef de Professor in zijn brief. Op eenzinnige wijze, klaar en helder. De ‘fout’ in mijn denken over De Drie Gevangenen was precies de verwarring van denken in het model en van buiten het model. Ik dacht: die figuren in de gevangenis die kunnen toch zelf wel nadenken. Maar dat was niet hun rol in de puzzel. Er werd over hen nagedacht en hun kansen waren in de opzet van het probleem al volledig vastgelegd.
Het bleek een leerzame denkfout. De verwarring zit hem erin dat het niet duidelijk is wiens belief-state moet worden aangepast op grond van de nieuwe informatie. Die van de puzzelaar of die van de gevangene A? De puzzelaar moet iets zeggen over de belief-state van A. Niet door zich in hem te verplaatsen maar door hem als een object in een kansmodel te behandelen.
We zouden nu al een voorzichtige conclusie kunnen trekken aangaande het probleem waar we mee begonnen: de betekenis van een kansuitspraak voor een specifiek individu (voor mij). In het kansmodel wordt geabstraheerd van het particuliere. Ieder individu wordt bevroren, een object gevangen in een tijdloze ruimte. We kunnen niet ontkennen dat die objecten beelden van ons zijn, maar we weten ook dat wij het niet zijn. Ons levendig bestaan laat zich niet in een tijdloos wiskundig model vangen. Het leven is het voor het verstand onbegrijpelijke (Hegel). Het mechanistische denken kan niet alle levensverschijnselen verklaren (Rubert Sheldrake).
Informatie, wat is dat?
Wiskunde werd ook wel stelkunde genoemd. Omdat wiskundigen voortdurend allerlei dingen stellen. Stel dit, stel dat, …Om vervolgens te kijken wat uit deze aannames allemaal logischerwijze volgt. Frege heeft lange tijd gedacht dat je de wiskunde dus wel kan reduceren tot logica: hij is de vader van het logicisme. Maar ouder geworden zag hij dat dat niet mogelijk was. De wiskundige moet eerst wat stellen. En dat is niet logisch. Dat heeft iets willekeurigs. De God van Descartes was volstrekt vrij in zijn keuze van de mathematische waarheden. (Gelukkig heeft God het beste met de mensen voor, zodat deze ook voor waar houdt wat waar is: de heldere en klare inzichten zijn onbetwijfelbaar.)
De mathematiek heeft problemen met het beschrijven van verandering, met mogelijkheden die werkelijk worden, met informatie die eerst vaag of onvolledig is en geleidelijk aan steeds duidelijker voor iemand wordt, zoals in een spreekuur, en met het beschrijven van machines die ‘zelf denken’ of modellen maken.
Problemen rijzen wanneer de mathematicus probeert deze zaken op wiskundige wijze te modelleren en daarbij niet heel consequent en rigide aan het onderscheid blijft vast houden tussen het model van buiten af gezien, als gemaakt door de wetenschapper en de kennis die in het model is vastgelegd. Die problemen uiten zich vroeg of laat in paradoxen. In logische tegenspraken, zoals de Russell paradox het gevolg is van de poging het verzameling begrip als verzameling te denken. Of in logisch gevolgen die in strijd zijn met onze intuïtie.
Een voorbeeld van zo’n paradox vond Luciano Floridi, filosoof van de informatie, in de semantische theorie van Bar-Hillel en Carnap. Door hem dan ook de Bar-Hillel-Carnap paradox gedoopt. Ook anderen zoals Mingers en Dretske wezen er op.
Ik meen nu dat de Bar-Hillel-Carnap paradox die voor Luciano Floridi aanleiding was om van informatie te eisen dat deze ware informatie moet zijn om informatie te zijn gevolg is van de verwarring tussen de manier waarop over onzekerheid wordt gedacht.
Het belang van het inzicht in deze paradox moet niet onderschat worden. Om tot een oplossing te komen vond Floridi een uitweg. Die komt neer op de these van de sterke semantische informatie: informatie is alleen informatie als het waar is.
Deze these lijkt in strijd met het gewone gebruik van ‘informatie’. Wanneer de virologe Marion Koopmans zegt: “The more we know, the less we know.” dan drukt ze daarmee uit dat nieuwe informatie aanleiding kan zijn onze kennis te heroverwegen. Passen we ons kansmodel aan of blijven we binnen het model opnieuw a posteriori kansen berekenen? We gaan er niet zonder meer vanuit dat de informatie die we krijgen klopt. Maar we beschouwen het wel als informatie.
Ik vind dat een universele theorie van informatie het volksgebruik van het woord ‘informatie’ moet respecteren. In het gebruik van de woorden immers komt het begrip zoals dat in een cultuur leeft tot uitdrukking en een theorie moet daarbij aansluiten.
Dat er verschillende betekenissen en gebruiken zijn van het woord ‘informatie’ is bekend. Shannon (van Shannon en Weaver’s The Mathematical Theory of Communication; zie mijn blog Het Kanaal) had het ook over informatie, maar het interesseerde hem niet in het minst wat de mensen zeiden of bedoelden die een bericht over zijn communicatiekanaal stuurden. Wat hem betreft zeiden ze “Het brood is wit en het brood is niet wit”. Hij codeerde het en stuurde het bericht het kanaal in. Wat hij deed was kansen berekenen. Hoe vaker een bericht voorkomt, des te korter werd de code voor dat bericht. Zo kun je maximaal gebruik maken van de breedte (capaciteit) van het kanaal. Hij hoefde immers niets met het bericht te doen dan ervoor te zorgen dat het op een efficiënte manier aan de ander kant van het kanaal ontvangen werd en weer gedecodeerd kon worden.
Bar-Hillel en Carnap waren wel geïnteresseerd in de betekenis van het bericht. Ook zij hadden ‘een tik van de wiskundige molen gehad’ en ze probeerden dus een wiskundig model te maken van de inhoud van de beweringen die mensen over het kanaal stuurden. Dat werd een ‘belief-update model‘.
Het idee van zo’n model is zo oud als Laplace. En je vindt het ook terug bij Jaynes. Als je nieuwe gegevens of informatie (dat werd niet onderscheiden) binnen krijgt dan verandert je geloof. De terminologie is Engels: ‘belief’ heeft niets met geloof in de zin van religie te maken, maar met iets wat we bedoelen als we zeggen “ik geloof/denk dat het morgen gaat regenen“.
De geleerden (epistemologen en doxastici) zeggen dat we aan zo’n geloof, dat we dus in een bewering (zoals “het regent”) kunnen uitdrukken, een mate van vertrouwen of plausibiliteit toekennen (Sommigen beweren dat we dat doen; anderen zeggen dat we kunnen doen alsof we dat doen.) De hoeveelheid informatie die een bericht bevat kunnen we nu meten door te kijken hoeveel onze ‘geloofstoestand’, weergegeven door een heel stel beweringen over de wereld met daarbij de mate van geloof erin, door de nieuwe informatie verandert. De mate van geloof in de dingen die je gelooft verandert dus door de nieuwe informatie. Als je een bericht binnen krijgt met informatie die je al had, dan is de informatie-inhoud ervan voor jouw nul, want er verandert niets aan je geloofstoestand.
Die mate van geloof (plausibility van uitspraken) voldoet volgens sommigen aan de kanstheorie van Pascal.
Dat wil onder andere zeggen dat de mate van geloof dat het regent plus de mate van geloof dat het niet regent samen 1 is. Men spreekt van een ‘subjectieve’ kans die de plausibiliteit van een geloofsinhoud, een bewering, aangeeft. Dit is zeer breed aanvaarde wetenschappelijke formele kennis-theorie. De additieve wet van de kansrekening zegt dat de kans dat iets bepaalds (een ‘event’) optreedt plus de kans dat dat iets niet optreedt samen altijd 1 is. Dat komt overeen met de klassieke logica die zegt dat als een bewering waar is dan is hij niet niet waar en omgekeerd.
Als we ons geloof dat het regent uitdrukken zeggen we: “Het regent”. We zeggen niet: “De oordeelszin “het regent” Is waar”. We zeggen ook niet “ik geloof dat het regent”. Als we iets geloven dan geloven we ook dat dat waar is en als we zeggen dat het regent dan menen we en bedoelen we ook meestal dat het regent. Ook al kan aan dat laatste soms getwijfeld worden. Vooral als het om een ander gaat die dat zegt. Niet omdat we denken dat er bewust gelogen wordt, maar omdat het vaak niet duidelijk is waarom het waar is, en wat het precies betekent. Het strikte scheiden van een zin en de waarheidswaarde ervan of van de zin als inhoud van een geloofstoestand of als iets dat beweerd wordt dat is allemaal verstandelijk gedoe. Dit gedoe doet de werkelijkheid soms nogal geweld aan.
Informatie berust op wat gegeven is
Uiteindelijk berust informatie op de onbetwijfelbare onmiddellijke zintuiglijke ervaring; op de beleving dat “het regent”. Daarin kennen we een zekerheid die niet het gevolg is van een conclusie. Het ervaren feit, het hier en nu gegeven, is onmiddellijke oorzaak van het geloof.
Als in de werkelijkheid iets gebeurt, zeg event A, dan kunnen we dat op verschillende manieren opvatten: als een teken of als een feit.
Is A een feit dan kun je concluderen dat A mogelijk is en dus vaker kan optreden. Je neemt dan aan dat wanneer (ongeveer) gelijke omstandigheden zich weer voordoen hetzelfde wel weer zal gebeuren. Wordt A opgevat als een teken dan moet je eerst bepalen wat het precies betekent. In de moderne natuurwetenschap wordt A opgevat als verschijnsel van een wetmatigheid, niet als een teken dat uiting is van een eigen bedoeling van de natuur.
De relatie tussen kans en informatie
De intuïtie over kans van optreden van een bericht en informatieinhoud ervan wordt uitgedrukt in een these: de “Inverse Probability Thesis”. Deze zegt “Hoe kleiner de kans dat een bericht optreedt des te groter is de informatie-inhoud van het bericht voor degene die het bericht ontvangt.”. Deze leidt echter tot de conclusie dat een bericht met de tegenstrijdige inhoud “Het brood is wit en het brood is niet wit” maximale informatie-inhoud heeft omdat het alle werelden die je op grond van je geloof voor mogelijk hield onmogelijk verklaart. Maar wat de bewering beweert heeft kans nul, omdat hij een onmogelijkheid uitdrukt. Daarentegen heeft de ware bewering “Het brood is wit of niet wit” geen informatie-inhoud want dit is trivialiter waar. Deze bewering heeft een kans 1: hij is altijd waar.
We zien hier dat onwaar en waar als grenswaarden van de kansgrootte worden gezien. Maar logisch waar of logisch onwaar zijn begrippen van een andere categorie dan de empirische categorie waarop het begrip kans betrekking heeft. We zien hier een verschil tussen de modellering van de “vage onzekerheid” en de “kans onzekerheid”. Bij de vage onzekerheid kunnen de grenswaarden 0 en 1 gezien worden als grenswaarden van dezelfde categorie. Wit en zwart zijn symmetrische tegenpolen: wat wit is in mate 1.0 is zwart in mate 0.0 en omgekeerd. Maar waarheid en onwaarheid van een oordeel zijn geen symmetrische begrippen. In die zin dat als een bewering beweerd wordt dan is deze ook waar. Als ik zeg “het regent” dan bedoel ik ook dat dat zo is. Het beweren houdt de waarheid van de bewering in. Pas wanneer we een formeel onderscheid maken tussen de bewering als het produceren van een oordeelszin en de oordeelszin op zich genomen dan pas verschijnt het onwaar zijn als een waarheidswaarde die aan de zin wordt toegekend. Maar dan gaat het niet meer over wat de zin beweert maar over het optreden van de zin als een talig object. Wie zal serieus beweren: “Het regent en het regent niet”? Zo’n bewering valt buiten de orde van elk redelijk gesprek.
De oorzaak van de Bar-Hillel-Cantor paradox is dus het niet goed onderscheiden tussen het voorkomen of produceren van de zin als iets uitwendigs en het beweren door middel van het uiten van de zin.
Frege voerde in zijn Begriffschrift de ‘Urteilsstrich’ (het symbool I– ) in omdat de bewering p als talig object niet beweerd wordt.
Dit onderscheid tussen de geuite zin en de bewering die de waarheid van de beweerde zin inhoudt is precies waar het omgaat als we ware en onware informatie willen onderscheiden. Maar van buiten kunnen we aan de uiting niet zien of deze ware of onware informatie bevat.
“Ein Satz kan unmöglich von sichselbst aussagen, dass er wahr ist”. (Wittgenstein Tractatus, 4.442)
Een zin kan niet van zichzelf zeggen of deze waar is.
en:
“Kein Satz kann etwas über sichselbst aussagen, weil das Satzzeichen nicht in sichselbst enthalten sein kann.” (Wittgenstein, Tractatus, 3.332)
Zinnen als “dit is (on)waar” of “het is (on)waar dat p” of “X is (on)waar” die expliciet de (on)waarheid van een zin proberen uit te drukken leiden aan hetzelfde tekort als de zin zelf. Althans wanneer we dit zo opvatten dat ‘dit’ of ‘p’ of ‘X’verwijst naar de hele zin waarover het gaat. In “X is onwaar” zouden we voor X dan ook de hele zin, inclusief X moeten substitueren. Maar zo raken we die X niet kwijt.
Het is als met de toepassing van de conditionele regel Modus Ponens: Als A dan B. De conditie waaronder deze toegepast wordt blijft altijd impliciet, voorondersteld. Door p te ‘zeggen’, dat wil zeggen: te stellen, wordt de betekenis ervan uitgevoerd.
In het gebruik van de regel toont zich een inzicht dat juist niet expliciet in de regel wordt uitgedrukt. De uitvoering van een programma, een serie regels, door een computer gebeurt volgens een ander computerprogramma. Uiteindelijk door een fysisch proces dat juist niet expliciet als programma is uitgedrukt. Het rekenproces is en blijft ook een fysisch proces. Dat dit fysisch proces als rekenproces wordt opgevat is niet iets dat in de machine zelf expliciet is uitgedrukt. Dit is wat Wittgenstein het logische, onzegbare noemt, dat wat verheven is boven de sfeer van het zegbare.
Zelfreflexiviteit is onmogelijk. De uitdrukking maakt er altijd wat anders van. Wat impliciet is kan niet anders dan impliciet blijven. De ogen die zien kunnen we niet zien.
Ook een machine kan niet zeggen of deze de waarheid spreekt. Of informatie waar is, is iets dat in interactie overeengekomen moet worden. De basis voor informatie bestaat uit de gegevens. Dat zijn de inhouden van de onmiddellijke, zintuiglijke ervaringen. Deze kunnen we niet ontkennen zonder ons zelf te ontkennen. De gegevens zijn de blote feiten.
Over intelligente machines
In Floridi & Sanders (2004) wordt een poging gedaan om de vraag of een technisch systeem een ‘morele agent’ is te preciseren. Pas dan kunnen we het immers eens worden over een antwoord op deze vraag. F&S definiëren daartoe deze agenten op een wiskundige manier als een transitiesysteem. Zo’n systeem is op ieder moment in een bepaalde toestand. Die toestand bestaat op zich weer uit deeltoestanden.
Opdat zo’n systeem een autonoom genoemd kan worden moet deze in zekere zin uit ‘zichzelf’ kunnen acteren. Daarom bevat een deel van de toestand (‘het geheugen’) het programma van de agent. Dat zijn de actuele transitieregels die de toestandsverandering van het systeem bepalen/beschrijven. F&S spreken van een ‘cognitive trick’. Deze ‘trick’ berust echter op een verwarring: de beschrijving van het systeem wordt als onderdeel van het systeem zelf gezien. Variabelen waarmee de verandering van het systeem beschreven wordt krijgen ook een functie in het systeem zelf. ‘Observables’ zijn variabelen waarvan de waarden door het systeem geproduceerd worden en die tevens de functie hebben om de werking van het systeem te beschrijven. De verwarring is dat het systeem en de beschrijving van het systeem naast elkaar worden gezien. Maar de regels die ervoor zorgen dat het systeem werkt zoals in het programma-deel van de toestand staat zijn juist niet als onderdeel van het systeem in het programma opgeslagen. Die regels zijn juist geïmplementeerd in de materiële constructie (de hardware) van het systeem.
De Urteilsstrich van Frege’s Begriffschrift is juist niet een deel van de bewering. Zo zijn de regels volgens welke de machine werkt juist niet een deel van het programma dat de machine uitvoert. Op dezelfde wijze zegt P( A | H ) = 1 dat A in het kansmodel de kans 1 heeft om waar te zijn, wat een bewering in een andere taal is dan de taal waarin we zeggen dat de bewering A waar is.
Taal en Taalmodel
Een zelfde verwarring van model en werkelijkheid ligt op de loer wanneer we een formele grammatica en een lexicon hebben opgesteld die de ‘natuurlijke taal’, de echte taal die wij gebruiken, modelleert. Zo’n formele taal is een wiskundig object, een verzameling van ‘zinnen’, dat zijn rijtjes ‘woorden’ uit het lexicon van de formele taal. De formele grammatica specificeert wat precies de goed-gevormde zinnen van de taal zijn. Het is een systeem dat gebruikt kan worden om zinnen, rijtjes woorden, te genereren. Voor de constanten van het model die staan voor de woorden die in de formele taal voorkomen kiezen we (meestal) de woorden uit de echte taal waarvoor ze staan. Dus het woord ‘brood’ in de formele taal, het wiskundig model, staat voor het woord ‘brood’ in onze echte taal. Het is een ‘identifier’ waarmee het wiskundig object dat model staat voor het woord door ons wordt aangeduid. Zoals we cijfers gebruiken als ‘namen'(tekens) voor getallen, de eigenlijke wiskundige objecten.
Bij het tekstverwerken verschijnen de representaties van de woorden op het beeldscherm. Maar deze twee zijn daarmee nog niet gelijk. De constante term ‘brood’ in het model is weliswaar in zekere zin inhoudelijk (‘materialiter’) identiek aan het woord ‘brood’ in de taal die wij gebruiken, maar is er formeel van onderscheiden. De machine kan een rijtje woorden produceren (‘schrijven’ of ‘uitspreken’) maar dat is een model van het zeggen dat wij doen als we ‘een zin uitspreken’.
Wie het taalmodel voor de echte taal houdt en het produceren van een zin voor het zeggen houdt, die beschouwt de mens als een machine of de machine als een mens. In beide gevallen wordt het formele en het materiële aspect niet onderscheiden. De formele identiteit, het wiskundige conceptuele model, de structuur van de machine, wordt tot de zelfde werkelijkheid gerekend als de machine die er door beschreven wordt. Wiskundige objectiviteit en fysische objectiviteit worden vereenzelvigd. Daarmee wordt betekenen en refereren een relatie tussen gelijksoortige entiteiten. Bij kennis is er net als bij taal echter wezenlijk sprake van zowel een identiteit als van een onderscheid. In de kennis is het gekende aanwezig op de wijze van gekend te zijn. Kenbeeld en werkelijkheid zijn in het kennen zowel identiek als onderscheiden. De machine is machine voor de mens die deze als machine ziet. Ze is objectivatie van een denkconstructie, waarbij gebruik gemaakt wordt van de wetten van de natuur.
Je zou kunnen zeggen dat de intelligente machine juist gebruik maakt van de verwarring. De ontwerper heeft er met opzet voor gekozen om voor de identifiers van de observeerbare entiteiten van de interface (het beeldscherm) die tekens te nemen die lijken op de woorden van de taal van de gebruiker. Zo heeft het er alle schijn van dat de machine de taal van de gebruiker spreekt of schrijft. Maar dat is slechts schijn, pure buitenkant.
Een Universele Theorie van Informatie
Vanwege de Bar-Hillel-Carnap paradox kozen Floridi en ook Mingers ervoor dat semantische informatie waarheid moet inhouden (de ‘Veridicality Thesis’): informatie is ware informatie. Waarom is dit onbevredigend?
Een Universele Theorie van Informatie als uitdrukking van ons begrip van informatie moet zowel aansluiten bij het dagelijkse gebruik van de term als bij het gebruik in de verschillende wetenschappen. Verschillende mensen, waaronder Shannon en Floridi, hebben hun scepsis geuit dat zo’n theorie er zal komen. Er worden soms drie ‘soorten’ informatie onderscheiden: syntactisch (Shannon), semantisch (betekenis) en pragmatisch (gebruik/effect). Maar er is nog geen theorie die ze alle drie in verband brengt. Dit is hoogst onbevredigend. Het duidt erop dat we nog niet goed begrijpen wat informatie is. Terwijl in het ICT tijdperk alles zo’n beetje om ‘informatie’ draait.
De weg naar een oplossing
De ‘cognitive trick’ die Floridi en Sanders nodig hebben om een agent op wiskundige wijze als een transitiesysteem te beschrijven is dat ze de beschrijving van het model van de agent/het systeem en de beschrijving van de veranderingen van het systeem het programma van de machine door elkaar halen. Dat komt omdat de geprogrammeerde machine als onderdeel zijn eigen programma bevat. Als je dat een beetje sloppy formuleert dan zeg je dat een toestand van het systeem de functie bevat die zegt hoe het systeem van toestand moet veranderen wanneer het ‘zich’ in deze toestand bevindt. Maar zo werkt het niet.
Als een machine werkt dan voert het voor ons weliswaar een programma uit maar hij doet dat niet volgens dat programma, maar volgens een ander programma. Als je een wasmachine geprogrammeerd hebt door de gewenste instellingen met de diverse knoppen op de interface te kiezen en daarna op de start knop drukt, dan start je niet de wasmachine zelf op. Die moet immers al werken. Je start het programma op. Het starten van het programma is iets van binnen het model. Het aansluiten en programmeren is iets van buiten het model.
De ‘cognitive trick’ van Floridi en Sanders verwijst naar het principe van de informatietechnologie. Deze maakt immers gebruik van de correspondentie tussen denkinhouden en natuurprocessen (zoals door Heinrich Hertz in zijn Prinzipien der Mechanik aangegeven). Door een structurele overeenkomst tussen denkregels en natuurregels worden de laatste gebruikt om het denken te simuleren. Voor ons is de logische schakeling een logische schakeling, zoals voor ons de wiskundige namen staan voor getallen, of andere wiskundige objecten.
De paradox van Bar-Hillel en Carnap berust op een vergelijkbare verwarring tussen binnen en buiten het model. De bewering als zin en de bewering als bewering over een werkelijkheid zijn twee verschillende aspecten van de werkelijkheid van het informatie begrip. Het is een vorm van solipsisme te doen alsof je het over ware informatie kunt hebben als een objectief ding, iets dat je kunt verzenden.
De zin “Deze zin is waar” lijkt wel iets te zeggen, maar de zin waarnaar deze verwijst is slecht de zin als object waarnaar “van buiten af” verwezen wordt en dat is juist niet de zin die wordt uitgesproken. Zou dat wel het geval zijn dan zou de zin “Deze zin is niet waar.” een logische paradox zijn en dus niet kunnen bestaan.
Informatie en kennis en communicatie behoren tot het domein van de intersubjectiviteit niet tot dat van de wiskunde en de machines. We moeten dus om informatie te snappen uitgaan van de intersubjectiviteit en niet zoals we nu steeds doen uitgaan van geïsoleerde subjecten. Alsof communicatie iets is dat gemaakt kan worden uit twee van elkaar gescheiden gedachte subjecten.
Een subject is altijd subject voor een ander subject: de kern ervan is de intersubjectiviteit.
Tot slot
Het klinkt zo logisch en triviaal: je moet het model niet met de werkelijkheid verwarren. En toch trappen we er steeds weer in. We vergeten dat de machine zoals we die zien een beeld is van de machine, en dat werkelijkheid zoals we die beschrijven niet de werkelijkheid zelf is, maar een beeld ervan. De verwarring ligt op de loer wanneer we beeld en maker van beeld allebei afbeelden. Het objectiveren van het wiskundig redeneren in de computer nodigt tot deze verwarring uit: de maker van het beeld als maker in de machine te denken.
In “De poging tot het onmogelijke” heeft Magritte dit idee verbeeld. De schilder in de afbeelding is net als de vrouw geschilderd en toch wekt het beeld de indruk van een verschil tussen de schilder en het geschilderde object. Anderzijds krijgt de geschilderde vrouw de status van de schilder die haar schildert. Voor zover we ons als kijker identificeren met de schilder in zoverre komt de vrouw tot leven.
Niet alleen gaat de wetenschap zoals Aristoteles al opmerkte niet over een bepaald individu, ook wordt kennis tegenwoordig opgevat als iets dat geabstraheerd is van de individuele persoon die de kenner is. Kennis is gedesubjectiveerde kennis. Ik zou deze vorm van kennis informatie noemen en de kennis die integraal deel is van de persoon kennis. Informatie is wat je deelt en wat in gesprekken tot stand komt en verbeterd wordt. Kennis is wat je zelf weet of gelooft.
Ik denk dat het niet toevallig is dat Floridi bij zijn onderzoek naar een formele logica voor het redeneren over beweringen als “agent a heeft informatie x” tot een modale logica komt die equivalent is met een kennis logica. Zijn uitgangspunt is dat informatie waar moet zijn. Maar wat waar is dat komt in een dialoog naar voren. Informatie is immers het voorlopig resultaat van een meting of een vraag die wanneer beide partijen het eens zijn over de betekenis en de mogelijke antwoorden erop ook een meting is. Informatie in de volle zin van het woord bestaat voor degenen die betrokken zijn in een interaktief proces van kennisverwerving en informatie-uitwisseling. Buiten dat proces kan er geen sprake zijn van waarheid of ware informatie. De idee dat kennis waarachtig geloof is getuigd van een opvatting van een buitenstaander die kan beoordelen wat waar. Maar zodra deze buitenstaander zo’n oordeel uitspreekt is hij geen buitenstaander meer.
Mijn kennis is mijn persoonlijk eigendom; ontwikkeld in mijn contacten met anderen, met mensen zoals mijn ex-collega’s van de UT en met Professor Schaafsma. Die kennis is een persoonlijk vermogen ontwikkeld door eigen ervaring en als zodanig ondeelbaar, anders dan informatie, de uitwendige kennis die deelbaar is. Google en de Belastingdienst mogen nog zoveel informatie over mij hebben, mij kennen is iets anders.
Wat heb je nu aan statistische uitspraken als je die op een enkel bijzonder geval, op je zelf, op die ene keuze die je moet maken in dat ene leven dat je hebt, wil toepassen? Het hangt ervan af hoeveel informatie die op dit geval betrekking heeft is meegenomen in het kansmodel. En omdat dat altijd beperkt is blijft het een kwestie van God zegen de greep oftewel zoals Willem Schaafsma schreef in zijn brief, van een “Deus ex machina”.
In een recent artikel When will individuals meet their personalized probabilities? A philosophical note on risk prediction verdedigen de epidemioloog Olaf Dekkers en de filosoof Jesse Mulder (2020) de stelling dat perfecte voorspellingen op het niveau van het individu om principiële redenen zullen falen. De vraag die de auteurs stellen is of een mechanistische benadering in de biologie wel recht doet aan wat er gebeurt in levende werkelijkheid. Een sleutelbegrip in hun filosofische analyse van de biologie is de notie van proces. Deze heeft een open karakter, in tegenstelling tot de gesloten technische niet-levende systemen. Het meten van fysiologische variabelen alleen is niet voldoende om de dynamische processen in levende organismes volledig vast te leggen. Door meer persoonlijke gegevens mee te nemen kunnen soms weliswaar betere voorspellingen worden gedaan, maar er is een principiële grens aan de voorspelling op het individuele niveau.
Het uiten van voorspellingen omtrent de ontwikkeling van processen vanwege de betekenis die deze hebben voor het individu op wie ze betrekking hebben kan van invloed zijn op het verloop van die processen zelf. Dat is een typisch kenmerk van het open systeem dat het menselijke leven is. Dit lijkt wel op de situatie in het probleem van De Drie Gevangenen. Alleen nu gaat het om echte levende individuen die zich niet laten vangen in een gesloten wiskundig model.
Over de rol van de metafysica
Statistiek is kenmerkend voor de rationele mathematiserende wetenschap. “Het is niet rationeel de wetenschappelijke denkvorm als enige gestalte van rationaliteit te zien.” Misschien zijn bovenstaande beschouwingen over de plaats van het individu als object van wetenschap wel uitdrukking van deze intuïtie uitgesproken door de filosoof Ottho Heldring (Heldring 1995). In zijn artikel gaat het om “de wetenschap als historische gestalte van rationeel-empirisch nadenken over de realiteit.” De kern hiervan vormt het streven naar geldigheid. Het gaat Heldring om de rol van het individu als kennend subject van de wetenschap, terwijl het hier gaat om het individu als object van wetenschap. Dat object is echter tevens subject. De mens wil noch als subject, noch als object van wetenschap gevangen zijn in de feitelijke historische gestaltes die de huidige wetenschap aanneemt. En toch moet hij het er mee doen, zolang als hij leeft. De rol van de metafysica is volgens Heldring onze individuele vrijheid ten opzichte van de wetenschap te verhelderen. In die zin kunnen mijn beschouwingen gezien worden als een poging tot ‘existentiële situering’ van de wetenschap.
In de toepassing van de resultaten van wetenschap komt de mens zichzelf tegen zoals deze door de rationele wetenschap is gemodelleerd. Als levend wezen herkent hij zich niet in de statistische en mechanistische modellen die niet bij machte zijn de mens als levend organisme, als historisch zich ontwikkelend proces te begrijpen. Begrip van het leven vraagt om een herziening van de noties causaliteit en proces (Dupré 2013). Zo’n herziening zal niet volledig zijn zonder daarbij de eigen waarde van het kennen als onderdeel van het leven kritisch te heroverwegen.
Bronnen
Aristoteles. Rhetoric. The Internet Classic Archives.
“But none of the arts theorize about individual cases. Medicine, for instance, does not theorize about what will help to cure Socrates or Callias, but only about what will help to cure any or all of a given class of patients: this alone is business: individual cases are so infinitely various that no systematic knowledge of them is possible.”
Rudolf Carnap and Bar-Hillel, Yehoshua (1952). An Outline of a Theory of Semantic Information. Cambridge: Research Laboratory of Electronics, MIT.
Peter Cheeseman (1985). In defense of probability theory. IJCAI’85: Proceedings of the 9th international joint conference on Artificial intelligence – Volume 2, August 1985, Pages 1002–1009. “Probability theory is all that is needed“.
Olaf M. Dekkers en Jesse M. Mulder (2020). When will individuals meet their personalized probabilities? A philosophical note on risk prediction. Eur J Epidemiol. 2020 Dec;35(12):1115-1121.
John Dupré (2013). Living causes. Proceedings of the Aristotelian Society, Supplementary Volumes, Vol. 87 (2013), pp. 19-37.
“What are stable and robust in biology are not things but processes.” De vraag is echter wat een proces is. Zijn er ook niet-levende processen?
Ottho G. Heldring (1995). Wetenschap, filosofische hermeneutiek, metafysica. In: Tijdschrift voor Filosofie, juni 1995, pp. 250-266.
Simon Keizer, Rieks op den Akker, Anton Nijholt (2002). Dialogue act recognition with Bayesian networks for Dutch dialogues. Proceedings of the Third SIGdial Workshop on Discourse and Dialogue, 88-94. Eén van de eerste papers waarin Bayesiaanse netwerken gebruikt worden voor dialoog-handeling-herkenning.
Judea Pearl & Dana Mackenzie (2018). The Book of Why : the new science of cause and effect. New York: Basic Books.
Judea Pearl (2001), Causality: models, reasoning and inference. Cambridge University Press, Revised edition, 2001.
Dennis Reidsma (2008). Annotations and Subjective Machines: Of Annotators, Embodied Agents, Users, and Other Humans, PhD thesis, Universiteit Twente.
Rieks op den Akker, Merijn Bruijnes, Rifka Peters, Teun Krikke (2013). Interpersonal stance in police interviews: content analysis, Computational linguistics in the Netherlands journal 3, 193-216, 2013.
E.T. Jaynes (2003). Probability Theory: the logic of science. Cambridge University Press.
Krippendorff, K. (2004), Reliability in content analysis: Some common misconceptions and recommendations, Human Communication Research 30(3), pp. 411–433.
Luciano Floridi, Sanders, J. (2004). On the Morality of Artificial Agents. Minds and Machines14, 349–379 (2004).
Luciano Floridi (2006). The Logic of Being Informed. Logique & Analyse 196 (2006)
Luciano Floridi (2008). The Method of Levels of Abstraction. Minds & Machines 18, 303–329 (2008).
Luciano Floridi (2010). The Philosophy of Information as a Conceptual Framework. Know Techn Pol 23, 253–281 (2010).
Luciano Floridi (2003). On the intrinsic value of information objects and the infosphere. In: Ethics and Information Technology, volume 4, pages 287–304(2002)
Luciano Floridi (ed.) (2016). The Routledge Handbook of the Philosophy of Information.
Loginov, V.I. (1966). Probability treatment of Zadeh membership functions and their use in pattern recognition, Engineering Cybernetics pp. 68–69.
John Mingers (2013). Prefiguring Floridi’s Theory of Semantic Information. tripleC 11(2): 388-401, 2013.
Wolfgang Spohn (2009). A Survey of Ranking Theory. In: F. Huber, C. Schmidt-Petri (eds.), Degrees of Belief, Synthese Library 342, 2009.