Over de onbegrijpelijkheid van het feit en waarom informatie niet bestaat

Informatie bestaat niet

Er zijn twee redenen waarom deze uitspraak iets zegt. De eerste reden is dat het ook niet waar kan zijn en daarmee bedoel ik dat informatie wel bestaat. De tweede reden waarom deze uitspraak iets zegt is dat er mensen zijn die beweerd hebben dat informatie bestaat, het tegendeel van wat ik hier wil verantwoorden.

Ik zeg dit vanwege het volgende.

Het is volgens de informatie-theorie gebruikelijk te zeggen dat de hoeveelheid informatie die een bericht bevat bepaald wordt tegen de achtergrond van het aantal mogelijke alternatieven. Zo berekenen we de gewenste capaciteit van het communicatiekanaal dat aan een zekere snelheid moet voldoen op basis van het aantal mogelijke berichten dat de gebruikers ervan over het kanaal willen versturen.

Shannon was als communicatie-ingenieur evenmin geïnteresseerd in de inhoud van de berichten als de statistici van het RIVM zijn in de uitslag van mijn PCR-test. Ik haal dat erbij omdat ik (en niet alleen ik) als individu die zo’n test-uitslag krijgt met daarbij de disclaimer dat een test nooit helemaal 100% betrouwbaar is en dat ook bij een negatieve uitslag er geen garantie is dat ik niet besmet ben met het corona virus ook niet weet wat ik aan zo’n statistiek heb. De vraag die zich dan immers voor doet is: wat betekent zo’n statistische uitspraak voor mij, als een feitelijk een unicum, met een bepaalde lengte en een bepaald gewicht, en andere bepaalde relevante fysische constantes (BMI, genetische code, etc); constantes die allen met zekerheid afwijken van ‘de gemiddelden’ die de statistici voor “de Nederlanders”, waartoe ik behoor, hebben berekend. Gemiddeldes bestaan niet, net zo min als de Nederlander. Ik wel.

Tot welke klasse ik mij, met hulp van vele medisch relevante gegevens, ook indeel, ik zal daarmee nooit dat unieke gegeven kunnen beschrijven dat ik ben. Zoals de Groningse statisticus Willem Schaafsma mij eens toevertrouwde: Reichenbach’s probleem van de referentieklasse is niet oplosbaar.

Google weet dat hoeveel gegevens ze ook over u verzamelen en hoe intelligent hun machine learning algoritmes ook zijn ze u als uniek individu nooit zullen beschrijven. Google weet niet wie u bent. Google kent u niet. De Belastingdienst ook niet; ook al noemt ze u ‘fraudeur’.

Informatie bestaat niet.

Dat ik deze uitspraak doe daarvoor heb ik een reden en een bedoeling. De reden is dat het waar is wat ik zeg en het doel is dat ik het van belang vind dit op te merken. En dat heeft te maken met de bovengenoemde twee redenen waarom deze uitspraak ook iets zegt: het niet waar kunnen zijn en er zijn er die anders beweren, zoals o.a. Luciano Floridi, primus inter pares onder de informatie-filosofen.

De reden is de oorzaak en de waarheid van het oordeel.

Voor u als lezer of ontvanger van het bericht is de uitspraak “Informatie bestaat niet” iets anders dan voor mij. Het is belangrijk dat we ons dat realiseren! U kijkt daar namelijk anders tegen aan. Laat ik zeggen van buiten af. Voor de ontvanger geldt dat een mogelijkheid is wat voor mij een noodzakelijk feit is. Het doel van communicatie is dat beide kanten overeenstemming hebben over de noodzakelijkheid. Dat doel motiveert de communicatie, het is er de motor van. Het bestaat slechts als vermogen, niet feitelijk. Dit geldt ook voor het observeren van de werkelijkheid: wat voor deze noodzakelijk feit is, is voor u een mogelijkheid. Het komt erop aan de noodzakelijkheid in te zien. Niet om het feit weg te verklaren als teken van iets anders. Het gegeven feit is zichzelf voldoende grond.

Elke feitelijk gebeuren heeft deze twee kanten. Enerzijds is het een onmiddellijk noodzakelijk gegeven, anderzijds is het iets dat tegen de achtergrond van alternatieve mogelijkheden bekeken kan worden. Dan is het gegeven iets “dat zich nog bewijzen moet”. We zeggen dan: “Laten we maar eens zien of dit werkelijk waar is”. “Wat heeft dit te betekenen?”

Wanneer ik zeg dat Informatie niet bestaat dan beweer ik dat informatie dit proces is, een gebeuren dat bemiddelt tussen de waarheid en noodzakelijkheid van het bericht voor de spreker/zender en het bericht als mogelijkheid tegen een achtergrond van de kennis van de luisteraar/ontvanger. Deze kennis is grotendeels impliciet, iets dat we geloven of aangenomen hebben zo te zijn. Een nieuw bericht kan dat tegen (lijken te) spreken. Zoals bijvoorbeeld het bericht dat informatie niet bestaat uw geloof dat informatie wel degelijk bestaat in de verkeerde war kan schoppen. (Merk op dat dit volgens de wet van Bayes niet kan. Exit reverend Thomas Bayes !)

Er wordt wel beweert dat informatie bestaat. Dat het een economisch goed is (een çommodity’), iets objectiefs. Floridi is van mening dat informatie alleen informatie is als het waar is. Ik meen dat waarheid niet een eigenschap van informatie is, maar van een bewering of oordeel of van kennis die in een bewering wordt uitgedrukt. Informatie is betrouwbaar of onbetrouwbaar.

Het Schandaal van Deductie houdt in dat een bewering die logisch volgt uit een bekende theorie geen nieuwe informatie bevat. Zo’n bewering heeft geen informatieinhoud voor de ontvanger (Hintikka). Om dezelfde reden geeft de uitkomst van een berekening of de oplossing van een puzzel geen nieuwe informatie. En toch rekenen we een ingewikkelde integraal uit omdat we willen weten hoe groot de uitkomst is in voor ons begrijpelijke termen. De inhoud van een elk nog leeg hokje van een sudoku puzzel ligt vast (deze volgt uit de gegeven cijfers en de regels van het spel) maar we weten nog niet welk getal er in een bepaald leeg hokje moet komen te staan.

Floridi ontwikkelt een kwantitatieve theorie van Strongly Semantic Information (TSSI, zie Floridi 2004) die een oplossing biedt voor de paradox van Bar-Hillel en Carnap, een gevolg van de probabilistische informatietheorie die zegt dat hoe groter de kans dat een bewering waar is hoe minder informatief deze is het Schandaal van Deductie (een bewering die logisch volgt uit een bekende theorie geeft geen nieuwe informstie Hintikka). Een contradictie zou dan maximaal informatief zijn.

Deze theorie gaat over een informatie begrip dat in tegenstelling tot wat hij beoogt niet voldoet aan wat we in het gewone spraakgebruik onder informatie verstaan. Dat gewone spraakgebruik heeft het namelijk ook over onbetrouwbare informatie. Floridi gaat echter uit van een ruisvrij communicatiekanaal tussen een betrouwbare (“bona fide”) zender en een ideale ontvanger. Dit informatie begrip impliceert waarheid. Valse informatie is geen informatie. Floridi gaat er vanuit dat de ontvanger de informatieinhoud van een bericht (infon) kan bepalen omdat deze volledige kennis heeft van de wereld die als referentie model geldt en waar de gegeven informatie betrekking op heeft (“localized omniscience”). Daarmee is deze ontvanger in staat de graad van discrepantie van de informatie-inhoud met deze wereld te meten.

Floridi’s kwantitatieve theorie van sterke semantische informatie gaat ervan it dat sommige beweringen meer waar zijn dan andere. De bewering “Hij heeft drie euro” is meer waar dan “Hij heeft zes euro” wanneer ‘hij’ feitelijk 4 euro heeft. Een andere ordening op beweringen is op basis van mate van bepaaldheid of vaagheid. “Hij heeft weinig geld” is minder informatief dan “Hij heeft minder dan 3 euro”.

Pragmatisch gezien heb je meer aan een onware bewering die vlak naast de waarheid zit, dan aan een ware bewering die niets zegt, omdat deze teveel in het midden laat (randgeval: een tautologie). Je kunt echter alleen zeggen hoe ver iemand er naast zit als je weet wat het geval is. Maar dan hoeft er niet meer gecommuniceerd te worden!

Dit is het “selectieve informatiebegrip”. Het gaat om het identificeren van een element uit een gegeven (eindige) verzameling van elementen. Informatie wordt als iets puur kwantitatiefs opgevat: iets dat volledig bepaald is door dat wat het niet is.

Maar een feit is meer dan realisatie van een mogelijkheid uit een veld van vooraf gegeven mogelijkheden. Dat iets is en wat het is staan volgens deze theorie volstrekt tegenover elkaar. Dit is een typische kenmerk van het mathematische.

Over de onbegrijpelijkheid van het feitelijke gaat het volgende.

Obama, het alarm, en het fietsslot

Iemand vroeg zich eens af hoe het toch komt dat de batterij van het brandalarmapparaat altijd midden in de nacht op is (het ding maakt dan een hels lawaai). Ik had een soortgelijke vraag: waarom zit er altijd net een spaak in de weg als ik mijn fiets op slot wil zetten? De Nederlandse cabaretier Erik van Muiswinkel merkte in een show eens op dat hij precies op dezelfde dag geboren is als de president van Amerika Barack Obama (die was toen president). De cabaretier merkte daarover het volgende op: “Als dit geen toeval is, dan is het wel heel toevallig”. Wat is hier aan de hand?

Bias. De verklaring van deze toevalligheden die geen toeval zijn is bias. Het wordt namelijk opgemerkt omdat het opmerkelijk is. Het is niet aan de orde om het verschijnsel tegen de achtergrond van alternatieven te bekijken omdat het om feiten gaat die door het achterliggende mechanisme al uitgefilterd zijn. Wanneer ik zoek naar iemand die op mijn geboortedag 10 januari geboren is vind ik Donald Knuth, wel de ‘vader van de informatica’ genoemd. Wanneer is dat toeval? Wat is dan het toevallige?

Toeval bestaat niet, zoals Bruno De Finetti al zei. Net zo min als informatie bestaat.

Over het verschil tussen een gevangene en een deur

Wat is verschil tussen het probleem van de drie gevangenen en het probleem van de drie deuren?

Bij het eerste probleem is de vraag of de kans dat gevangene A wordt vrijgelaten verandert nadat deze weet of het B of C is die wordt vrijgelaten. Was deze kans eerst 1/3. De vraag is wordt deze 1/2 of blijft deze gelijk?

Bij het drie deuren probleem is de vraag nadat de deelnemer A had gekozen en de quizzmaster een deur heeft geopend die niet A is en waar geen auto achter zit of de deelnemer er beter aan doet van keus te veranderen of dat hij A blijft kiezen?

Volgens de meeste geleerden is het antwoord bij de gevangen dat de nieuwe informatie geen verschil maakt voor de kansen van gevangene A. Deze blijft 1/3; er is niets verandert. Maar de deelnemer aan de quiz kan beter de andere deur nemen want de informatie die de geopende deur hem biedt veranderen de kans dat A de deur is met de auto.

Wat is het verschil dat dit verschil verklaart?

Kans of feit?

Er is een onoverbrugbare kloof tussen uitspraken over een veelheid en uitspraken over de individuen die deze veelheid uitmaken. De bewering dat de gemiddelde lengte van “de Nederlander” 1.75 m is” is het resultaat van een schattingsproces waarbij de gemiddeldes van groepen van Nederlanders berekend zijn. Het gaat hier om het zo goed mogelijk bepalen van de kans dat een bepaalde ‘fysische’ constante in een zeker waardebereik ligt. De kans kan benaderd worden als soort van limiet van een rij gemiddelden. Wat herhaald kan worden is het selecteren van een deelgroep, waarvan we aannemen dat deze representatief is voor “de Nederlanders”.

Bij het bepalen van de kans dat we met een dobbelsteen een 6 gooien is het experiment het werpen met de dobbelsteen “onder gelijke omstandigheden”.

In beide gevallen speelt impliciete kennis (‘inzicht’) in wat als ‘gelijke gevallen’ beschouwd kan worden een rol.

Altijd speelt impliciete kennis een rol van betekenis bij het bepalen van de informatie-inhoud van een gegeven of bericht.

Informatie bestaat niet, noch als iets fysisch, noch als iets mathematisch; het is iets dat slechts in het intersubjectieve verkeer bepaald wordt.

Bronnen

Floridi, L. Outline of a Theory of Strongly Semantic Information. Minds and Machines 14, 197–221 (2004).

Published by

admin

Rieks op den Akker was onderzoeker en docent kunstmatige intelligentie, wiskunde en informatica aan de Universiteit Twente. Hij is gepensioneerd.

Leave a Reply