Inleiding
In een tijdperk waarin kunstmatige intelligentie steeds vaker de poortwachter is van onze digitale informatievoorziening, waaronder de dominante zoekmachine van Google, rijst de vraag: vinden we nog wel alles wat inhoudelijk van waarde is? Als pionier op het gebied van digitale informatie (van de SARA-computer tot CD-ROM en SEO) zie ik een verontrustende ontwikkeling: AI-gestuurde zoekmachines als Google zoeken blijkbaar niet meer naar waarheid of excellente inhoud op het net, of laten dat aan hun gebruikers niet meer zien, want men kijk vooral naar het gedrag van die gebruikers: wat klikken de mensen aan, wat kan men op een mobiele telefoon nog gepresenteerd krijgen. En dat heeft verstrekkende gevolgen voor wat we online wel en niet te zien krijgen.
Van PageRank naar Predictive AI
De oorspronkelijke logica van Google was elegant: wie door veel gezaghebbende pagina’s werd genoemd, was waarschijnlijk belangrijk. PageRank was een vorm van democratische indexering, gebaseerd op verwijzingen. Maar sinds de invoering van modellen als BERT (2019) en MUM (2021), is Google fundamenteel veranderd.
Zoekmachines interpreteren nu zoekopdrachten met behulp van taalmodellen die semantiek en context proberen te begrijpen. Ze genereren samenvattingen, voorspellen zoekintenties, en filteren informatie op basis van gebruikersgedrag. Wat meest waarschijnlijke vervolg is, vervangt het zoeken naar het meest ware antwoord.
Techniek als poortwachter, niet als hulpmiddel
Een frustrerend gevolg hiervan is dat technische factoren zoals mobielvriendelijkheid, laadsnelheid en visuele opmaak zwaarder zijn gaan wegen dan de inhoud zelf. Een briljante wetenschapper die zijn bevindingen publiceert op een rommelige, trage website, wordt afgestraft in de zoekresultaten. De inhoud telt niet meer op zichzelf – de verpakking bepaalt of ze gevonden wordt.
De gebruiker heeft die keuzevrijheid niet meer. Google bepaalt vooraf of een pagina het waard is om getoond te worden, gebaseerd op massa-gebruik, niet op individuele relevantie of diepgang.
AI traint op gedrag, niet op betekenis
De kern van het probleem is epistemologisch: AI-modellen zoals Google MUM of GPT-4 zijn niet getraind op waarheid of betekenis van de data, maar op het statistische gedrag van gebruikers. Ze leren wat mensen doorgaans aanklikken, hoe lang ze ergens blijven, wat ze skippen. Het gevolg:
- Wat veel bekeken wordt, krijgt voorrang
- Wat diepgaand maar zeldzaam is, verdwijnt naar de achtergrond
- Wat glanst wint van wat inhoud heeft
Een tragedie van de verrijking voor kennis
Waar de belofte van het internet ooit was dat iedereen toegang kreeg tot de volledige rijkdom van menselijke kennis, leven we nu in een web dat steeds meer een gedragsspiegel wordt. Een bibliotheek waarin de zeldzaamste, meest waardevolle boeken in een donkere kelder liggen – en de zoekrobot je alleen naar de kiosk bovenaan leidt.
Wat nu?
Er zijn tegenbewegingen:
- Zoeken via platforms als Marginalia Search, Kagi of Perplexity AI die inhoud boven gedrag stellen.
- Projecten voor open semantische netwerken zonder commerciële logica.
- Nieuwe vormen van digitale bibliotheken waarin AI dient als gids, niet als censor.
Slotgedachte: de derde wet van Ahles
Ik formuleerde ooit:
Alles wat gedigitaliseerd kan worden, zal worden gedigitaliseerd.
En alles wat gedigitaliseerd is, zal vroeg of laat online opvraagbaar zijn.
Misschien is het tijd voor een derde wet:
Alles wat AI kan reproduceren, zal dominant worden – maar niet per se waar, diep of waardevol voor de mens zijn.
De vraag is dus: wie zorgt er voor de kelder van het web? Uiteindelijk denk ik dat er ook AI systemen ontwikkeld worden die wel een (meer wetenschappelijke) methode ontwikkelen om niet doorsnee kennis te ontdekken en te presenteren, en de juistheid daarvan in een proces van hoor en wederhoor, in open dialogen tussen vertegenwoordigers van verschillende opvattingen, recht doen aan de groei van kennis en daarmee aan het voortzetten van het proces van vooruitgang.
Dirk Hendrik Ahles
(Met dank aan GPT-4 voor de sparring, maar de ideeën zijn ouder dan zijn trainingsdata.)