IBM en de Stamppot

Vorige Entr'acte
Volgende Entr'acte
Terug naar Archief Entr'actes
Terug naar hoofdmenu.

Weer zo'n moment in de wereldgeschiedenis dat er iets voor eens en voor altijd versjteerd gaat worden. De Koninklijke Bibliotheek (KB) heeft "een contract gesloten met IBM om de dreigende teloorgang van digitale collecties te verhinderen" (NRC 19 oktober 2000). Althans in één opzicht een goed idee. Er zullen nieuwe pakketten komen die de oude formaten van data-voor-de-oude-pakketten niet meer kunnen verwerken. Dus moeten alle data van vandaag - en dat is nou maar gauw mijn eigen conclusie, en daarvoor hoeven ze dus echt niet bij IBM te zijn - in een universeel toegankelijk formaat worden vastgelegd. Maar wat is een universeel toegankelijk formaat? Dat heeft in elk geval één noodzakelijk kenmerk: het is een vorm van opslaan waar de tekst waar het om gaat niet (langer) vermengd is tot een stamppot samen met de informatie over de manier waarop die tekst zichtbaar gemaakt moet worden. Dat is typisch zo, omdat die stamppot-toestand de enige oorzaak is dat die nieuwe pakketten met die oude data niet uit de voeten kunnen.

Ik weet niet of u ooit hebt geprobeerd uit te vogelen hoe een tekst door iets als WP of Word wordt verdonkeremaand. In elk geval kom je de elementen van de tekst niet in hun logische tekst-volgorde tegen als je het bestand byte voor byte van voor naar achter doorloopt. Dat is dus: diefstal van de tekst uit handen van de eigenaar in de handen van de leverancier van het pakket, aan wie je omwille van je eigen tekst van stonde af aan reddeloos vastzit. Je zult hem nooit meer kunnen missen.

De computerwereld valt in tweeën uiteen als je zo'n zaak beschouwt. Aan de ene kant staan de dieven. Die leveren systemen waar je slachtoffer en slaaf van wordt vanaf de dag dat je ze gaat gebruiken (voorbeeld Windows). Slachtoffer omdat je een heleboel wordt aangedaan waar je niet om gevraagd hebt en slaaf omdat je er niet meer buiten kunt, omdat alles wat van jou is bij hullie in de zak zit. En aan de andere kant staan de open systemen die je alles ter keuze laten en niks van je stelen. Voorbeeld Linux en, als het om teksten gaat, T_EX. Wie T_EX gebruikt plaatst in zijn tekst (die gewoon in ASCI-formaat staat) codes die over de representatie gaan Die codes zijn te herdefiniëren, zodat je dezelfde tekst op meerdere manieren kunt laten zien. Wie zijn tekst verandert zit dus altijd gewoon in een ASCI-bestand te werken. En je moet toch aannemen dat er nimmer een Windows-eindtijd zal aanbreken waarin zoiets niet meer kan.

Nu wil ik niet zeggen dat waar de KB naar zoekt het systeem T_EX is, maar wel dat het systeem dat ze zullen krijgen (aangenomen dat het is wat ze nodig hebben) onder T_EX gebruikt kan worden. Het onvergankelijke opslag-formaat zal zijn iets als HTML of XML: tekst in ASCI, onderbroken door unieke, ook in ASCI-karakters geformuleerde codes voor ... En daar komt de moeilijkheid: waarvoor? Alleen voor afbeelding van de tekst op papier? Of voor al die dingen die in gedachte zijn bij de hedendaagse ontwerpen onder XML? Ik denk dat je daarvoor geen andere keuze moet maken dan: alle coderingen die - zij het als zout of suiker in de stamppot - er vandaag al in zijn aangebracht. Die meneer H. Jansen van de KB heeft het lelijk mis als hij zegt dat het enige alternatief voor het Geheugen van Nederland (waaraan hij werkt) is "het voortdurend converteren van digitale bestanden voor nieuwe software" Waarom? Omdat het maar één keer hoeft. Er verandert immers nooit meer iets in de beschikbare informatie, ook al beweert Jansen uitdrukkelijk het tegendeel: "Maar bij elke omzetting gaat kwaliteit en informatie verloren". (Wat betekent trouwens kwaliteit hier?) Als u zoiets leest weet u, zo goed als ik, dat de zaak in verkeerde handen is.

Ik begon met te zeggen dat het in elk geval in één opzicht een goed idee was. En hier hebt u dan de foute kant en de foute boel. Dat dacht ik trouwens al toen ik iets las over DOS-bestanden. Weet u wat dat zijn? Ik denk ook dat IBM de verkeerde partij is om voor tien miljoen gulden (geen Euro's?) samen met de bibliotheek (ook dat nog) een systeem op te zetten om de digitale bestanden voor lange duur te bewaren en toegankelijk te houden. In alles wat ik tot hier toe heb opgemerkt komt niets, maar dan ook echt niets, voor waarbij je aan IBM zou moeten denken. Het enige waar je IBM wel voor nodig hebt is iets wat ze niet weten: op welk medium moet je die T_EX-, HTML- of XML-achtige teksten opslaan om zeker te zijn dat toekomstige hardware ze zal kunnen lezen? Battus had het onlangs over een toekomst waarin men zelfs niet meer zal weten wat voor iets een CD-ROM ooit zou kunnen geweest zijn. Misschien ponskaarten?

Jan van Bakel, 19 oktober 2000
janvanbakel.nl

Terug naar boven

Reactie? Bericht: info@janvanbakel.nl.