PROJECT GUTENBERG

TIENDUIZENDEN ELEKTRONISCHE BOEKEN

GRATIS VOOR NIKS!




     Het was in 1971 dat een jongeman, Michael Hart, een job kreeg als computer operateur aan de grote main-frame computer van de universiteit van Illinois, in Amerika. Die "grote" computer had, voor die tijd, de enorme opslag capaciteit van tien megabyte! Het was nog de tijd dat computers voor een groot deel ongebruikt voor niets stonden te draaien. Hij en zijn collega's - goeie vrienden van hem - werden daarom door hun baas aangemoedigd de vrije tijd die ze ruim voorhanden hadden, te gebruiken om met de computer te experimenteren. Daar konden ze van leren, nietwaar?



     Michael bedacht toen, dat een computer, behalve voor het maken van berekeningen, uitermate geschikt was als opslag- verspreidings- en terughaal-machine en hij tikte vlijtig de Amerikaanse "Declaration of Independence" over, (de onafhankelijkheidsverklaring) en zond die aan iedereen die ook toegang tot de computer had. En daarmee ontstond het "Project Gutenberg", zo genoemd naar de vijftiende eeuwse Duitse uitvinder van de boekdrukkunst, Johannes Gutenberg uit Mainz - al denken de meeste Nederlanders nog dat die uitvinding door de Haarlemse Laurens Janszoon Coster werd gedaan. Michaels filosofie was simpel: alles wat je op een computer zet kan in de toekomst onbeperkt door honderden miljoenen computergebruikers worden opgehaald, gereproduceerd, verder verspreid en, in het algemeen, gebruikt. Tot op de dag van vandaag is Michael Hart de grote baas van het project.



     Om de filosofie waar te kunnen maken, werd door Project Gutenberg uitdrukkelijk gekozen voor de simpelst mogelijke formule om electronische teksten op te slaan, namelijk in platte Vanilla ASCII {SPREEK UIT: ASKIE} vorm. Wat er ook voor nieuwe computersystemen, programma's en besturingsystemen in de toekomst zouden worden ontwikkeld, platte ASCII-bestanden, tegenwoordig meestal aangeduid als .TXT bestanden, zouden altijd gelezen kunnen worden. Men weigert in het algemeen dan ook beslist alle verzoeken om teksten in andere formaten uit te brengen, omndat de ervaring heeft geleerd hoe lastig het is oude tekstverwerkingsformaten omgezet te krijgen naar nieuwe.



     Dat heb ik zelf aan den lijve ondervonden, toen ik overging van mijn oude home comnputertje, dat onder CP/M draaide, naar een IBM compatibele AT computer. Het heeft bijna een jaar geduurd, voor ik eindelijk via een Amerikaanse vriendin een programma kreeg, waarmee ik mijn oude bestanden om kon zetten.



     "ASCII" is een acroniem, samengesteld uit de beginletters van "American Standard Code for Information Interchange" - dus: Amerikaanse standaard code voor informatie overdracht. Die code kent een getalswaarde toe aan alle tekens die moeten kunnen worden weergegeven. De basis zogenaamde Vanilla ASCII tabel voor alle basis functies en het Latijnse alfabet bestond uit 128 waarden - omdat ook de nul meetelde - die allemaal in zeven bits konden worden weergegeven. Een computer heeft namelijk bits nodig, d.w.z. eentjes en nulletjes, die de zogenaamde binaire (of tweetalllige) getallen vormen. Die waarden tot maximaal zeven bits noemde men bytes. Bijvoorbeeld om een spatie te geven krijgt de computer ASCII waarde 32, oftewel in bits een één met vijf nullen. De hoofdletter "A" heeft ASCII waarde 65, een zeven bits waarde, want waarde 64 is een één met zes nullen en 65 is dus 1000001. De kleine letter "a" heeft ASCII waarde 97. Het is nodig dit even uit te leggen, omdat in het Project Gutenberg nog teksten bestaan in, bijvoorbeeld het Frans, in zeven bits ASCII, en dus zonder accenttekens. Dat is te zien aan hun bestandsnaam, die dan met het cijfer 7 begint.



     Toen er verbeterde computersystemen kwamen, werd een acht bits ASCII tabel toegevoegd, van ASCII waarde 128 tot en met 255, om ook al die geaccentueerde letters en grafische en andere symbolen te kunnen reproduceren. Sindsdien spreken we dus van bytes van acht bits. ASCII waarde 128 is een één met zeven nullen en geeft de "ç" {c cédille}.



     Microsoft heeft de waarde van dit systeem ook onderkend en de afspraak gemaakt dat hun tekstverwerker MS Word, een woord of zin die in platte ASCII tussen onderstrepingstekens wordt gezet in WORD wordt omgezet in cursief, en wat tussen sterretjes wordt geplaatst wordt in WORD vet weergegeven, doch mijn ervaring is dat het niet altijd werkt.



     Sinds het prille begin van Project Gutenberg, waarin meer en meer enthousiaste vrijwilligers gingen helpen om teksten over te typen op hun computers - omdat er toen nog geen goede scanners beschikbaar waren - is het Project Gutenberg uitgegroeid tot een ware wereldbibliotheek die voor iedere belangstellende toegankelijk is. De tienduizenden boeken staan inmiddels op menige FTP-server op de wereld en dankzij de snelle scanners van vandaag de dag, breidt het project zich met gestaag stijgende snelheid uit.



     Het enige probleem was en is, dat men uitsluitend teksten kan opnemen, die niet langer onder de auteursrechten vallen; voor Amerika betekent dat grofweg boeken van schrijvers die vijftig jaar of langer dood zijn. In de Europese Unie is de termijn 70 jaar.



     Wie de volledige werken van William Shakespeare wil hebben, of de oorspronkelijke Spaanse tekst van de Don Quichotte van Cervantes, of de "King James Bible", of alle boeken van Jules Verne, kan die van een FTP server met de teksten van Project Gutenberg zo downloaden.



     "FTP" staat voor "File Transfer Protocol" en een FTP server is meestal een grote computer van een organisatie of universiteit, waarop alle mogelijke databases en andere bestanden staan, die niet allemaal publiekelijk toegankelijk zijn. De publiekelijk toegankelijke bestanden staan onder een sub-directory /pub/. Bijvoorbeeld: ftp://ibiblio.org/pub/docs/books/gutenberg/ is de Gutenberg directory van de server van de universiteit van north carolina in de verenigde staten, waar alle teksten van project gutenberg op staan, zowel als directe .txt bestanden, als als .zip bestanden. De gezipte bestanden zijn minstens de helft kleiner dan de volledige tekstbestanden en worden, als men WINDOWS gebruikt, automatisch door WINZIP geopend en uitgepakt. Onder DOS konden ze met PKZIP worden uitgepakt.



     De eenvoudigste manier om boeken te downloaden is te kiezen voor HTTP://WWW.GUTENBERG.NET en daarop op de "SEARCH" link te clicken, zoals dat heet. Men krijgt dan een invulformulier, waarop men kan zoeken onder schrijversnaam en/of titel, of in een genre - "subject". Daarna kiest men voor een FTP server die het dichtst in de buurt is en het boek wordt opgezocht en gedownload, naar een directory en bestandsnaam die men opgeeft. In Europa zijn ook enkele ftp-servers die de Project Gutenberg teksten hebben, zoals die van het Max Planck Institut in Duitsland. Hoe dichter bij, hoe minder kans op storingen, die het downloaden vertragen.



     Wie Kurzweil1000 gebruikt, kan direct titels of schrijvers opgeven in het on-line menu, waarna K1000 de gezochte titel of titels direct van Project Gutenberg downloadt.



     Men moet zich wel realiseren dat het een project is, dat volledig op vrijwilligers draait. Vandaar dat er onvolmaaktheden aan kleven. Zo kan het gebeuren dat de keuze voor een bepaald genre niet alle boeken toont die daaronder thuishoren. Bijvoorbeeld: mijn vraag naar "Philosophy" (filosofie) leverde een lijstje op waar Descartes niet bij stond. Dat kan natuurlijk niet. Toen ik "Descartes" als auteursnaam opgaf, kwam hij wel tevoorschijn met zijn "_Discours de la Méthode_", ook in Engelse vertaling.



     Grappig genoeg waren de eerste drie boeken in het Nederlands in het Project Gutenberg alle drie van de Duitse schrijver Heinrich Heine! De oorzaak daarvan lag natuurlijk in het feit dat men in Nederland in het begin geen aandacht had voor dit prachtige project, dat juist ook voor blinden een ware uitkomst kan zijn. Inmiddels vindt men er vele ook Nederlandse titels op, evenals in diverse andere talen, zelfs in de Filippijnse taal Tagalok.



     Het lijkt mij in alle opzichten de moeite waard als de Nederlandse blindenbibliotheken ingescande teksten, die niet langer onderhevig zijn aan auteursrechten, ook in ASCII formaat aan het Project Gutenberg zouden aanbieden en als er een Nederlandse FTP-server de teksten zou opslaan. De makers van het Project Gutenberg vragen daar op hun website voortdurend om, evenals om meer vrijwilligers om boeken in te scannen. Laat men alsjeblieft niet overgaan op een of ander fraai tekstformaat, dat misschien over twee of drie jaar al weer vervangen wordt door een nieuw. Het ASCII formaat zal altijd leesbaar blijven en blinden en slechtzienden hebben geen baat bij een fraai uiterlijk.