SCANNEN EN LEZEN MET KURZWEIL1000



     Raymond Kurzweil werd geboren in 1948 als zoon van Oostenrijks-Joodse ouders die voor de tweede wereldoorlog naar de Verenigde Staten waren gevlucht. In 1963, toen hij als High School leerling tijdens een schoolvoorstelling een piano recital gaf, fluisterde hij tegen een vriend: "Ik heb m'n eigen computer gebouwd."
   "Wat heeft dat met je pianorecital te maken?" vroeg zijn vriend verbaasd.
   "De muziek s door die computer gecomponeerd." antwoordde de vijftienjarige Ray.

     Let wel: dat was in 1963, toen computers nog nauwelijks in het begin van hun ontwikkeling waren en bestonden uit kolossale kasten, met grote haspels met magneetbanden als opslagmedium. En, de enige programmering die dagen bestond uit pure machinetaal, dat wil zeggen: uit eentjes en nulletjes.

     Je zou Raymond Kurzweil bijna de Thomas Alva Edison van onze tijd kunnen noemen. Hij ontwikkelde dat muziek analyse programma dat aan de hand van de geanalyseerde muziek nieuwe muziek in diezelfde stijl kon componeren. Hij was de toen nog jonge man, die algemene tekenherkenning, - omnifont OCR - ontwikkelde. Hij is de uitvinder van de "flat bed" scanner. Hij ontwikkelde het eerste tekst naar spraak systeem, dat in 1976 resulteerde in zijn Kurzweil Reading Machine (KRM). Op suggestie van Stevie Wonder, met wie hij goed bevriend raakte, nadat Stevie zijn eerste KRM van hem kocht, ontwikkelde hij een computer die muziekinstrumenten - zoals een vleugelpiano - en andere instrumenten gelijktijdig natuurgetrouw kon weergeven. En , hij ontwierp het eerste spraakherkenningsprogramma, dat hij later aan Lernaut en Hauspie in België verkocht. Veel van zijn programma's en computersystemen zijn thans in beheer van Scansoft. Op dit ogenblik houdt hij zich vooral bezig met kunstmatige intelligentie, waarvan hij hoge verwachtingen heeft.

     Het zou ons te ver voeren om de hele levensgeschiedenis van Ray Kurzweil hier weer te geven. Mie meer over hem wil weten, kan de Wikipedia raadplegen, waarbij de Engelse natuurlijk het uitgebreidst is; maar ook de Nederlandse Wikipedia heeft een vrij omvangrijk artikel over hem.

     Een van de vele bedrijven die hij oprichtte is Kurzweil Educational Systems, het bedrijf dat thans onderdeel is geworden van Cambium Learning Systems. Dit Kurzweil Educational Systems (KES) beheert, ontwikkelt en verspreidt de programma's Kurzweil1000 en Kurzweil3000. Het laatste (dat ook bij Sensotec in België in het Nederlands verkrijgbaar is) is speciaal gericht op leerlingen met leesproblemen, zoals dislectici. De benamingen Kurzweil1000 en Kurzweil3000 - vaak afgekort tot K1000 en K3000 - zijn elf jaar geleden ontstaan toen het idee opkwam om drie verschillende programma's te maken, één voor blinden (K1000), één voor slechtzienden (K2000), en één voor leerlingen met leesproblemen (K3000). Die K2000 is er niet gekomen, omdat slechtzienden evengoed met K1000 uit de voeten kunnen.

     De basis opzet van Ray Kurzweil was, nadat hij bij toeval met een blinde in contact was gekomen, om het voor blinden mogelijk te maken gedrukte teksten zelf te lezen, door ze op een flatbed scanner te leggen, ze om te zetten naar tekstbestand, en dat tekstbestand met een synthetische stem te laten voorlezen. Dat lukte hem dus al in 1976 met zijn Kurzweil Reading Machine (KRM). Dat apparaat, dat zo groot was als een flinke wasmachine, was natuurlijk voor vrijwel alle blinden - met uitzondering van Stevie Wonder - onbetaalbaar. Er zijn nog wel enkele van die zogenaamde "stand-alone" scan en leesmachines op de markt, maar verreweg de beste oplossing is het computerprogramma, dat iedere gebruiker zelf op zijn eigen computer kan installeren, dus ook op een laptop- of notebook-computer. Dat biedt namelijk onnoemlijk veel meer mogelijkheden dan een stand-alone leesapparaat, terwijl het programma bovendien veel goedkoper is. Alleen moet je er wel een losse scanner bij hebben, maar ook daarin bestaan tegenwoordig heel handige, kleine apparaten, die gemakkelijk in een draagtasje kunnen worden meegenomen, vooral als ze hun voeding via de USB kabel kunnen krijgen, zoals de uit Engeland afkomstige Visioneer Road Warrior. Dat soort kleine scanners is echter alleen geschikt om telkens één los vel tekst te verwerken. Je kunt er geen boeken mee inscannen, of je moet alle bladzijden los maken en ze er één voor één doorheen laten trekken. Een Amerikaanse blinde studente schrijft er enthousiast over in de discussie lijst van K1000. Ze zegt dat ze het apparaatje samen met haar notebook computer altijd meeneemt naar de collegezaal, omdat docenten de gewoonte hebben, teksten uit te delen, die ter plekke moeten worden gelezen.

     Wat K1000 doet is het volgende: Kurzweil1000 zelf start de scanner met een druk op functietoets 9. (Je kunt natuurlijk ook via het uitklap menu werken, maar waarom zou je zo omslachtig te werk gaan, als het makkelijk kan?) De scanner maakt dan een zogenaamde "image", zeg maar: foto van de erop gelegde bladzijde. Het mogen er ook twee tegelijk zijn, maar dan moet wel in de instellingen even worden aangegeven dat er twee pagina's tegelijk gescand worden. Als de tekst in twee of meer kolommen gedrukt is, zoals in tijdschriften vaak het geval is, moet ook dat worden aangegeven. Kurzweil1000 zet die kolommen dan niet naast, maar onder elkaar. Hoe lang het duurt voor zo'n scan klaar is, hangt van meerdere factoren af. Op de eerste plaats van de gebruikte scanner zelf; op de tweede plaats van de kloksnelheid van de computer en ten slotte, van het beschikbare werkgeheugen.

     Een betaalbare, snelle scanner is de Optic Book 3600 van Plustec, die bovendien het grote voordeel heeft, dat één van de lange kanten van het scannerbed gekromd omhoog staat, waardoor je ook in een dik boek de tekst in de bocht van de binding goed kunt inscannen, zonder het boek plat te hoeven drukken, met het risico dat je ook de glasplaat van de scanner omlaag drukt. Zelf heb ik die scanner nog niet, maar zo gauw mijn huidige Epson het begeeft, wort het de Optic Book van Plustec, dan waarschijnlijk de 4600, die inmiddels op stapel staat. De vele deelnemers aan de mailing-list van Kurzweil1000 die hem gebruiken zijn er wild enthousiast over. Hij heeft weliswaar geen document lade, maar die hebben de goedkopere scanners geen van alle. Voor huis-tuin-en-keukengebruik is dat ook echt niet nodig.

     Als het plaatje dat de scanner maakt, klaar is, start automatisch het OCR programma; standaard is dat finereader, maar men kan ook kiezen voor scansoft. Nadat de "herkenning" (recognition) klaar is, begint K1000 direct met voorlezen. Dat voorlezen kan op verschillende manieren gestopt en opnieuw gestart worden. Een druk op de control toets stopt het lezen, maar ook een druk op functietoets 5, die bovendien als schakelaar werkt, zodat een hernieuwde druk erop het voorlezen weer start.

      Het programma zelf herkent meestal de taal en kiest dan een bijbehorende stem. De gebruikers van de Optic Book 3600 met snelle computers, bezweren dat het hooguit zes tot zeven seconden duurt voordat de tekst wordt voorgelezen. Dat wil zeggen: vanaf het moment dat de scan is gestart. Men beweert makkelijk honderd bladzijden in 'n uur te kunnen scannen. Veel Amerikaanse gebruikers van K1000 werken namelijk ook als vrijwilligers voor de boeken web site voor blinden "Bookshare.org". Dat is een site die alleen toegankelijk is voor geregistreerde Amerikaanse blinden of slechtzienden, omdat het allemaal boeken betreft waarop nog auteursrechten staan.

     Wanneer men een heel boek inscant, is het verreweg het handigst om de omzetting naar tekst pas achteraf te doen en eerst alle bladzijden als zogenaamde "image" op te slaan. Standaard staat K1000 op scannen en lezen. Je kunt dat in het instellingen menu (in het Engels: "settings") veranderen onder de optie Scannen. Kurzweil1000 slaat dan al die afbeeldingen op met volgnummers in de map "images". De jongens van Sensotec zullen daar wel een passende Nederlandse naam voor hebben bedacht. Daar zijn Vlamingen immers veel beter in dan Nederlanders.

     Voor het OCR programma moet men in het instellingen menu onder Herkenning ook aangeven welke taal herkend moet worden. Of als het een tweetalige tekst betreft, beide te herkennen talen. Dat houdt verband met de speciale tekens die in sommige talen voorkomen, zoals in het Nederlands de klinkers met trema en dergelijke. Als je het OCR programma op Engels laat staan, worden dat soort geaccentueerde tekens niet goed herkend. Finereader heeft een zeer lange lijst met talen, waaronder zelfs Papiaments staat.

     Hoe correct de omzetting naar tekst verloopt, hangt natuurlijk af van hoe duidelijk de druk van de gescande tekst was. Bij goede, scherp contrasterende druk ligt dat op 98 percent of hoger. In dat geval haal je er met de spellingcontrole snel de weinige fouten uit. Maar soms zijn teksten helemaal niet goed contrasterend, vooral als er in kleur gedrukt is, of, als de tekst op de andere kant van de bladzijde doorschijnt. Dan geeft K1000 zelf aan hoe hoog - of liever laag - de betrouwbaarheid van de herkenning is. Als het om doorschijnende tekst gaat, doet men er goed aan een blanko vel papier achter de te scannen pagina te leggen. In de andere gevallen, kan het scannen geoptimaliseerd worden door onder het scan menu (alt S) te kiezen voor "optimaliseren" waaronder verschillende mogelijkheden staan. Je kunt die optie in één keer oproepen met Alt S O. (het maakt niet uit of het hoofdletters of kleine letters zijn.)

     Het oproepen van menu opties met de alt-toets gevolgd door letters, is een kwestie van wennen. Wie pas begint met Kurzweil1000 doet er het best aan alle menu opties uit te proberen en bij degene die men vaak zal gebruiken de sneltoets letters op te vragen met een druk op functietoets 1. Het heeft weinig zin voor een artikel als dit alle mogelijkheden te vermelden. Een goede raad is bovendien om deel te nemen aan de zogeheten listserve van Kurzweil1000, waar je altijd hulp kunt vragen voor problemen. Het mooiste van die lijst is dat ook de mensen van Kurzweil Educational Systems zelf daaraan deelnemen, zoals de hoofd programmeur, Stephen Baum, de programmeur van de secundaire programma onderdelen Josephine Cay, en de technische assistenten als Nick Dotson, zelf blind geboren en Paul Hendrichson (geen Nederlander!). Er zijn wel andere Nederlanders die ook geabonneerd zijn op de lijst, zoals ene Danny Jansen en ik, natuurlijk! Het zijn overigens ook niet alleen de mensen van Kurzweil Educational Systems die problemen op weten te lossen, maar heel vaak ook mede-gebruikers. Ikzelf heb ook al verschillende andere gebruikers uit de brand kunnen helpen. Je moet daarvoor natuurlijk wel het Engels behoorlijk beheersen. Een van mijn uitgebreide bijdragen, over het gebruik van de dode toets functie in antwoord op vragen over het maken van geaccentueerde tekens, werd, tot mijn verrassing, overgenomen op een heel ander discussieforum van normaal zienden, over het gebruik van vreemde talen.

     Tenslotte moet nog vermeld worden dat versie 11 van K1000 ook de mogelijkheid biedt om invulformulieren in te scannen en ze vervolgens zelf in te vullen. Dat heb ik nog niet nodig gehad, maar uit de vragen in de discussielijst blijkt wel dat het niet altijd vlekkeloos verloopt. Stephen Baum heeft al laten weten dat hij aan een patch werkt om de problemen ermee op te lossen. Het grote voordeel van het feit dat mensen als Stephen Baum en Josephine Cay zelf ook alle mailtjes lezen in de lijst, is, dat zij bij het ontwikkelen van een volgende versie van het programma rekening houden met de wensen en suggesties die in de inzendingen naar voren komen.

     Wat de meeste gebruikers doen - zoals ikzelf - nadat ze een boek hebben ingescand en gecorrigeerd met de spellingcontrole, is het omzetten in MP3 of daisy bestanden om die vervolgens op een CD te branden, of naar de Victor Reader Stream te copiëren. Maar dat hebben we al uitvoerig besproken in ons eerste artikel. In de volgende aflevering gaan we dieper in op een aantal extra mogelijkheden van K1000, waarvan ik er al sommige terloops heb genoemd. Tot dan!