Persoonlijke hulpmiddelen
U bent hier: Home Uitgaven Trefwoord Jaargang 2001 woordenboeken nieuw millennium, reactie
Document Acties

woordenboeken nieuw millennium, reactie

Woordenboeken in het nieuwe millennium. Een reactie

In zijn recente bijdrage tot Trefwoord behandelt Fons Moerdijk de toekomst van de lexicografie in het nieuwe millennium. Twee vragen staan daarbij op de voorgrond: verdwijnt het papieren woordenboek, en zijn on line woordenboeken superieur t.o.v. woordenboeken op cd-rom? Bij beide vragen - maar vooral bij de tweede - wil ik in dit stukje een kanttekening plaatsen. Ik wil daarbij laten zien dat Moerdijk de verhouding tussen on line woordenboeken en woordenboeken op cd-rom eenzijdig belicht, en dat de toekomst al in hogere mate gerealiseerd is dan hij suggereert.

Verdwijnt het papieren woordenboek?

De verwachting van Moerdijk is dat het met het verdwijnen van het papieren woordenboek niet zo'n vaart zal lopen als sommigen beweren, en daarmee kan ik het eens zijn. Moerdijks eerste argument houdt in dat "interessewoordenboeken" (taalboekjes zoals woordenboeken rond voetbaltaal of jongerentaal, scheldwoorden, en woordenboeken van nieuwe woorden) functioneel niet gebaat zijn met een digitalisering: in essentie gaat het om lees- en grasduinboekjes, en niet zozeer om echte referentiewerken. De meerwaarde die het elektronische medium kan bieden, is hier te beperkt om een massale digitalisering te verwachten. Moerdijks tweede argument betreft het moeizame karakter van het gebruik van woordenboeken op de computer - niet moeizaam als de computer opgestart en de woordenboekapplicatie geopend is, maar moeizaam als deze dingen eerst nog moeten gebeuren: "Als je weet wat je op wilt zoeken en het gaat daarbij om iets wat op woordvorm moet worden opgezocht, dan kan dat met weinig inspanning, snel en doelgericht. Daar ga je niet speciaal je computer voor opstarten".

De grotere opzoeksnelheid van het elektronische woordenboek wordt inderdaad erg relatief wanneer de computer eerst nog opgestart moet worden. Echter, enige nuancering is noodzakelijk. We gaan immers razendsnel naar een situatie toe waarbij overal wel ergens een computer stand-by is. De permanente beschikbaarheid van een woordenboek (als apart geïnstalleerd product, via een intranet in een kantooromgeving, of via het internet) zal op die manier vanzelf toenemen - ook in de huiskamer. Over afzienbare tijd worden computers niet vaak meer opgestart: ze staan gewoon stand-by te wachten en kunnen in een fractie van een seconde gebruiksklaar zijn. Deze evolutie zal vermoedelijk het snelst gaan bij de mensen die ook een traditioneel woordenboek in huis plegen te hebben, maar het valt niet uit te sluiten dat de digitalisering een grotere verspreiding van lexicografische informatie dan ooit te voren bewerkstelligt. Zoals voor andere types van informatie lijken we op weg naar een situatie waarin de toegang tot woordenboeken voor veel meer mensen normaal wordt dan ooit het geval is geweest.

Het snelheidsargument van Moerdijk is dus niet zo sterk als hij suggereert. Daar staat tegenover dat nog wel een derde argument te formuleren is voor de persistentie van het papieren woordenboek. Door zijn grotere zichtbaarheid heeft het papieren woordenboek immers een symbolische functie die het digitale woordenboek ontbeert. Als zichtbaar teken van een zekere begaanheid met de gemeenschappelijke taal en de culturele traditie heeft het papieren woordenboek een symboolfunctie die het (meer utilitaire, minder opvallende) woordenboek in elektronische vorm niet heeft. Er is geen reden om aan te nemen dat het belang van deze functie zal afnemen, en ik ben daarom geneigd te besluiten dat het algemene papieren woordenboek zal blijven bestaan, zij het wellicht met een nog sterkere focus op zijn culturele symboolwaarde dan thans het geval is. Misschien wordt het papieren woordenboek wel een koffietafelboek …

Zijn on line woordenboeken superieur t.o.v. woordenboeken op cd-rom?

Moerdijk beweert dat on line woordenboeken superieur zijn, maar zijn argumenten overtuigen niet. Hij herhaalt de ideeën die Ewoud Sanders eerder onder de noemer "Het ideale woordenboek" gelanceerd heeft, en suggereert dat de mogelijkheden die Sanders als "ideaal" voorstelt, bij uitstek door het on line woordenboek gerealiseerd zullen worden. Om twee hoofdredenen is de argumentatie van Moerdijk niet sluitend. In de eerste plaats is het eenvoudigweg incorrect de meerwaarde die Sanders beschreven heeft, als een effect voor te stellen van het on line karakter van een woordenboek: woordenboeken op cd-rom kunnen deze functies net zo goed aan. In de tweede plaats verzuimt Moerdijk een aantal nadelen van on line woordenboeken te vermelden.
Ik ga eerst op het tweede punt in. On line woordenboeken hebben een aantal beperkingen die woordenboeken op cd-rom missen.

In de eerste plaats zijn on line woordenboeken minder makkelijk te beveiligen tegen piraterij en illegaal kopiëren dan woordenboeken op cd-rom. Dat is voor commerciële lexicografische bedrijven (en dat is nog altijd de meerderheid) een niet te onderschatten nadeel: in de informatie-economie is beveiliging van de data cruciaal.
Ook is, in de tweede plaats, internetlexicografie commercieel wat omslachtiger dan de verkoop van cd-rom's: hoe betaalt de internaut voor de lexicografische informatie? Vermoedelijk is een abonnementssysteem, met bijvoorbeeld een forfaitair jaarlijks bedrag dat onbeperkte toegangsrechten tot het woordenboek verleent, het interessantste model. Betalen per opgezocht woord (het alternatieve model) zou de opzoekneiging vermoedelijk niet doen toenemen. Maar een abonnementssysteem vraagt ook om een identificatie van de gebruiker: intikken van een wachtwoord is het minste wat gevraagd wordt. Maar dan daalt het opzoekgemak weer drastisch …
In de derde plaats zijn internetverbindingen vooralsnog niet altijd even stabiel, en de opzoeksnelheid ligt onbetwistbaar lager dan bij een locaal geïnstalleerd woordenboek.

In de vierde plaats ten slotte zijn de technische mogelijkheden van het internetwoordenboek niet dezelfde als die van het woordenboek op cd-rom. Een dynamische index bijvoorbeeld (waarbij het zoekwoord kan verschijnen nog voor het helemaal ingetikt is), is niet eenvoudig te realiseren. Je moet je zoekopdracht eerst helemaal geformuleerd hebben voor de opdracht via het net verstuurd en op de server van het woordenboekenbedrijf uitgevoerd kan worden. Ook de interactie met tekstverwerkers is niet zo simpel als Moerdijk suggereert. Hij citeert Sanders, die beschrijft hoe het woordenboek vanuit de tekstverwerker geopend wordt: "Als men in een tekst bezig is, selecteert men een woord. Vervolgens drukt men op de gewenste knop. Daarop opent zich aan de onderkant van het scherm een venster met de door u gezochte informatie". Het is misschien ironisch, maar precies zo'n toepassing is wat moeilijker wanneer het woordenboek via het internet toegankelijk wordt gemaakt. Ieder op te zoeken woord zou dan immers al meteen een hyperlink moeten zijn !

Natuurlijk zijn er, omgekeerd, ook nog wel enkele nadelen van cd-rom's te noemen. Ruimtebeperkingen spelen via het internet een beperktere rol, toevoegen van nieuwe informatie gaat wat sneller (het woordenboek kan bij wijze van spreken permanent geüpdatet worden), en internetwoordenboeken maken het de lexicograaf makkelijker na te gaan hoe het woordenboek gebruikt wordt: een analyse van de uitgevoerde en op de server geregistreerde zoekacties maakt het mogelijk te bepalen welk type informatie het vaakst door de gebruikers gezocht wordt, of waar de opzoekmoeilijkheden zitten. Dit alles betekent echter alleen dat de keuze voor het woordenboek op cd-rom of het internetwoordenboek lang niet automatisch in het voordeel van dat laatste uitvalt: een genuanceerder beeld dan Moerdijk schetst is noodzakelijk.

Hoe ver staat de lexicografie van het Nederlands?

Laten we dan nu kijken naar het eerste argument van Moerdijk. Dat de meerwaarde die Sanders als facetten van "het ideale woordenboek" beschreven heeft, volstrekt niet afhankelijk is van het on line karakter van het woordenboek, blijkt onomstotelijk uit het feit dat de Grote Van Dale op cd-rom deze functies al voor het grootste deel realiseert.

Sanders schetst het beeld van een woordenboek dat uit twee delen bestaat: een functie om het woordenboek vanuit de tekstverwerker te raadplegen, en het eigenlijke woordenboek. Die eerste functie is voor de Grote Van Dale op cd-rom alvast geen probleem: via een knop in de tekstverwerker kan een geselecteerd woord rechtstreeks opgezocht worden. Sanders suggereert dat je in de tekstverwerker verschillende knoppen zou kunnen hebben voor spelling, betekenis, synoniemen, uitdrukkingen en spreekwoorden waarin het woord optreedt, etymologie. Veel extra functionaliteit levert dat natuurlijk niet op: als je, zoals in de Grote Van Dale op cd-rom, het woordenboek met slechts één knop opent vanuit de tekstverwerker, dan zie je in de kop of de hoofdtekst van het artikel meestal onmiddellijk de informatie die Sanders noemt.

In het eigenlijke woordenboek verwacht Sanders o.a. het volgende rijtje dingen, maar ook daarvan kun je telkens makkelijk laten zien dat ze in de Grote Van Dale op cd-rom aanwezig zijn:

"een overzicht van de structuur van een artikel": in de Grote Van Dale op cd-rom kunnen artikelen op verschillende niveaus van gedetailleerdheid bekeken worden. De gebruiker kan er bv. voor kiezen alleen de genummerde hoofdbetekenissen van het woord te bekijken, en de voorbeeldzinnen uit te schakelen. Artikelen kunnen op die manier op een flexibele manier, van grondig tot overzichtelijk, geraadpleegd worden;
"een uitgebreide hulpfunctie": de Grote Van Dale op cd-rom bevat een gedetailleerd, volledig geïndexeerd hulpbestand, en de gebruiker krijgt er nog een overzichtelijke en uitvoerige handleiding bij. Bovendien is er (zoals bij kwaliteitssoftware verwacht mag worden) een helpdesk waar de gebruiker met vragen terecht kan;

"een luidsprekertje dat laat horen hoe het woord klinkt": de Grote Van Dale op cd-rom bevat bij alle trefwoorden (behalve de afkortingen) uitspraak en uitspraakvarianten, en al deze uitspraken kunnen multimediaal ten gehore worden gebracht. Door de omvang van het trefwoordenbestand is de Grote Van Dale op cd-rom meteen het grootste uitspraakwoordenboek voor het Nederlands;

"het opnemen van de eigen uitspraak door een klik op een microfoonsymbooltje": dat kan niet, maar het is ook overbodig wanneer alle woorden al een uitspraak hebben gekregen. Wel kan de gebruiker zelf notities aanbrengen in zijn woordenboek, zoveel hij maar wil;

"alle woorden zijn door een hyperlink met elkaar verbonden": woorden die men in een definitie aantreft, kunnen met één enkele muisklik in het woordenboek opgezocht worden;

"zoeken door het hele woordenboek": het woordenboek combineert een alfabetisch woordenboek met een productiewoordenboek, d.w.z. een woordenboek waarin je (zoals in Het Juiste Woord van Brouwers) op zoek kunt gaan naar een woord op basis van de eigenschappen van dat woord. Anders dan bij Brouwers maakt de Geavanceerd Zoeken-functie van de Grote Van Dale op cd-rom niet alleen zoeken op basis van betekenissen mogelijk: je kunt ook zoeken op basis van de woordsoort, het stijllabel, de etymologie etc. van de woorden. Het woordenboek beantwoordt dus vragen als: "Wat is de munteenheid van Botswana?" of "Hoe heet iemand die de taal- en letterkunde van het Spaans bestudeert?". Deze functie is in een aantal opzichten sterker dan de "full text search" waar Sanders vermoedelijk aan dacht bij het formuleren van zijn ideaalbeeld. Alle informatie die in het woordenboekbestand gecodeerd aanwezig is (zoals bv. woordsoortinformatie), wordt bij een full text search niet ontsloten, omdat de relevante informatie niet als tekst in eigenlijke zin maar als code is opgenomen. In Geavanceerd Zoeken wordt deze informatie juist wel toegankelijk gemaakt voor de zoekfunctie. Een taalkundige bv. die zou willen weten welke adjectieven in het Nederlands met be- beginnen en op -erig eindigen, komt daar met Geavanceerd Zoeken in een oogwenk achter.

Daarbij moet nog opgemerkt worden dat de Grote Van Dale op cd-rom innoverende mogelijkheden bevat waar Sanders niet aan gedacht heeft. Meest opvallend is ongetwijfeld de functie Zoeken bij Benadering, die het mogelijk maakt om snel woorden te zoeken waarvan men de spelling niet kent. Wie bv. oberzjiene als zoekterm opgeeft, wordt feilloos naar aubergine gebracht. Het woordenboek gebruikt hierbij de uitspraakinformatie waarover het beschikt, om op zoek te gaan naar een trefwoord dat de vermoedelijke uitspraak van de onbekende zoekterm benadert.

De Grote Van Dale op cd-rom biedt, kortom, het grootste deel van wat Sanders als "het ideale woordenboek" beschrijft - en nog meer. Dat betekent natuurlijk niet zonder meer dat de Grote Van Dale op cd-rom het ideale woordenboek is. Aan de ene kant bevat hij nog niet echt álle mogelijkheden die Sanders noemt: m.n. vertalingen zouden een wezenlijke uitbreiding van de functionaliteit van het woordenboek kunnen vormen. Aan de andere kant is de informate in het woordenboek op enkele punten nog niet volledig aangepast aan het medium. Daar heeft Sanders zelf op gewezen in zijn Trefwoord-stukje over de bronvermelding bij de citaten: in bepaalde gevallen is de voornaam van de auteur wel opgenomen, in andere niet, en dat vergroot het opzoekgemak voor de woordenboekgebruiker niet. Doorslaggevend voor de bruikbaarheid van de Grote Van Dale op cd-rom is deze moeilijkheid ongetwijfeld niet, maar het is wel een schoonheidsfoutje dat weggewerkt moet worden.

Dat zal ook gebeuren: voor de vaktaallabeling en de taalregisterlabeling is nu reeds gezorgd voor een optimale afstemming tussen de bestaande woordenboektekst en de zoekmogelijkheden van de elektronische applicatie, en in een van de volgende jaarlijkse releases van de cd-rom zal dat ook voor Sanders z'n probleem gebeuren. Microsoft Office is per slot van rekening ook niet in een dag gebouwd. In het algemeen blijkt hieruit ook dat de digitalisering van het woordenboek op twee manieren kwaliteitsverhogend werkt: de applicatie brengt functionaliteit aan die in het papieren woordenboek ontbreekt, en tegelijkertijd vraagt die applicatie een graad van consistentie in de woordenboekgegevens die hoger ligt dan wat voor papieren woordenboeken noodzakelijk is.

Welke woordenboeken brengt het nieuwe millennium?


Maar laten we terugkeren naar de initiële vraag. Ook al is de Grote Van Dale op cd-rom nog niet het ideale woordenboek, het is wel al een woordenboek dat voor een zeer groot stuk de toekomst verwerkelijkt die Sanders en Moerdijk zich dromen. Dat betekent dat de vraag naar de lexicografische toekomst een andere focus moet krijgen dan de vraag die Moerdijk zich stelt: de keuze tussen het web en de cd-rom is niet de meest essentiële vraag voor verdere ontwikkeling van de lexicografie. Essentieel lijken mij wel twee ontwikkelingen te zijn waarvan de Grote Van Dale op cd-rom telkens reeds een goed voorbeeld is: de ontwikkeling naar slimme woordenboeken, en de ontwikkeling naar tentaculaire woordenboeken.

Het slimme woordenboek is het woordenboek dat technologie (en a fortiori taaltechnologie) gebruikt om meerwaarde te creëren voor de gebruiker. In de Grote Van Dale op cd-rom gebeurt dat uiteraard in het algemeen door het gebruik van algemene indexerings- en opzoektechnologie, maar daarnaast meer specifiek door de inzet van taaltechnologie. Fonetische informatie i.v.m. de trefwoorden wordt bv. niet alleen gebruikt om spraaktechnologisch een hoorbare representatie te genereren, maar ondersteunt ook de Zoeken bij Benadering-functie, die het mogelijk maakt een woord te zoeken aan de hand van de vermoedelijke uitspraak.
Het tentaculaire woordenboek (neen, dat woord staat niet in Van Dale) is het woordenboek dat zijn tentakels naar allerlei richtingen uitstrekt: de Grote Van Dale op cd-rom is een combinatie van een reeks gespecialiseerde woordenboeken: naast het alfabetische woordenboek bevat het ook een anagrammenwoordenboek, een retrograde woordenboek, een rijmwoordenboek, en een positiewoordenboek dat een antwoord biedt op vragen als: "Bevat het Nederlands woorden van twintig letters met op de derde plaats een a en op de negende en de tiende plaats een medeklinker?". En vooral, het woordenboek combineert een alfabetisch woordenboek met een productiewoordenboek.

Verdere ontwikkelingen van de lexicografie lijken in eerste instantie versterkingen te zullen zijn van deze twee tendensen. De zoekmogelijkheden zullen nog verder vergroot worden: functies die in de wereld van de zoekmachines bekend staan als "query by example" en "natural language query" zouden de vooraf gestructureerde Geavanceerd zoeken-functie kunnen aanvullen. (Moerdijk vermeldt overigens zelf ook een van deze mogelijkheden.) Je moet aan het woordenboek rechtstreeks vragen kunnen stellen van het type "Wat is de munteenheid van Botswana?" of "Geef me een bargoens woord met de betekenis borrel", zonder dat je iets anders dan deze zinnetjes hoeft in te tikken. Geavanceerd Zoeken geeft nu reeds een antwoord op deze vragen, maar het stellen van de vragen kan op een intuïtievere manier gebeuren.

En verder zal het woordenboek zijn bereik nog uitbreiden, zodat het een omvattend referentiewerk voor woordenschatkwesties wordt: op vertaalinformatie hebben we al gewezen, maar je kunt ook denken aan expliciete taaladviezen en stijlwenken, aan een koppeling van het woordenboek aan een grammatica, aan uitgebreidere informatie over de geschiedenis van de woorden, of eventueel aan een integratie van het woordenboek en een encyclopedie.

Wie een eerlijke vergelijking maakt met de buitenlandse voorbeelden, zal moeten toegeven dat de Nederlandse lexicografie, met de Grote Van Dale op cd-rom, al een heel eind gevorderd is op het pad van het slimme en het tentaculaire woordenboek - verder in ieder geval dan wat gemiddeld in het buitenland gebeurt. Voor de lexicografie van het Nederlands is de toekomst al helemaal begonnen.

Dirk Geeraerts
Hoogleraar Algemene Taalwetenschap aan de KU Leuven
Hoofdredacteur van de Grote Van Dale op cd-rom

Powered by Plone