29 mei 2012

Vrijwilligers maken oude teksten toegankelijk

Sinds 2007 is een groep van circa 100 vrijwilligers onder leiding van Nicoline van der Sijs van het Meertens Instituut en Hans Beelen van de Universiteit van Oldenburg bezig met het digitaliseren van gedrukte Nederlandstalige teksten uit de 15e tot en met de 19e eeuw.

Omdat deze in gotisch schrift zijn gezet, kunnen ze niet worden gelezen met OCR. Al het materiaal wordt daarom met de hand getranscribeerd. Voor dit omvangrijke ‘crowd sourcing’-project is de Stichting Vrijwilligersnetwerk Nederlandse Taal (SVNT) opgericht.

Inmiddels is een groot aantal vaak zeer omvangrijke teksten getranscribeerd, naast laatmiddeleeuwse en vroegmoderne bijbelvertalingen ook enkele teksten van taalkundig, literair en of taalhistorisch belang (psalberijmingen, woordenboeken, spreekwoordenverzamelingen). Alle teksten worden gepubliceerd bij de DBNL; de bijbelvertalingen zijn bovendien met de fotoscans te bekijken op de website van het NBG. Op de site biblija.net kunnen alle gedigitaliseerde bijbels, daaronder de eerste druk van de Statenvertaling van 1637, vers voor vers en hoofdstuk voor hoofdstuk met elkaar worden vergeleken.

In mei 2012 zijn weer vijf nieuwe teksten die van belang zijn voor historisch, taalkundig en letterkundig onderzoek, toegevoegd aan de al bij DANS gedeponeerde set. Naast de Vorstermanbijbel uit 1528/1531 en het Nieuwe Testament van Jan Utenhove uit 1556 zijn dat drie ‘wereldlijke’ teksten. De omvangrijkste is het Huishoudelyk woordboek van Noël Chomel uit (1743): deze tweedelige encyclopedie uit de achttiende eeuw telt maar liefst 1500 pagina's en is vertaald uit het Frans. Het boek geeft overvloedige informatie over een groot aantal praktische huishoudelijke zaken: recepten, tips voor de gezondheid van mens en vee, tuinieren etc. Dit woordenboek geeft een indringend beeld van de 18e-eeuwse kennis en mentaliteit en is daarmee van belang voor iedereen die zich bezighoudt met deze periode.

De Barbarologia van Salomon van Rusting uit (1733) is een voor de taalhistorie zeer boeiend woordenboek. Het bevat informatie over de manier waarop eind 17e-begin 18e eeuw Franse en Latijnse leenwoorden verbasterd werden door het ‘gewone’ volk. Sommige verbasteringen zijn nog steeds herkenbaar, zoals besoer als verbastering van bonjour, of rinneweren voor ruïneren. Na de woordenlijst volgt een ‘kroeg-praatjen’ waarin de verbasterde woorden in context worden getoond.

Tot slot is het oudste zeemanswoordenboek van het Nederlands getranscribeerd, de Seeman van Wigardus à Winschooten uit 1681. Hieraan toegevoegd is de 19e-eeuwse bewerking van Jacob van Lennep uit 1856, inclusief toevoegingen van T. Pan uit 1857.
Dankzij deze nieuwe teksten bedraagt het door de SVNT getranscribeerde corpus inmiddels een kleine 15 miljoen woorden.