Publicatiedatum: 5 oktober 2012
Duizenden gekaapte brieven toegankelijk voor iedereen
door Mathilde Jansen
In 1980 werden ze bij toeval ontdekt in het nationale archief in Londen: duizenden handgeschreven brieven, afkomstig van Nederlandse schepen die in de zeventiende en achttiende eeuw waren buitgemaakt door de Engelsen. Uniek onderzoeksmateriaal voor zowel historici als taalkundigen, aangezien er uit deze periode weinig persoonlijke documenten zijn overgeleverd.
Tot nu toe was slechts een klein deel van deze brieven door onderzoekers gepubliceerd, bijvoorbeeld in de Brieven van de maand bij het Leidse project Brieven als buit. Daar komt nu verandering in: dankzij het werk van een groot aantal vrijwilligers komen volgende week alvast 3000 getranscribeerde brieven voor iedereen beschikbaar op internet. Voor het eind van het jaar komen daar nog eens even zoveel bij. Dat is niet alleen goed nieuws voor onderzoekers, ook geïnteresseerde leken kunnen op de website terecht om bijvoorbeeld meer te weten te komen over hun familiegeschiedenis.
Verkortingen
110 vrijwilligers werken sinds 1 december 2011 aan het transcriberen (nauwkeurig overtikken) van de brieven. Daarin worden ze begeleid door Nicoline van der Sijs, onderzoeker op het Meertens Instituut: “De meeste vrijwilligers hadden wel enige ervaring opgedaan of een geschiedenis waardoor ze de moeilijk leesbare handschriften konden lezen. Een klein groepje van tien mensen met veel expertise heeft de correctie gedaan: zij hebben enorm veel werk verricht.” Met een op het Meertens Instituut ontwikkelde ‘editor’ konden veel mensen tegelijk aan de brieven werken. Een dergelijke grootschalige vorm van ‘crowdsourcing’ , waarbij het publiek betrokken wordt bij het onderzoek en taken verricht waarvoor onderzoekers binnen hun werktijd geen mogelijkheden hebben, is voor Nederland relatief nieuw.
Wat de documenten zo moeilijk leesbaar maakt, is niet alleen de slordigheid (of onervarenheid) van de handschriften en de slechte staat ervan (veel brieven zijn opgerold geweest, incidenteel zitten er gaten in), legt de onderzoekster uit, maar ook het grote aantal verkortingen in de teksten: “De vrijwilligers hebben enorm hun best gedaan om uit te zoeken waar die verkortingen voor staan. In de transcripties zijn de vertalingen altijd tussen haakjes geplaatst, zodat je kan zien dat het een interpretatie is. Zo wordt DGG vaak gebruikt voor de vaste formule D(ie) G(od) G(eleide), en gebruikt men m. voor zowel de oude vochtmaat muts als de landmaat morgen, maar ook voor merk en maakt: “Het kan soms een heel gepuzzel zijn om uit te vinden wat er is bedoeld.”
Metadata
De vrijwilligers hebben niet alleen de brieven vertaald, maar ook zogenaamde metadata toegevoegd. Dat zijn gegevens als jaartal, tekstsoort, afzender en geadresseerde. Die metadata vergemakkelijken het doorzoeken van de brievendatabank, zodat iedereen zijn eigen vragen op het materiaal kan loslaten. Van der Sijs: “Je kunt zeggen: geef mij alle brieven en zet ze in chronologische volgorde of: geef mij alle brieven van een bepaald schip, van een bepaalde afzender of naar een bepaalde kapitein gestuurd.”
Er zijn wel eerder brieven getranscribeerd en toegankelijk gemaakt voor het grote publiek, maar nooit in deze orde van grootte. Bovendien gaat het vaak om fragmenten uit de brieven, waarbij vooral veel achtergrondinformatie wordt gegeven. Van der Sijs: “Ons doel was om de totale hoeveelheid beschikbare scans te ontsluiten, zowel aan de hand van een transcriptie als metadata, zodat leken en onderzoekers geen moeilijke handschriften meer hoeven te lezen en snel door de gegevens kunnen zoeken.”
Taalgebruik
Op het Meertens Instituut zal dit corpus in ieder geval geïntegreerd worden in Nederlab: een database waarin alle gedigitaliseerde teksten die van belang zijn voor de geschiedenis van de Nederlandse taal en cultuur bij elkaar worden gebracht. Daarmee kan een taalwetenschapper straks bijvoorbeeld onderzoeken in hoeverre het taalgebruik van deze handgeschreven egodocumenten uit de 17e en 18e eeuw verschilt van gedrukte teksten uit diezelfde periode.
Van der Sijs: “Nu we zo’n groot tekstbestand hebben, kunnen we het taalgebruik daarvan ook vergelijken met dagboeken of egodocumenten die zijn geschreven door Nederlanders die zich op andere continenten hebben gevestigd. In het vroegere Nieuw-Amsterdam (New York) zijn bijvoorbeeld veel documenten bewaard gebleven. Is het taalgebruik van Nederlanders in de VS veranderd, en zo ja: in welke opzichten en hoe snel is dat gegaan? Tegenwoordig bestaan er computerprogramma’s die de verschillen en overeenkomsten in teksten kunnen vinden, mits de tekstbestanden maar groot genoeg zijn. Ik ben heel erg benieuwd wat dit soort tekstvergelijkend onderzoek in de toekomst aan nieuwe inzichten gaat opleveren.”
Zakelijke post
Het beschikbaar gekomen (onderzoeks)materiaal is heel gevarieerd van aard. Zo is ongeveer de helft van de brieven zakelijke post, weet de onderzoekster: “Denk aan vrachtbrieven en financiële overzichten, die bijvoorbeeld voor economisch historici relevant zijn. Er zijn ook hele plantagelijsten uit Suriname met informatie over kasboeken, hoeveel negers er waren, hoeveel ze daarmee verdienden. Het is niet zo dat we daar nu helemaal niets over weten, maar dit is wel een heel mooie aanvullende bron.”
Ook zijn de brieven geschreven door mensen uit alle lagen van de bevolking. Het corpus bevat behalve brieven van en naar bemanningsleden van het schip, ook correspondentie daarbuiten, legt Van der Sijs uit: “Denk bijvoorbeeld aan iemand die een plantage had in de Oost en daar tijdelijk woonde. Wanneer hij een brief wilde sturen aan zijn familieleden gaf hij die mee aan de kapitein van het schip: ‘U vaart nu terug naar Enkhuizen? Neem dan deze brief voor mijn vrouw mee’.”
Andere talen
Overigens ligt er nog een schat aan materiaal in de archieven in Kew (Londen). Er zijn nu 9000 scans in Nederland (waarvan er zo’n 6000 worden ontsloten; op de rest staat geen tekst), maar de overige brieven zijn nooit gefotografeerd. Om hoeveel brieven het gaat is niet precies bekend, aldus Van der Sijs: “Er worden altijd getallen genoemd van 38.000, maar dat is een schatting. Die schatting komt van Roelof van Gelder, die destijds een inventarisatie heeft gemaakt. Hij heeft dat heel serieus gedaan, maar hij heeft bijvoorbeeld geen dozen opengemaakt waarop staat dat ze afkomstig zijn van Deense of Franse schepen. We weten dat in die dozen vaak ook Nederlandse teksten zitten.”
“De brieven die wij nu hier hebben zijn ook voor een deel Duitstalig, Franstalig, Spaanstalig, Italiaanstalig. Die komen niet allemaal onmiddellijk op de website: het corrigeren daarvan is wat lastiger omdat we minder vrijwilligers hebben die die handschriften kunnen lezen. Maar begin volgend jaar hopen we toch zeker al het materiaal beschikbaar te hebben gemaakt.”
Lees ook: Wat zijn gekaapte brieven en waarom zijn ze door vrijwilligers overgetikt? De vraag van de maand in de nieuwsbrief van juli.
Dit artikel is verschenen in de digitale nieuwsbrief (oktober 2012) van het Meertens Instituut. Ook abonnee worden? Klik hier.