Volksverhaalonderzoeker Theo Meder: "Bestaat er een universele verhaalgrammatica?"

Dit jaar starten op het Meertens Instituut een aantal projecten met een opvallende gemene deler: ze maken gebruik van de techniek om op een structurele manier onderzoek te doen naar verhalen en liederen. Dit onderzoek valt binnen de e-humanities, een tamelijk nieuwe tak van wetenschap. De onderzoekers hopen dat de computer ze straks veel werk uit handen gaat nemen.

door Mathilde Jansen

“Het is een breuk met het onderzoek tot nu toe. Voorheen onderzochten we de betekenis en de functie van een verhaal in zijn context. Vragen over de betekenis van een verhaal kun je niet beantwoorden met de computer.” Aan het woord is Theo Meder, projectleider van het door NWO toegekende project Folktales as Classifiable Texts (FACT). Het voornaamste doel van dit project is het automatiseren van de volksverhalenbank.

“De volksverhalenbank telt inmiddels 41.000 verhalen. Dat lijkt misschien veel, maar liever zouden we er veel meer hebben. Er liggen ook nog genoeg verhalen om ingevoerd te worden. De bottleneck is alleen dat handmatige invoeren. Doordat elk verhaal opnieuw moet worden geclassificeerd (Is het een mop, een sage of een raadsel?), van trefwoorden en van een samenvatting moet worden voorzien, duurt het ontzettend lang. Als de computer dit straks automatisch kan doen, levert dat een enorme tijdwinst op. En dan kunnen we ons gaat concentreren op echt wezenlijke onderzoeksvragen, zoals Hebben verhalen altijd een zelfde structuur?, of nog mooier: Bestaat er een universele verhaalgrammatica?“

Mondelinge overlevering

Tegelijkertijd met FACT is ook het onderzoeksproject Tunes & Tales gehonoreerd bij de KNAW. Daarin wordt zowel de structuur van verhalen als liederen onderzocht. Meder: “Het moeilijke van volksverhalen is dat ze mondeling overgeleverd zijn. Dat betekent dat één verhaal op honderd manier doorgegeven kan zijn. Binnen Tunes & Tales willen we onderzoeken welke elementen van een verhaal altijd gelijk zijn in de overlevering, en welke variëren. Op die manier zouden we straks moeten kunnen voorspellen op welke manier verhalen worden overgeleverd. Het klinkt nu allemaal nog science fiction. Maar dat we van verschillende kanten subsidies hebben binnen gehaald, laat zien dat het realistische onderzoeksvragen zijn.”

Patroonherkenning

Binnen FACT zijn inmiddels een post-doc en een programmeur aangesteld. De post-doc zal zich voornamelijk bezighouden met het automatiseren van de volksverhalenbank. Dat betekent dat de computer getraind wordt om verhalen te voorzien van trefwoorden, namen te signaleren, samenvattingen te genereren, en taal en genre vast te stellen. De nog aan te stellen aio gaat zich richten op het identificeren en classificeren van verhalen: “De computer moet deze verhalen gaan identificeren door middel van patroonherkenning. Elk verhaal bestaat uit kleine informatie-eenheden, die we motieven noemen. Neem de volgende drie motieven in Roodkapje: A, Roodkapje komt bij grootmoeder; B, wolf eet Roodkapje op; C, jager snijdt buik van wolf open. Door deze motieven in de juiste volgorde – ABC – te plaatsen, krijg je het sprookje van Roodkapje. Nu kunnen we de computer leren om een tekst waarin hij de genoemde motieven in volgorde ABC tegenkomt, te identificeren als Roodkapje. Dit klinkt redelijk eenvoudig, maar vergeet niet dat er vele honderden sprookjes zijn, en dan ook nog eens duizenden verschillende sagen, legenden, moppen, broodjeaapverhalen…”

Hans en Grietje

“Sprookjes automatisch laten classificeren op basis van motiefstructuren klinkt nu nog als toekomstmuziek, maar je kunt je voorstellen dat het straks tot verrassende ontdekkingen kan leiden. Een mooi voorbeeld is de ontdekking die mijn collega Willem de Blécourt een paar jaar geleden deed. Decennialang braken onderzoekers van volksverhalen hun hoofd over de vraag waarom het sprookje van Hans en Grietje pas voor het eerst in de verhalen van de gebroeders Grimm voorkwam. Het zou immers veel ouder moeten zijn? De Blécourt toonde aan dat de motieven uit Hans en Grietje eigenlijk afkomstig waren uit een ander, veel omvangrijker sprookje, genaamd de Magische Vlucht. Daar werden een aantal elementen uitgehaald en daar werd de titel Hans en Grietje aan gegeven. De vraag is nu of de computer straks nog meer van dit soort overeenkomsten gaat vinden.”

Universele grammatica

De tools die worden ontwikkeld binnen de onderzoeksprojecten zouden behalve op de Nederlandse databanken ook toepasbaar moeten zijn op databanken in het buitenland, aldus de onderzoeker: “Je hebt bijvoorbeeld vergelijkbare volksverhalenbanken in België, in Portugal en Catalonië. Als we die databanken zouden kunnen koppelen zou dat veel nieuwe mogelijkheden geven voor onderzoek. Je kunt onderzoeken of verhalen een universele ‘grammatica’ volgen. In taal kun je met een beperkt aantal regels een onbeperkte hoeveelheid zinnen maken. Hetzelfde geldt eigenlijk voor verhalen. Uit onderzoek blijkt dat je binnen verhalen zo’n 40.000 motieven kunt onderscheiden, waarmee je een oneindige hoeveelheid verhalen kunt maken.”

“Dan kun je gaan onderzoeken of er een universele verhaalgrammatica bestaat. En dan zou je vooral op zoek moeten gaan naar tegenvoorbeelden. Zo schijnt er een stam te zijn in Zuid-Amerika, de PirahÃ£, die geen verhalen kent. In deze cultuur mag je alleen vertellen over dingen die jezelf zijn overkomen. Op fictieve verhalen vertellen ligt een taboe – maar het is niet zo dat ze verhalen niet snappen of niet aankunnen. En de Maori staan erom bekend dat ze warrige verhalen vertellen. Naar men zegt springen ze van de hak op de tak. Toch kan de onderliggende structuur van die verhalen nog steeds kloppen met ons concept van verhalen.”

Bezoek de Nederlandse Volksverhalenbank of de website van DOC Volksverhaal.

Dit artikel is verschenen in de digitale nieuwsbrief van het Meertens Instituut. Ook abonnee worden? Klik hier.