Kunstmatige intelligentie moet cultureel bewust worden

Samen met een aantal kennis- en erfgoedinstellingen bouwt het Meertens Instituut momenteel het Cultural AI Lab. Gezamenlijk gaan deze partijen de mogelijkheden van kunstmatige intelligentie inzetten voor cultureel onderzoek en de techniek bewustmaken van de culturele context. Zo worden er onder meer nieuwe tools ontwikkeld voor de erfgoedsector.

door Mathilde Jansen

Hoe maak je kunstmatige intelligentie cultureel bewust? Om dat te onderzoeken is er sinds kort een nieuw lab gestart binnen het KNAW Humanities Cluster waar het Meertens Instituut deel van uitmaakt. Voor vijf onderzoeksprojecten is inmiddels financiering binnen, dus de komende periode zal een nieuw team van jonge onderzoekers van start gaan. In al deze projecten wordt gewerkt aan tools die werken op basis van artificiële intelligentie (AI). De data van de betrokken erfgoedinstellingen vormen de input. De AI-tools die hiermee ontwikkeld worden moeten recht doen aan de complexiteit van de menselijke cultuur.

Kwetsende terminologie

Een voorbeeld zijn termen die in museumcollecties voorkomen, maar in onze huidige tijd niet meer gebruikt worden omdat ze discriminerend zijn. “Het Rijksmuseum heeft in 2015 alle bordjes vervangen. Woorden als ‘hottentot’ zie je nu niet meer terug”, zegt Marieke van Erp. Zij is projectleider Cultural AI bij het KNAW Humanities Cluster. “Maar in een archief met boeken van 200 jaar oud, kun je dat woord niet uitvlakken.”

In dat gigantische archief zullen meer termen voorkomen die tegenwoordig als kwetsend worden ervaren. Met automatisch lerende systemen willen de onderzoekers deze termen opsporen. De computer krijgt dan kwetsende woorden die we kennen aangereikt. Vervolgens krijgt hij de opdracht om die woorden op te sporen in de dataset en de context eromheen te bestuderen. “Op die manier leert de computer zulke contexten herkennen. En dan kun je hem vergelijkbare stukken tekst laten vinden waarin relevante termen staan die we nog niet op het spoor waren.”

Bij de ontwikkeling van de tools is de interactie met musea cruciaal, benadrukt Van Erp, want de computer moet nog wel op weg geholpen worden om die culturele context te interpreteren. “Bij dit project hebben we een stukje van het budget gereserveerd om een interface te maken waarin museumcuratoren kunnen werken. Zodat ze bij tekstpassages met een vlaggetje kunnen zeggen: klopt, dit is kwetsende tekst en dit moet anders.”

Bias van het algoritme

Vervolgens kunnen de musea kiezen of ze teksten willen herformuleren, of dat ze meerdere perspectieven naast elkaar plaatsen. “Het Tropenmuseum doet er alles aan om mensen óók het oude perspectief te laten zien. Zo dachten we er toen over, en nu niet meer.” De eindverantwoordelijkheid ligt dus bij de expert: “Het is niet verantwoord om de computer die keuzes te laten maken, want als je algoritmes maakt op gebiaste data krijg je nog meer bias.”

De bias van het algoritme, daar zijn de onderzoekers heel alert op. “Onze collega’s van het Centrum voor Wiskunde en Informatica (CWI) hebben daar gelukkig al veel ervaring mee. En we proberen altijd zo inzichtelijk mogelijk te maken wat we doen. Niet maar één algoritme in één setting uitproberen, maar verschillende. Tegelijkertijd hebben we natuurlijk allemaal onze aannames. Je kunt dat nooit helemaal wegfilteren, zo zitten wij als mens nou eenmaal in elkaar. Maar je kunt wel je best doen om het te verbeteren en dat proberen we bij deze systemen ook.”

Gevoelige informatie

Net als het Rijksmuseum is ook de KB een van de partners in dit project. Deze heeft bijvoorbeeld regels opgesteld hoe zij om willen gaan met AI intern en naar buiten toe. Zij zijn daar al een tijd mee bezig als een cultureel-erfgoedinstelling met een grote hoeveelheid data, vertelt Van Erp: “Bijvoorbeeld in de manier waarop ze kranten beschikbaar stellen: bepaalde kranten die uitkwamen in de Tweede Wereldoorlog zijn niet online beschikbaar, omdat er gevoelige informatie over personen in staat. Die kun je niet bekijken via Delpher, maar daarvoor moet je naar de bibliotheek.”

Het Cultural AI Lab kijkt verder dan de eerste AI-projecten, waarin ook samengewerkt werd met erfgoedpartners en commerciële partijen als nu.nl. Antal van den Bosch, die ook meebouwt aan het lab: “Op de langere termijn beogen we met het Cultural AI Lab te doen waar de grote technologiebedrijven nog altijd geen stappen in hebben gezet: om informatiesystemen gevoelig te maken voor de culturele achtergrond waarin alle data is ontstaan. Dat kan alleen door de geesteswetenschappen, erfgoed en AI-ontwikkelaars bijeen te brengen.”

Afbeelding: Rijksmuseum Research Library (Door Hajotthu – Eigen werk, CC BY 3.0)