Nieuw in de collectie: Uncharted

Het kan een verslavend spelletje zijn, de Ngram-viewer van Google. In deze geavanceerde big data-zoekmachine is het mogelijk een historische lijn te ontdekken in woorden en begrippen. Hiervoor wordt gezocht in de miljoenen  gescande boeken die zich bevinden in Google Books. Typ in: “Amsterdam, Rotterdam” en de zoekmachine produceert een grafiekje waaruit direct naar voren komt dat Amsterdam in de afgelopen vijftig jaar ongeveer vier keer zo vaak werd genoemd als Rotterdam. Een andere zoekopdracht leert dat het woord ‘typemachine’ na een dieptepunt in 2002 weer vaker gebruikt wordt. Het gebruik was in 2008 (verder gaat de viewer nog niet) terug op het niveau uit het begin van de jaren tachtig.

Commercieel instrument

Big data is veel meer dan een spelletje. Het is een machtig commericeel instrument (denk aan Amazon, Facebook) en wordt door allerlei partijen ingezet om trends te onderzoeken of te voorspellen. Sinds enige tijd is bekend dat ook nationale veiligheidsdiensten hevig in de materie zijn geïnteresseerd.

Nuttig middel

Erez Aiden en Jean-Baptiste Michel waren betrokken bij de ontwikkeling van de Ngram-viewer. In hun boek Uncharted laten ze zien dat de zoekmachine – en big data in het algemeen – ook een buitengewoon nuttig middel kan zijn in de wetenschap. Het geeft snel en gedetailleerd antwoord op vragen als: Hoe snel verspreidt nieuwe technologie zich? Is Jezus populairder dan de Beatles? Hoe snel verandert grammatica?

De schrijvers laten ook zien dat het altijd nodig is om de resultaten in hun verband te zien en te nuanceren. Zo wordt er voor de Ngram-viewer nog niet gezocht in het Nederlandse deel van internet, zijn er nog heel veel boeken niet gescand, en is niet altijd goed te achterhalen of bepaalde periodes onderbedeeld zijn. “Soms wil je een grafiek bekijken,” schrijven Aiden en Michel tot besluit van hun boek, “en soms wil je een boek lezen.” Hun voorstel? Probeer het allebei.

Uncharted : big data as a lens on human culture
door Erez Aiden en Jean-Baptiste Michel
ISBN 978-1-59448-745-3

Een bijdrage van Diedrik van der Wal in de nieuwsbrief van het Meertens Instituut, juni 2014.