Blog

Data doen duizelen

Het is vrijdagochtend 16 augustus 2019, de ochtend na een super inspirerende bijeenkomst van colLABorate; de nieuwe innovatiebroedplek bij Cubiss. Het thema was bibliotheken en datawetenschappen. Ik heb al tegen 4 collega’s met verwondering verteld over deze bijeenkomst. Het onderwerp laat me namelijk niet los. Natuurlijk had ik wel eens gehoord over datawetenschappen, bij Cubiss hebben we zelfs meerdere projecten lopen. Natuurlijk weet ik een heleboel over mediawijsheid, dat is één van de hoofdthema’s bij Cubiss. Natuurlijk weet ik veel over online privacy, afgelopen week volgde ik nog de data detox (aanrader!). En toch….het gaat nóg verder dan ik al dacht te weten. 

Patronen en algoritmes 

Ons menselijk brein is heel goed in het herkennen van patronen. Dat maakt dat de wereld overzichtelijk wordt voor ons. Zo hoeven we bijvoorbeeld niet meer na te denken over activiteiten als het smeren van een boterham; bord uit kast pakken, brood, beleg, smeren enz, dat gaat allemaal vanzelf en kost ons weinig energie. Datawetenschap is bezig met het creëren van machines die patronen herkennen. Uit een hele grote bak met data vindt ‘classificatie’ plaats, uit mijn voorbeeld: deze groep data behoort tot; ‘beleg’. Algoritmes voorspellen vervolgens de volgende stap; na ‘bord pakken’ komt er vast ‘brood pakken’, dit heet ‘regressie’. De data maakt ook clusters, zoals; deze data behoort tot de activiteit; ‘smeren’. Tot zo ver was het voor mij prima te snappen, het werd echt interessant toen we in gesprek raakten over de implicaties.  

Waar zit de ethiek?

Patronen kunnen heel behulpzaam zijn, maar weet je nog wel wat er gebeurt wanneer je machine- en deeplearning gaat toepassen? Recent was er in het nieuws dat er een algoritme was dat sollicitatiebrieven selecteerde op basis van de etnische achtergrond van de kandidaat. Dat is in strijd met de wet, maar je weet niet altijd welke redeneringen een algoritme maakt. Het kan zijn dat data incompleet is, dan krijg je een algoritme dat een vooroordeel heeft. Hier komt ethiek om de hoek kijken. Een interessante vraag is; waar zit de ethiek? In het algoritme of in de mens die ermee omgaat? Hans van Duijnhoven tipte ons in dit kader de interessante Netflix documentaire: The Great Hack. Frederik Theuwis speelde een aantal confronterende spelletjes met ons. Stel je programmeert zelfrijdende auto’s en de auto bevindt zich in de situatie dat hij óf 5 volwassenen doodrijdt, óf 2 volwassenen en 3 kinderen. Wat kies je? Bizarre keuzes natuurlijk, want er zijn honderden redeneringen mogelijk voor beide keuzes. What to do…..als programmeur bij Tesla...het deed mijn brein kraken in ieder geval.  

Datawetenschap en de bibliotheek

We waren met een kleine groep van 15 personen, daardoor was er veel ruimte voor discussie. Datawetenschap is niet iets voor bibliotheken zelf, daar was iedereen het wel over eens. Maar bibliotheekmedewerkers moeten wel leren hoe om te gaan met deze data. Jantien Borsboom van Bibliotheek Midden-Brabant experimenteert hier al volop mee. Zo koppelde zij een community van lokale ICT-ers aan een lokale milieugroepering. In de bibliotheek werd een workshop gehouden om zelf meetstations te maken die de deelnemers in hun eigen tuin hangen. Hiermee wordt zeer lokaal de temperatuur bijgehouden. De bibliotheek kreeg de gemeente zo ver te sponsoren en de monitor van de stad wordt nu getoond in het Future Lab van de Lochal.   

De bibliotheek kan een goede plek zijn waar geïnteresseerden en wetenschappers samen komen om maatschappelijke vragen te kraken. Samen kan er gekeken worden hoe datawetenschap kan helpen om die vragen op te lossen. In Tilburg is het door dit bevolkingsonderzoek nu mogelijk om veel specifieker te zien in welke wijken de hitte langer blijft hangen. Zo kan de gemeente veel gerichter actie ondernemen. Het is niet zinvol om zomaar in het wilde weg data te gaan analyseren. De vraagarticulatie is heel belangrijk. En juist daarin specialiseert de bibliotheek zich de laatste jaren steeds meer: namelijk in het ophalen van vragen.  

Het is maar spel...

We sloten de avond af met design researcher Julia Janssen, onthoud deze dame, want ik heb nog niet eerder meegemaakt dat iemand me de issues rondom data en privacy zo treffend liet ervaren. Één van de spellen was een fruitautomaat, dit vind ik dus echt een vreselijk stom spel. Wat denk je….binnen één minuut ‘betaalde’ ik met mijn persoonlijke data om maar dit spel te kunnen spelen. Mijn seksuele geaardheid, relatiestatus, medicijngebruik, alles! 

En hierover sta ik dus te praten met mijn collega’s op vrijdagochtend. En ook zij komen met allerlei verhalen over vreemde (online) ervaringen met online data. Zoals instagram-ads over iets waar je net over gesproken hebt terwijl je telefoon in de kamer lag. Het mooie is dat dit soort bijeenkomsten me bewust maken. Maar ik bevind me nu in de fase van bewust onbekwaam, en ik kan nu niet meer terug naar mijn ‘veilige’ onbewuste onbekwaamheid. Bibliotheken, ik ben erg benieuwd hoe datawetenschap zich de komende jaren gaat ontwikkelen voor de branche. Zullen we samen op ontdekking gaan?

Naar overzicht Actueel en Blogs >>