Grote gegevens. Part One.

Picture with data

Hi, I’m Science Fiction’. Pleased to meet you.

Mijn huidige studierichting heet ‘toegepaste informatica’ en als ik moet uitleggen wat ik dan juist studeer of in de les te zien krijg, moet ik vaak de term ‘Big Data’ laten vallen. Het is niet alleen een term, het is ook gewoon een vak binnen onze opleiding. Een waar ik, als het dan verder moet uitleggen, vaak ook moeite mee heb. Vandaag dus een (relatief) kort verhaal, een eerste deeltje, voor zij die een beeld willen op wat ‘big data’ nu juist is. Er zijn namelijk geen volledig juiste of eenvoudige definities van wat Big Data nu juist inhoudt of wat als Big Data omschreven mag worden.

De term op zich klinkt enorm fancy en misschien zelfs futuristisch? Het is een buzzwoord zoals ‘Blockchain’ of ‘Quantum Computing’. Toch gaat er meer schuil achter die term dan je misschien zou vermoeden. We beginnen met een tastbaar voorbeeld, maar eentje dat de ogen toch al vaak doet opengaan. Zegt de film ‘Minority Report’ u wat? Een politie eenheid uit de toekomst (geleidt door mr. Cruise himself) die enkele ‘helderzienden’ gebruikt om toekomstige misdaden tegen te gaan. Ze krijgen zogezegd een kijk enkele minuten of uren in de toekomst en kunnen daardoor de misdaad stoppen, de dader in kwestie oppakken en berechten voordat er een slachtoffer gemaakt is. Goed script denken we dan, maar momenteel gebeuren dit soort zaken al in steden als Washington. Niet dat stukje van de helderzienden uiteraard..

De lokale politie van Washington verzamelde gegevens van álle misdaden die ooit begaan zijn in hun buurt. Wanneer, waar, door wie, welk soort misdaad, afloop, door wie gemeld, hoe warm was het op die moment, hoeveel volk liep er toen rond, … je kan het zo gek niet bedenken of het wordt toegevoegd aan de databank. Op basis van al die verzamelde gegevens kan de politie gaan voorspellen hoe groot het risico is op een nieuw delict. En het werkt. Met dat nieuw ‘risicoprofiel’ kan de politie dan aan de slag gaan. Is er een grote kans dat op de volgende feestdag bij een metrostation iets zal gebeuren? Dan spelen ze daarop in door bijvoorbeeld extra agenten naar de buurt te sturen. Preventief.

Misdaden in Washington

Het moet wel gezegd worden dat je, om zo’n voorspellingen mogelijk te maken, veel data nodig hebt. In een stad als washington is dat echter geen probleem en na de onthullingen van ene Edward Snowden kijken we van niets meer op in de USA (er wordt ondenkbaar veel verzameld). Dichter bij huis gebeurt het echter ook. In Nederland is er een zelfde experiment aan de gang in Eindhoven. Ordediensten houden daar sinds enkele jaren een buurt in de gaten die berucht is voor zijn knokpartijen en overlast. En ook daar wordt met alles rekening gehouden en wordt alles opgeslagen, tot welke kleur de straatverlichting heeft en welke muziek er aan het spelen is op de momenten dat het uit de hand loopt.

Uw digitale dubbelganger

Die voorbeelden zijn misschien een nogal ‘ver van uw bed show’. Nog dichterbij dan, vlakbij zelfs, net voor u. Uw computer of smartphone. Weet u wat een cookie is? (de niet eetbare variant, wel te verstaan). Het zijn kleine tekstbestandjes die op jou computer opgeslagen worden. Wie slaagt ze daar op? Iedereen. Wel, toch bijna iedereen. Zo goed als elke site werkt met cookies, omdat ze willen weten wie je bent en wat je interesses zijn. Ze willen je beter rondleiden op hun site, maar je er natuurlijk ook zo lang mogelijk vasthouden. (Lees: aandacht is macht.) Door die cookies kan men enorm veel van je te weten komen. Er wordt als het ware een digitale versie van jezelf gemaakt. Zo bouwen ze een virtueel profiel voor iedereen op. Lees je veel artikels over het klimaat, sport, een bepaalde politieke stroming, … Zocht je onlangs naar meubels of een bepaald boek. They are in the know.

Zelfs als je me nu wil vertellen dat je altijd anoniem surft of regelmatig je gechiedenis wist, veel haalt het niet uit. Ze kunnen je ook herkennen via je ip-adres, zelfs de manier waarop je typt! Een bepaalde letter snel of traag typen, een toets die af en toe blijft hangen, je muisbewegingen, alles wordt gevolgd en meer hebben ze niet nodig om je te identificeren. En zo wordt je in een categorie gegooid, een groene Gentenaar, een liberale voetbalgek of een conservatieve autoliefhebber. Het zijn die vaak enorm diepgaande profielen waar adverteerders grof geld voor willen betalen. Ze betalen om hun product of boodschap bij de juiste mensen te krijgen. Er zijn hele onlineveilingsystemen die zich daarmee bezig houden. Het kopen en verkopen van gegevens en gebruikersprofielen.

De grootste verzamelaar is u sowieso wel bekend. Google is met een straatlengte voorsprong de koploper op de “informatiemarkt”. Zij bezitten namelijk enkele van de meest gebruikte tools ter wereld, te beginnen met de moeder-der-zoekmachines. Daarnaast hebben ze ook Gmail, Youtube, GoogleMaps, … Als je dacht enkel heel close te zijn met je eigen partner, wel dan is er nog iemand die jou beter kent dan je denkt. Maar uiteraard kunnen we ook niet verder zonder Facebook even te benoemen. Zij doen zelfs de claim je béter te kennen dan je partner. Door al die likes en comments te combineren met jou persoonlijke gegevens, maar ook door wat bv. je vriendenkring op Facebook doet komen ze enorm veel te weten over jou, je achtergrond, politieke- en seksuele voorkeur, leeftijd, gezondheid, sociaaleconomische positie, you name it. (… they know it.)

“Goh ze mogen het weten, ik heb niks te verbergen”, hoor ik sommigen onder u denken. Het gevaarlijke is echter dat als ze weten wat je denkt door je reacties, posts en likes, ze je ook kunnen gaan sturen. Het is bewezen dat Facebook de kracht heeft om gevoelens en opinies te sturen (Kramer, Guillory & Hancock, 2014). Facebook kan je in een bepaalde stemming brengen, het laat je bv. enkel negatief nieuws zien en laat positieve commentaren of leuke reacties van vrienden weg en geeft ze een lage prioriteit. Of het kan je ook positief sturen door je grappige memes, geestige opmerkingen of opbouwende nieuwsberichten te tonen. Facebook brengt jou in de stemming om je dan een advertentie te tonen. 

Vrij schadeloos als een ander shampoomerk u wil overtuigen, iets gevaarlijker als een bank je iets wil wijsmaken en helemaal angstaanjagend wanneer de verkeerde partij of presidentskandidaat deze techniek aanmeet. En vergis je niet, winst is de grootste drijfveer voor Facebook, wat Zuckerberg ook zegt, zijn daden zijn duidelijk. Wie met de grootste zak geld over de brug komt zal altijd voorrang krijgen.

“Everything we do in the digital realm – from surfing the Web to sending an e-mail to conducting a credit card transaction to, yes, making a phone call – creates a data trail. And if that trail exists, chances are someone is using it – or will be soon enough.” – Douglas Rushkoff

Author of Throwing Rocks at the Google Bus

We geven zo enorm veel van onszelf weg, maar aan welke prijs.

Gezondheidszorg gepersonaliseerd,

Ook in de gezondheidszorg begint Big Data ingeburgerd te raken. Medicijnen en behandelingen worden meer en meer gepersonaliseerd. Artsen leren de mensen die ze voor zich krijgen beter in kaart te brengen dan vroeger. Er bestaan vaak meerdere medicijnen voor een bepaalde ziekte en een dokter kan dan inspelen op welk medicijn in welk individueel geval het best zal werken.

Daarnaast wordt ook in de ontwikkling van medicatie Big Data ingezet. Enkele jaren geleden stopte Pfizer de ontwikkling van een nieuwe medicatie tegen Alzheimer en Parkinson. Men besliste dat het veel waardevoller was om te gaan kijken naar huidige medicijnen. Men gaat dan kijken naar bestaande medicijnen en die analyseren. Welke mechanismen worden in gang gezet die ook voor andere toepassingen hulpvol kunnen zijn? Tussen de lijnen zien we dus dat zij meer overtuigd waarde te vinden in het analyseren van vroeger datasets dan het creëren van ‘nieuwe’

maar ook gecommercialiseerd.

Daarnaast is er zich ook een hele nieuwe markt aan het onplooien. Eentje die ook gericht is op ‘health & fitness’, een eerder commerciële markt. Die van de fitbits, activity trackers en stappentellers, om er maar enkele te noemen. Zo’n apparaten verzamelen doorheen heel de dag gegevens. Hoeveel je beweegt of stilzit, je stressniveau, soms zelfs je suikerspiegel, tot je nachtrust toe. Die kunnen dan ook weer in een analyse en aanbeveling gegoten worden. Adviezen gaande van ‘meer bewegen’ en ‘tijd om naar bed te gaan’ tot ‘je loopt een groot risico op hartfalen’.

Trackers zijn hip momenteel

Hier kan Big Data dan zelfs gebruikt worden om hele demografische en gezondheidsgerelateerde voorspellingen te doen. Als uit een analyse blijkt dat binnen twintig jaar er een enorme stijging zal zijn in het aantal mensen met obesitas, kan de overheid ingrijpen en maatregelen invoeren.

Yes, Your Honor!

Als laatste neem ik u mee naar de rechtstaat. Big data in ons gerechtelijk systeem, vreemde combinatie? Nee, zo blijkt. Ook in die sector is er namelijk een overdosis aan data en die is meer dan bruikbaar. Men kan de uitkomst van een hoog percentage zaken eigenlijk al op voorhand gaan voorspellen. Waarom is dat nuttig? Stel je een zaak voor waarvan je weet dat de kans enorm klein is dat de persoon in kwestie vervolgd wordt. Ga je dan alle tijd en moeite steken in een hoogstwaarschijnlijk verloren zaak? Of probeer je met de beschuldigde toch tot een schikking te komen, waar die dan toch een boete betaalt en zich ertoe committeert niet meer in bepaalde milieus te werken of mee contact te hebben.

We verzamelen zoveel mogelijk over een verdachte, maar stelselmatig wordt er ook meer en meer over rechters verzameld. Hoe zij meestal oordelen, waar ze zwaar aan tillen, welke voorkeuren zij hebben in uitspraken. Advocaten beginnen daar nu ook gebruik van te maken en spelen daarop in. Ze zullen een rechter proberen te wraken als ze denken te kunnen aanwijzen dat het pleit op voorhand al beslecht is. Waarom doe ik nog de moeite, als mijn zaak op voorhand als bepleit en verloren is?

Black Mirror

Zijn al die zaken, die ik net vernoemd heb, aanvaardbaar? Zijn ze positief of zijn ze negatief? Veel zal afhangen van door welke bril u kijkt. Sommigen zien er dé redding in, sommigen zien er enkel de doomsday klok verder en sneller door aftellen.

En zo is het met bijna alle toepassingen en sectoren die Big Data aanraakt. Veel verdeeldheid, maar vooral ook veel onwetendheid. Soms hebben we geen idee wat er zich achter die digitale muur afspeelt. We denken er allemaal het onze over en dat ons goede recht, maar nu doe ik toch een oproep. We moeten serieus beginnen nadenken over die hele hoop ethische en wettelijke dillemma’s waar we vroeg op laat op gaan botsen. De huidige situatie doet meer denken aan een ‘Hunger Games’ scenario waar iedereen vecht om te overleven, data verzameling om te overleven. Momenteel zijn dat dan de mensen of bedrijven die het meeste van jou te weten kunnen komen. Kennis is, meer dan ooit, macht.

★★★★★ – User1984

Wilt u al graag een voorbeeld van de keerzijde? Richt dan even u aandacht op China. Waar we in Europa bijna geobsedeerd zijn met Amerika en de man die daar momenteel aan de macht is, durven we zelden naar de andere kant van de wereld kijken. In China heeft de overheid alle macht over de sociale media en over het internet in het algemeen. Mensen worden bijgehouden in de staatsgesponsorde applicatie ‘WeChat’. Mensen als files, letterlijk. Alles wordt er bijgehouden, je gezondheidszorg, je leningen, je internetgeschiedenis, je vrienden, mails, berichten, … alles verloopt voor de Chinees via die app.

Vrijheid of onderdrukking?

Je hebt geen keuze, de overheid heeft alles in handen en dat maakt het verschrikkelijk gevaarlijk. Heb je de verkeerde vrienden, zoek je te vaak naar ‘vrij meningsuiting’ in je browser, kortom doe je dingen die de overheid niet aanstaat? Dan wordt je burgerschcapsscore verlaagt (nee, dit is absoluut geen grap). Een lagere score wil zeggen dat je geen kans maakt op een voordelige lening, je niet mag gaan wonen in een bepaald gebied, je geen toegang krijgt top een bepaalde sportclub, … noem maar op. Zo blijft de huidige “top” van de gemeenschap aan de macht, want wie durft er kritiek te geven als ze daarvoor genadeloos afgestraft worden?

Back to … forward?

Zo ver staat het hier toch niet, maar ik hou graag een gezonde argwaan tegenover instellingen met veel kennis en macht. Stellen we ons genoeg (wettelijke, maar zeker en vast ook ethische) vragen bij die extreme honger naar data. Is het nodig dat we alles en iedereen opslaan en bijhouden, voor nu en voor altijd. Of gaat dat soms in tegen ons buikgevoel of belangrijker, gaat het soms in tegen onze wetten, onze privacy en onze rechten als mens?

Daarvoor heb ik een volledig tweede deel nodig. Om de gigantische grijze zone binnen onze sector te scheppen. Hopelijk tot dan.

Bronnen

Elementaire deeltjes #62: Big Data – Bart Van Der Sloot (boek)
Artificial Stupidity – Fredo De Smet (boek)
How WeChat Came To Rule China – Shannon Liao (artikel)

13 Replies to “Grote gegevens. Part One.

Leave a Reply

Your email address will not be published. Required fields are marked *