Skip to Content

Big Data is niet nieuw voor CVS. Het centrum werkt al jaren met enorme databestanden, regelmatig gecombineerd met data van bijvoorbeeld het KNMI (over storm) of het Centraal Bureau voor de Statistiek. Hoen: “Maar dat doen we vooral om onze gebruikelijke statistieken te maken. Terwijl het mooie van al die data is dat je er ook heel verrassende uitkomsten uit kunt halen.” Dat gebeurde eens toen een collega in een verloren uurtje bij toeval fraude met de toen nieuwe iPhone ontdekte.

Andere werkwijze, zelfde resultaat

Toen het contact met de TU Delft was gelegd, hoefden Hoen en zijn collega’s dan ook niet lang na te denken de studenten van de faculteit Wiskunde toegang te geven tot de databestanden – uiteraard na ondertekening van een geheimhoudingsverklaring. “Ze zijn zonder opdracht aan de slag gegaan: probeer maar wat eruit komt.” De resultaten waren helaas niet heel verrassend: zo bleken mensen met hoge inkomens meer te maken te hebben met diefstalschade dan mensen met lage inkomens. En in dichtbevolkt gebied wordt vaker waterschade geclaimd dan op het platteland waar juist vaker schade blijkt te ontstaan door blikseminslag. “Wel weer leuk is te zien dat zij daar nu via een andere werkwijze achter komen.”

Praktijk versus theorie

Geen spectaculaire resultaten dus, wel een ervaring rijker. Hoen: “Big Data is een hype en iedereen wil er wat mee, maar ook nu weer bleek dat de praktijk altijd lastiger is dan de theorie. Je kunt nog zulke goede wiskundige vaardigheden hebben, als de kwaliteit van data niet goed is dan kom je niet ver.” Heeft de ene partij bijvoorbeeld de data op gemeenteniveau beschikbaar en de ander op wijkniveau, dan is er al een mismatch en moet je daarvoor een oplossing bedenken. “Voor de studenten een eyeopener.” En ook het Verbond was blij met de studenten over de vloer. “Big Data is de toekomst, het is goed als we daar naast ons eigen werk zoveel mogelijk ervaring mee opdoen en samenwerkingen aangaan.”