Next level in big data analyse bij Achmea

Marco de Jong - Next level in big data analyse bij Achmea
Inzicht verkrijgen. Betere voorspellingen maken. En zo het aantal schades voor haar klanten, de maatschappij en de organisatie zelf verkleinen. Achmea heeft hiertoe een aantal jaren geleden een big-datateam opgezet.
Interview: Marco de Jong
Tekst: Suzanne Wijers
Fotografie: Geert Snoeijer
 
Welke relatie hebben het bezit van huisdieren en aansprakelijkheidsclaims met elkaar? Is er een verband tussen de hoeveelheid straatverlichting en het aantal ongelukken? Achmea timmert hard aan de weg om te onderzoeken welke factoren van invloed zijn op schade om zo het aantal schades te beperken. Voor de klant, maar natuurlijk ook om de schadelast voor de verzekeraar én voor de maatschappij te beperken. 
 
Daartoe is een aantal jaren geleden een big-datateam opgezet. David de Jong is als Hoofd Strategie en Ontwikkeling binnen de afdeling Schade en Inkomen verantwoordelijk voor dit team. Eerder werkte hij als business analist en als manager Finance bij de organisatie. Door de jaren heen heeft hij een verschuiving waargenomen in de behoefte aan bepaalde functies en taken. 
 
‘Als ik nu een afdeling Finance zou opzetten, zou ik daar minder business controllers neerzetten en meer dataanalisten of data scientists. De data-analist is steeds meer in staat taken van een business controller uit te voeren én hij is er meer bedreven in om slim met data om te gaan.’ 
 
Als verantwoordelijke voor business control voerde De Jong zelf ook analyses uit, maar die waren met name gebaseerd op interne bronnen. ‘Dat combineerden we dan wel met wat externe data, maar dat kwam niet in de buurt bij de hoeveelheid data en inzichten waarover we nu beschikken. Met de informatie die we nu kunnen ontsluiten, zijn we in staat om op een totaal ander niveau te analyseren. Dat vind ik echt de taak van business control. Dat zouden ze zich echt meer moeten toe-eigenen.’
 
Steekproeven
 
Zoveel mogelijk informatie boven tafel krijgen. Zoveel mogelijk verbanden ontdekken. Om uiteindelijk met die inzichten de schades te verlagen. Bijvoorbeeld door het gedrag van mensen die meer dan gemiddeld een claim indienen, beter te doorgronden. De doelstellingen zijn ambitieus. 
 
‘De toepassingen van big-datatechnieken en mogelijkheden zijn verstrekkend. Neem bijvoorbeeld Risk & Compliance. Daar werken we tegenwoordig anders; niet meer op basis van steekproeven. Steekproeven zijn eigenlijk een achterhaald begrip geworden nu we alle data hebben.’ 
 
Maar om bijvoorbeeld het claimgedrag van mensen te doorzien en uiteindelijk ook te voorspellen, moet je soms op zoek naar relaties waarvan nog niet bekend was dat ze bestonden. ‘De mogelijkheden die we nu hebben om bijvoorbeeld alle tekstvelden te kunnen analyseren, voegt een belangrijke laag toe aan de inzichten.’
 
Preventieve functie
 
De analyses komen op verschillende manieren tot stand. ‘Uiteraard werken we onder meer hypothesegedreven: op basis van vooronderstellingen. Heel simpel gezegd zetten we dan de meerdere sets data waarvan we veronderstellen dat ze aan elkaar gelieerd zijn, tegenover elkaar. Maar we gaan ook exploratief te werk door allerlei data van externe bronnen toe te voegen. Zo ontdek je ook correlaties waarvan je het bestaan niet wist of kon weten.’ 
 
De Jong doelt op data van onder meer het RIVD, KNMI en Basisregistraties Adressen en Gebouwen (BAG). Door data aan elkaar te koppelen, ontstaan bijzondere inzichten. Bijvoorbeeld dat bij regen op bepaalde afritten meer ongelukken plaatsvinden dan op andere afritten. En dan is het zaak om daar iets aan te doen. 
 
 
‘Door dergelijke analyses kunnen we het onderhoudsbudget van de overheid effectiever inzetten. Want ik vind oprecht dat het onze maatschappelijke taak is om schades zoveel mogelijk te voorkomen. Verkeersongevallen, waterschades, de infrastructuur: ik zie dat allemaal als onze verantwoordelijkheid. We gebruiken datamining dus ook om preventieve maatregelen te nemen en zo het aantal schades te verlagen.’ 
 
Het exploratieve onderzoek moet ook leiden tot voorspellende waarden. Want als er personen zijn gedetecteerd die meer dan gemiddeld schade melden, wil je als organisatie weten of je hen beter kan helpen. En indien het neigt naar frauduleus gedrag, onderzoek je welk gedrag hen typeert zodat je in de toekomst dit gedrag kunt voorkomen of anders gaat pricen. Om de efficiëntie en doelmatigheid van het acceptatieproces te vergroten, maakt het bigdatateam gebruik van process mining. Immers, niet alle handelingen zijn altijd nodig; sommige stappen in het proces kunnen wellicht overgeslagen worden. Maar wat is daarvoor nodig? Met process mining komen bovendien ook fouten in het proces boven tafel. 
 
‘Op zich is dit niks nieuws; dat we het nu veel beter kunnen detecteren wel.’ Process mining, datamining en visualisaties vormen dus de kern van het big-datateam. Voor die technieken maakt de nieuwe afdeling gebruik van onder meer SAP HANA, open source software als R voor het modelleren, SAS voor fraudedetectie en Synerscope voor visualisaties. ‘Een mooie set aan tooling. Maar we houden altijd onze ogen open voor nieuwe tools om op de hoogte te blijven van nieuwe technieken die ons kunnen helpen de grote hoeveelheid data inzichtelijk te maken.’
 
Maturatieproces
 
Ondanks de oneindige hoeveelheid mogelijkheden die datamining biedt, onderkent De Jong ook een mogelijk maatschappelijk nadeel van de datatoepassingen die nu wereldwijd worden toegepast: digital predestination. Want hoewel de analyses zich voor een aanzienlijk deel richten op generieke verbanden, is het uiteraard ook mogelijk om dat op individueel niveau te doen. 
 
Zover is het nu wellicht nog niet overal, maar De Jong voorziet wel mogelijke problemen met mensen die ooit een keer te laat hebben betaald. ‘Dat soort gegevens kunnen mensen hun hele leven achtervolgen. Ze krijgen een rood vlaggetje dat nooit meer uit gaat.’ Maar, zo erkent hij ook, dit soort doemscenario’s zijn inherent aan nieuwe ontwikkelingen. 
 
‘Het wordt nu allemaal nog te simpel gemaakt. Uiteindelijk biedt juist de breedte van de inzichten de benodigde nuance. Datamining staat in onze sector echt nog in de kinderschoenen. Naarmate het meer gemeengoed wordt, verandert het gedrag van mensen ook. Ik verwacht dat we steeds meer een maatschappij krijgen waarbij mensen alleen nog informatie over zichzelf willen delen indien daar iets tegenover staat. En organisaties moeten duidelijk laten zien wat ze wel en niet met de verzamelde data doen en aantoonbaar kunnen maken dat jij er ook beter van wordt.’
 
Kennisverrijking
 
Het team uit het datalab dat met de tooling moet werken, bestaat volgens De Jong idealiter uit mensen met technische skills die snappen hoe ze het maximale uit de techniek kunnen halen. Daarnaast zijn er mensen nodig voor de datapreparatie; die weten hoe ze met de data om moeten gaan en hoe ze die data moeten interpreteren. ‘En dan heb je natuurlijk nog mensen nodig met wat ik dan noem ‘business consulting skills’. Het liefst heb je al die kwaliteiten in één persoon, maar dat is helaas een zeldzaamheid. Hoe dan ook heb je alle drie deze kwaliteiten nodig in het team.’ 
 
Om de kennis in de organisatie te borgen en up-to-date te houden, is de Achmea Analytical Academy in het leven geroepen. Aan deze academie kunnen medewerkers bootcamps van zes weken volgen tot volwaardige leergangen van drie jaar. ‘Zo willen we analytisch vakmanschap binnen Achmea vergroten. We maken gebruik van echte data en modellen uit onze organisatie, waardoor het direct toepasbaar is. Daarnaast trekken we ook vaak jonge honden van partners aan voor een bepaalde periode, in het kader van informatie uitwisseling. Laat een talent van bijvoorbeeld een kleine datadienstverlener een half jaar bij ons werken. Daar profiteren we allemaal van.’
Gerelateerde artikelen