Big data, groot gevaar: correlatie is geen causatie!

Slimme analyse vindt mooie verbanden, maar leveren die inzicht of onzin?

Een serie blogs over control

BLOG - We leven in een spannende tijd. Ontwikkelingen gaan snel en daardoor verandert ook het beroep van de controller. Waar vroeger vooral werd gewerkt aan de management rapportage met voornamelijk financiële informatie is het vak opgeschoven naar voorspellende analyse. Dus niet alleen maar verklaren waarom er zaken zijn gebeurd - verschillenanalyse, kostenoverschrijvingen, margedaling of stijging - maar analyse over de toekomst. Wat gebeurt er vandaag en morgen als gevolg van welk gedrag in welke processen door welke actoren? Dat is ook de belangrijkste behoefte van het management geworden.

Door Hinrich Slobbe, control prof in beide betekenissen, als associate professor aan de Business School Nederland en als directeur van Wisdom in Finance.

Samenhang of verband

Om deze analyse te ondersteunen wordt veel gewerkt met Big Data. Grote hoeveelheden gegevens worden in algoritmes gestopt waaruit vervolgens correlaties en verbanden worden afgeleid. Vervolgens worden uit die verbanden voorspellingen gedaan waarmee de toekomstige ontwikkelingen kunnen worden verklaard en er op tijd kan worden ingespeeld om mogelijke kansen en bedreigingen.

Correlatie - statistische samenhang - tussen bepaalde grootheden betekent echter nog niet dat er ook sprake is van een oorzakelijk verband. En met algoritmes die voorspellingen doen op basis van die correlaties moet voorzichtig worden omgegaan. Anders trekken we dubieuze conclusies en nemen we mogelijk de verkeerde beslissing. Spurious Correlations verzamelt zulke valse correlaties, die ons bij het leggen van verbanden - ondanks sterke correlatie - tot bescheidenheid manen. Zo is er een 99,79 procent correlatie tussen het aantal zelfmoorden en de hoeveelheid geld die de overheid aan wetenschap uitgeeft. Of wat te denken van de 99 procent correlatie tussen aantal echtscheidingen en de consumptie van margarine!

Eenrichtingsverkeer

Het mag duidelijk zijn: correlatie betekent niet hetzelfde als verband, laat staan oorzakelijk verband of causatie. Want oorzaak en gevolg worden ook nogal eens door elkaar gehaald. Zo is er een verband tussen het aantal zonne-uren en de verkoop van badkleding, bikini’s etc. Maar je kunt niet zeggen dat door het verkopen van meer bikini’s de zon meer gaat schijnen. Een oorzakelijk verband is niet altijd eenvoudig te leggen. Zo zijn er financieel deskundigen die denken dat een winstgevende onderneming leidt tot gemotiveerde medewerkers. Degenen die echt hebben doorgeleerd weten dat het precies andersom is. Motivatie leidt tot hogere kwaliteit en klanttevredenheid. En daardoor stijgt het resultaat.

Als we voorspellende analyses willen maken moeten we eerst nadenken over de oorzaken versus de gevolgen. Daar kunnen vervolgens datasets op worden geselecteerd om oorzakelijke verbanden te kunnen bewijzen. Control gaat over beheersing van de toekomst. Die is spannend, disruptief en vernieuwend. Nieuwe verbanden leggen tussen KPI’s die wel werken. Ik kan niet wachten ...

Alle blogs van prof. Hinrich Slobbe voor u op een rij gezet.