Van Big Data naar Rich Data

11 december 2012

Honderdduizenden Facebook-statusupdates per minuut, miljoenen mailtjes die dagelijks verstuurd worden en ontelbare auto's die alleen al in Nederland langs een sensor van een trajectcontrole rijden. We verzamelen en beheren de laatste jaren enorme hoeveelheden gegevens, afkomstig van social media, websites of sensornetwerken. En plotseling heeft iedereen het erover: Big Data.

Big Data is ‘hot’. En dat alleen al is reden om kritisch te zijn. Maar is Big Data niet meer dan een marketing-truc? Of het nieuwste IT-speeltje? Waait het wel weer over? Of levert Big Data ook voor financiële professionals waardevolle inzichten op?

Laten we eerst eens goed kijken naar wat de term Big Data nu precies betekent. Daar heb je direct al een probleem: het lijkt wel of iedere BI-leverancier een eigen definitie heeft, die natuurlijk precies aansluit op de producten van die leverancier. Zo was ik laatst bij een symposium, waar door een leverancier trots werd aangekondigd dat een Big Data-oplossing zou worden gedemonstreerd. Met maar liefst een miljoen rijen met data. Dat is een aantal dat je tegenwoordig moeiteloos met PowerPivot in Excel analyseert!

Inmiddels heeft onderzoeksbureau Gartner, voor velen het eind van alle tegenspraak, een werkbare definitie van Big Data geïntroduceerd. Centraal hierin staan de “drie V’s” (in het Engels): Volume, ofwel de hoeveelheid data, Variety, de diversiteit aan soorten data, en Velocity, de snelheid waarmee de data aangroeit.

Persoonlijk vind ik die variëteit aan data het belangrijkste aspect aan Big Data: de zogenaamde ongestructureerde data zoals logbestanden en documenten. In de praktijk blijkt deze data vaak helemaal zo ongestructureerd niet te zijn, en uiteindelijk komt het verschil er dan op neer dat je bij Big Data je gegevens opslaat zonder er vooraf aan te sleutelen, terwijl in ‘traditionele’ BI-omgevingen juist veel tijd gespendeerd wordt aan het ontwerpen van een structuur waarin alle data moet gaan passen.

Juist het ontwerpen van die structuur (vaak onderdeel van datawarehouse-projecten) kost veel tijd en levert veel onbegrip op bij afnemers. Volgens mij komt dat doordat het ver af staat van het uiteindelijke resultaat. Het is abstract werk, en voor eindgebruikers is het moeilijk om aan te geven welke data ze in welke vorm nodig hebben, als ze dat niet concreet voor zich zien. Bovendien ontstaan nieuwe vragen, en daarmee veranderingen in de datastructuur, meestal sneller dan het datawarehouse-project wordt opgeleverd. Tegen die achtergrond klinkt het principe van Big Data heel interessant.

De belofte van Big Data is dat je nieuwe soorten vragen kunt beantwoorden door grotere aantallen gegevens op een flexibeler manier te analyseren. Zo kun je mogelijke fraude detecteren door verschillende soorten informatie te combineren. Je kunt voorspellingen doen over de omzet op je producten op basis van wat er via social media over gezegd wordt. Desnoods in combinatie met de weersverwachting. En je kunt productieprocessen optimaliseren en kosten besparen door in real-time in te grijpen op basis van de data van sensoren in je machines.

Je moet wel beseffen dat de technologie rond Big Data in feite nog in de kinderschoenen staat. En dat betekent dat het op dit moment nog echt specialistenwerk is. Discussies over Big Data gaan dan al snel over technologie als Hadoop, MapReduce, R en data mining – geen zaken waar je je als finance professional mee bezig wilt houden. Er zijn organisaties die nu al zoveel waarde zien in Big Data dat ze veel investeringen doen om kennis op te bouwen. En er zijn zeker situaties waarin dat verstandig is. Ik denk echter dat Big Data pas echt gaat doorbreken wanneer we in staat zijn om het even toegankelijk te maken als, jawel, Excel.

Wat kun je, op de drempel van 2013, doen met Big Data? Begin geen Big Data-project omdat het nou eenmaal ‘in’ is. Denk na welke vragen je beantwoord zou willen hebben, of beter nog, zet eens een aantal vraagstukken op een rij waarvan je denkt dat die niet te beantwoorden zijn, maar waarvoor een antwoord wel veel waard zou zijn. En leg die vraagstukken eens voor aan een expert. De kans bestaat dat oplossingen al voorhanden zijn. Misschien wel zonder dat we het Big Data noemen…

En als het nu nog niet haalbaar is, gooi dan in ieder geval geen data weg. Het kost steeds minder om informatie te bewaren, en de technologie om nuttige inzichten uit die Big Data te halen, wordt snel volwassen. Zo wordt Big Data al snel Rich Data. En vinden we die honderdduizenden Facebook-updates helemaal niet meer zo veel.

Michiel Rozema (michielr@microsoft.com) is bij Microsoft Nederland verantwoordelijk voor Business Intelligence.

Klassiekers uit het archief van Financieel-Management.nl:
10 veel voorkomende fouten in Excel
10 veel voorkomende fouten in Excel – deel 2

Bekijk ook de inspirerende video’s:
Excel Video #1: Winstmaximalisatie met de oplosser
Excel Video #2: Bekijk alle opties met ‘wat-als’ analyses
Excel Video #3: Overzicht in een handomdraai met een ‘histogram’
Excel Video #4: Elimineer fouten met snijpuntoperatoren
Excel Video #5: Boek tijdswinst met draaitabellen
Excel Video #6: Foutloos vermenigvuldigen met ‘Productmat’
Excel Video #7: Effectief Formules controleren
Excel Video #8: Optimale rooster- of werkplanning
Excel Video #9: Sneller rekenen met ‘plakken speciaal’
Excel Video #10: Snel foutmeldingen opsporen en herstellen