Toolselectie big data & analytics – Geen one size fits all oplossing
Niet zozeer big data, maar 'mixed data' blijkt bij veel projecten de uitdaging te zijn. Hoe combineer je succesvol data uit verschillende bronnen om te komen tot verbluffende nieuwe inzichten? Nieuwe technologie maakt dit mogelijk.
Door Marco de Jong
Voor de keuze van de juiste tooling is het allereerst van belang antwoord te hebben op de vraag: Hoe kom je van data als grondstof naar waarde? Om succesvol waarde te creëren met Big Data & Analytics doorloopt data drie opeenvolgende stadia.
Figuur 1 – Van data naar waarde
Dit is in bovenstaande figuur geïllustreerd. Het begint links bij ruwe data die uit verschillende bronnen afkomstig is: intern, extern. Het is gestructureerd of ongestructureerd en je hebt te maken met de drie V’s van Big Data: Velocity (snelheid), Volume (hoeveelheid) en Variety (variëteit).
Hoe kom je van data naar waarde? Welke data heb je al? Denk niet alleen aan interne data, maar ook aan externe data. Probeer niet alleen aan gestructureerde data te denken (bijvoorbeeld ERP-data), maar ook aan ongestructureerde data (bijvoorbeeld tekst). Wees je bewust van welke data je nodig hebt, en denk na over de data van klanten, partners en toeleveranciers. Iedereen heeft een stuk van de puzzel en hoe meer stukjes je hebt hoe beter je kunt puzzelen.
In het volgende stadium ga je kijken hoe de data eruit ziet. Dit is een stap die niet tot de verbeelding spreekt en vaak wordt overgeslagen. Het is de zure appel waar bij ieder startend big data project doorheen gebeten moet worden. Zonder dat je al een specifiek doel hebt ga je kijken wat je allemaal hebt. Hoe vaak komt klantnummer voor in deze data en is dat elke keer dezelfde? Of hebben we vijf definities van klantnummer? Hoe goed zijn alle velden gevuld? Hoe makkelijk zijn verschillende bronnen te koppelen? En wat is de kwaliteit van de verschillende databronnen? Nu ken je de data.
Dit is een reality check: Je kunt wel van alles willen, maar heb je daarvoor de juiste data beschikbaar? Het product van het tweede stadium is Linked Data – Door de data te koppelen en verbanden te leggen is de data al meer waard geworden.
Vervolgens ga je het doel vaststellen op basis van de context en de overview die je nu van de data hebt. Met welk doel ga je nu met die data aan de slag, dus welke analyse wil je doen? Is dat informeren, optimaliseren of heb je een onderzoeksvraag? Uit de analysefase komen sowieso een groot aantal inzichten en antwoorden op business vragen. Daarna volgt de laatste stap waarin je de data om gaat zetten in waarde. Hoe kom je van data naar waarde? Door er dataproducten van te maken. Er zijn vier ‘dataproducten’ op te leveren:
1. Solution
Combinatie van kennis, inzichten en techniek voor een bepaald toepassingsgebied (bijvoorbeeld procurement monitoring)
Combinatie van kennis, inzichten en techniek voor een bepaald toepassingsgebied (bijvoorbeeld procurement monitoring)
2. Action
Kant en klare actielijsten op basis van modellen (bijvoorbeeld concrete acties t.b.v. sales optimalisatie)
Kant en klare actielijsten op basis van modellen (bijvoorbeeld concrete acties t.b.v. sales optimalisatie)
3. Improvement
Inzichten in effectiviteit en efficiency van de organisatie, inclusief interpretatie (via context) die direct om te zetten zijn in verbeteringen (bijvoorbeeld proces improvement)
Inzichten in effectiviteit en efficiency van de organisatie, inclusief interpretatie (via context) die direct om te zetten zijn in verbeteringen (bijvoorbeeld proces improvement)
4. Intelligence
Bundeling van inzichten en antwoorden die de collectieve intelligentie binnen een organisatie naar een hoger plan brengen (bijvoorbeeld dashboards) Voor iedere organisatie zal de waarde anders zijn, maar ik denk dat deze vierdeling een concreet handvat biedt om die waarde in een business case uit te werken.
Toolselectie
Hoe kom je van zo’n abstract model tot een keuze voor tooling? Is er een tool of platform dat je in alle stadia ondersteunt? Het opdelen in stadia helpt je omdat elk van deze stappen verschillende implicaties heeft op het gebied van tools en het type mensen dat je nodig hebt om het uit te voeren.
We zullen niet te veel in detail treden, maar vonden het wel belangrijk om in ieder geval opslag en bewerking van data en analyse tools apart te behandelen. De reden is dat de keuzes die je in opslag maakt (eerste twee stadia) bepalend is voor de waarde die je via analyses uit de data kunt halen.
Voor verschillende doeleinden heb je verschillende tooling beschikbaar. Zie voor inspiratie de ‘Magic Quadrant’ figuren van Gartner voor Data Warehouse en Data Management oplossingen (figuur 2), en oplossingen voor Business Intelligence and Analytics (figuur 3). Daarbij moet opgemerkt worden dat er geen ‘one size fits all’ oplossing bestaat. Ieder doel heeft een tool, en het is dus cruciaal om met dat doel te beginnen.
Figuur 2 – Magic Quadrant for Data Warehouse and Data Management Solutions for Analytics
Figuur 3 – Magic Quadrant for Business Intelligence and Analytics Platforms
Er zijn grofweg twee toolvragen te beantwoorden: hoe sla je data op en hoe analyseer je? Als je je data niet adequaat opslaat is het onmogelijk om vervolgens bepaalde verbanden te leggen. Dat is dus een onderdeel dat niet vergeten mag worden. En als je geen krachtige analysetool hebt dat past bij de vragen die je wilt stellen en de manier waarop je wilt werken kun je prachtig opgeslagen data hebben, maar doe je er niks mee.
Van data naar waarde is een proces vergelijkbaar met een bedrijfsproces. Nieuwe tools en technieken maken het mogelijk dit proces iteratief aan te pakken. Ik ben ervan overtuigd dat het meerdere malen doorlopen van dit proces om uit te proberen wat werkt binnen uw organisatie de beste garantie is voor uiteindelijk succes.
Een R&D aanpak is bewezen effectief binnen Big Data & Analytics en biedt heel veel kansen om tot de juiste keuze voor zowel mensen als tools te komen. Wees hierbij bewust van de zure appel van het tweede stadium en sla dit niet over, want zoals altijd komt na het zuur het zoet van de nieuwe inzichten en praktisch toepasbare waarde uit data.
Marco de Jong (oprichter Experience Data) en data zijn onlosmakelijk met elkaar verbonden. Als accountant bij EY, en daarna als SAP consultant en adviseur risk management bij EY, heeft hij de waarde van data altijd onschatbaar geacht. Tot het in 2012 niet langer uit kon blijven! Hij begon single handedly ‘Data To Insight’ binnen het Consultancy bureau Trifinance, een high end data science team dat voor diverse grootte opdrachtgevers waarde uit data weet te halen. En vanaf heden is het dan zover: een droom, een passie, een visie! 2015! Marco start samen met Jan de Roos Experience Data. ‘Samen waarde creëren’. Door middel van inspireren, creëren en realiseren brengen zij klanten van data naar het land van de onbegrensde mogelijkheden.