Wouter de Bie, Big Data Architect bij Spotify: “Muziekstreaming is een continue zoektocht”

Wouter de Bie, Big Data Architect bij Spotify
De Zweedse muziekstreamingdienst Spotify heeft in korte tijd de muziekindustrie compleet omgegooid. Wouter de Bie, Big Data Architect bij het bedrijf, deelt zijn unieke ervaringen in experimenteren met data en hij geeft de nodige tips & tricks voor het zo snel mogelijk benutten van het potentieel van data, ook als dat geen core competentie is. Gek genoeg was dat het bij Spotify eerst ook niet. "We zijn van gut-driven naar data first gegaan."
spotify
 
“Heel veel IT-bedrijven uit Silicon Valley roepen dat ze de wereld gaan veranderen”, begint Wouter de Bie (35), Big Data Architect bij muziekstreamingdienst Spotify. Het mooie van Spotify vindt hij dat het bedrijf dit ook daadwerkelijk doet. Het model van streamen is immers een heel ander model dan het kopen van nummers via iTunes. 
 
“Spotify is een van de eerste diensten die muziek op deze manier aanbiedt”, aldus De Bie. “Daarmee hebben we het consumentengedrag veranderd alsook de manier waarop de muziekindustrie met digitale media omgaat. Omdat wij hierin voorop lopen moeten we constant nadenken: Wat is het best mogelijke product dat wij kunnen leveren? Dat weten we niet, want we kunnen het nergens afkijken. Muziekstreaming is een continue zoektocht: Hoe willen mensen het nu eigenlijk gebruiken? Big data helpt ons die vraag te beantwoorden.”
 

Features bouwen

Data wordt gebruikt om features te bouwen, zoals de welbekende ‘aanbevolen’ functie. De kennis uit deze data wordt daarnaast aangevuld door aanbevelingen van muziekkenners die bij Spotify werken. Spotify Radio en Discover Weekly – waarbij gebruikers op basis van hun smaakprofiel muziek krijgen aangeboden die ze niet eerder hebben afgespeeld – zijn andere voorbeelden van features. 
 
Spotify gebruikt data om te testen welke features wel en niet werken, aldus De Bie. “Een stuk van de puzzel die we moeten oplossen is hoe we mensen een zo goed mogelijke ervaring kunnen bieden. Stel, je houdt van heavy metal, dan wil je op een radiostation muziek horen die hetzelfde klinkt. Kennis die we daarvoor nodig hebben is hoe artiesten en nummers zich met elkaar verhouden. Dat is lastig, want voor muziekclassificatie bestaat geen echte standaard. Een genre is een gooi, maar er zijn enorm veel genres en crossovers, dus daar komen we niet veel verder mee.” 
 
“Om dat op te lossen kijken we naar gebruikersgedrag op grote schaal om verbanden te leggen en we kijken naar de audio zelf”, vervolgt De Bie. “Voor dat laatste hebben we een overname gedaan van The Echo Nest, een technologiebedrijf dat audio kan analyseren. Deze twee databronnen samen geven ons een vrij nauwkeurig beeld van hoe artiesten, nummers en albums zich met elkaar verhouden. Op basis daarvan kunnen we een behoorlijk accuraat smaakprofiel maken van onze gebruikers en daar het aanbod op baseren. Dat kan zelfs op het moment van de dag waar je je bevindt. Als je aangeeft dat je op de sportschool bent, kunnen we je iets uit je smaakprofiel geven dat daarbij past. Ik vind het zelf bijvoorbeeld fijn om in de sportschool naar uptempo jazz te luisteren.” 
 
 
 

Experimenteren met data

Toen Wouter de Bie bij Spotify begon in 2011 als ontwikkelaar was het gek genoeg nog een gut-driven organisatie. ‘Dit lijkt me wel een goed idee’ of ‘een vriend van me zegt dat…’. ‘Laten we dat dan maar doen.’ “Veel beslissingen werden op basis van dergelijke onderbuikgevoelens genomen”, zegt de Big Data Architect. “Daar hebben we wel veel van geleerd, zeker van de mislukkingen. Maar op een gegeven moment hebben we gesteld dat aangezien we de data hebben, we daar ook maar gebruik van moesten gaan maken.”
 
 
 
Het testen van product features werd al snel een belangrijke toepassing. “Als iemand een goed idee heeft zetten we er een aantal ontwikkelaars op. Die werken er een week aan, en dan distribueren we de feature – die dan nog verre van perfect is – onder een kleine groep gebruikers, zo’n 10.000. Daarna gaan we meten: Wat voor impact heeft de feature op het gedrag van mensen? Is er een verschil in hoe lang en intensief mensen Spotify gebruiken? Is er een verschil in het aantal aanmeldingen of afmeldingen? Zo krijgen we vrij snel een beeld van de positieve en negatieve effecten. Wanneer het positief is, ontwikkelen we het verder en rollen we de feature uit onder een grotere groep gebruikers.”
 
9 van de 10 experimenten faalt, schat De Bie in. En de uitkomsten zijn soms onverwachts. Een vraagstuk was bijvoorbeeld of mensen in de gratis variant liever één advertentie om de tien minuten zouden horen of drie advertenties na een half uur. “Daar werd toen flink over gespeculeerd, maar het bleek voor het gedrag niks uit te maken. Die discussie konden we toen sluiten.” 
 
Dat is dan ook een belangrijke tip die hij organisaties wil meegeven die met big data aan de slag gaan. “Begin klein, bepaal wat je wilt bereiken. Start met één inzicht uit data en voed daar dagelijks het management mee in rapportages. En automatiseer dat. Ga niet een compleet ICT-systeem bouwen wat een half jaar werk kost. Wij zijn succesvol door iteratief werken. Een team van twee tot vier mensen bouwt iets nieuws in een week. De kosten van deze ontwikkeltijd zijn te overzien. Als het niks is gooien we het weg. Als je er een groot project van zes maanden van maakt is schrappen een stuk lastiger als het niks blijkt te zijn. De tweede tip is de effecten meten. Wat verwacht je en wat gebeurt er daadwerkelijk?”
 

2300 servers

De technologie voor big data analyses is vrij nieuw. “De silver bullet is nog niet gevonden”, stelt De Bie. “Sommige dingen werken goed, maar er is constant vernieuwing op dit vlak. Het is een erg dynamisch veld.” Dat maakt het lastig om te kiezen voor een bepaalde technologie, ervaart De Bie, want bij elke nieuwe tool is het maar de vraag hoe levensvatbaar het is. “Als het open source is, kan het zijn dat er geen grote communities omheen ontstaan. Komt de tool van een softwarebedrijf, dan is het vaak een start-up en weet je niet of ze het gaan halen. Je moet continu bijblijven, want de oude producten verdwijnen gewoon.” 
 
Bij Spotify werkt De Bie met Hadoop-clusters voor opslag en verwerking. “Het is een systeem dat goed schaalbaar is. Wij zijn begonnen met één cluster, dat bestond uit 35 servers. Daar zijn we mee gaan experimenteren. Inmiddels is dat uitgegroeid tot 2.300 machines. De technologie van big data is nog niet heel toegankelijk”, aldus De Bie. “Een Hadoop cluster neerzetten is best lastig. Je hebt systeemkennis nodig. In het begin kon ons team ontwikkelaars het aan, maar toen we over de 100 servers kwamen, hebben we echt een team gebouwd dat gespecialiseerd was in Hadoop. Aan de andere kant heb je analisten nodig die de data echt begrijpen. Dat is een data wetenschapper. Maar data wetenschappers hebben ook wat programmeerkennis nodig om een systeem als Hadoop te kunnen gebruiken. Die combinatie van analyse en technologische knowhow is best lastig te vinden, maar je hebt ze allebei nodig wil je met big data aan de slag gaan.”
 
Spotify is inmiddels klaar voor de volgende stap. “Ik ben betrokken bij de opdracht om de hele organisatie data-driven te maken. Daarvoor moet nog het nodige gebeuren op het gebied van infrastructuur, datamanagement en educatie.” Uiteindelijk moet dit leiden tot het vervullen van het ultieme doel van Spotify: De life companion van mensen op muziekgebied worden. “Een data first cultuur gaat ons helpen dat doel te verwezenlijken”, besluit De Bie. 
 
Spotify in data
 
Aantal markten: 58
Aantal medewerkers: 1.700
Aantal servers: 2.300 
Maandelijkse actieve gebruikers wereldwijd: 75 miljoen
Betalende gebruikers wereldwijd: 20 miljoen
Aantal nummers op Spotify: 30 miljoen
Aantal nummers dagelijks toegevoegd: 20.000+
Aantal playlists in totaal gecreëerd wereldwijd: 2 miljard
Aantal uren muziekstreaming wereldwijd in 2015: 20 miljard 
Meest gestreamde mannelijke artiest 2015 wereldwijd: Drake 
Meest gestreamde vrouwelijke artiest 2015 wereldwijd: Rihanna
Meest gestreamde mannelijke artiest 2015 in Nederland: Ed Sheeran
Meest gestreamde vrouwelijke artiest 2015 in Nederland: Ariana Grande
Meest gestreamde artiest aller tijden wereldwijd: Ed Sheeran
Gerelateerde artikelen