Niet alleen big business voor big businesses

Niet alleen big business voor big businesses
Veel grote bedrijven zijn met Big Data aan de slag. Maar Big Data is interessant voor elk bedrijf dat zijn marktaandeel wil vergroten of behouden en dat nieuwsgierig is naar het effect van veranderingen in de bedrijfsvoering.
Arjan Hassing en Eelco Rouw
Big Data is hot in IT-land. Het vooruitzicht dat je op basis van je eigen bedrijfsgegevens en publieke gegevens in staat bent om verbanden te doorzien en daarmee strategisch voordeel te halen lonkt bij vele organisaties. Big Data lijkt in veel opzichten op wat alle bedrijven in ieder geval één keer per jaar moeten doen: een jaarrekening genereren. Bij een jaarrekening wordt een grote hoeveelheid financiële transacties gereduceerd tot een balans, een winst- en verliesrekening en een toelichting. In feite doet Big Data hetzelfde. Bij Big Data gaat het alleen niet over het opstellen van een jaarrekening, maar om het beantwoorden van andere vragen op basis van zeer grote hoeveelheden data; dit betreft zowel publiek beschikbare data (zoals Twitter, Facebook, Linkedin, het weerbericht, enzovoort) als bedrijfsdata. Big Data lijkt sterk op business intelligence (of BI), waarbij rapporten worden gegenereerd op basis van de bedrijfssystemen. Het verschil is echter dat we bij Big Data spreken over grotere hoeveelheden data die bovendien verschillende vormen hebben en snel veranderen.
Dit zijn enkele voorbeelden van vraagstukken die Big Data kan beantwoorden:
1. Hoe kijken klanten tegen mijn merk aan?
2. Welke groepen kan ik onderscheiden in mijn klanten?
3. Kan ik het ziekteverzuim voorspellen?
4. In hoeverre heeft aspect x van mijn strategie effect op mijn omzet?
5. Kan ik verdachte transacties opsporen? Op dit moment wordt Big Data met name omarmd door grote bedrijven om de causale verbanden in de bedrijfsvoering, strategie en marketing te doorgronden. Bij grote bedrijven zijn met name marketingafdelingen en klantenservices bezig met het verzamelen en analyseren van Big Data.
Voor elk bedrijf
Hoewel veel grote bedrijven met Big Data aan de slag zijn, is Big Data zeker niet alleen interessant voor grote bedrijven. Big Data is voor elk bedrijf interessant dat haar marktaandeel wil vergroten of behouden en nieuwsgierig is naar het effect van veranderingen in de bedrijfsvoering op klantbeleving, marktaandeel enzovoort. Een van de interessante vragen is bijvoorbeeld hoe klanten tegen een bepaald merk of leverancier aankijken (‘brand sentiment’). Hiervoor worden verschillende sociale media gebruikt, zoals blogs, Twitter, Facebook en Linkedin om een beeld te krijgen van de merkassociatie.
Big Data is ook geschikt voor ‘fraud detection’: nagaan of (toe)leveranciers en klanten bonafide zijn. Hiervoor kunnen sociale media en credit scores gebruikt worden. Op basis van deze analyse kunnen leveranciers en klanten in risico
groepen ingedeeld worden. Met de groepen in de hoogste risicoklassen wordt geen zaken gedaan. Ook de impact van weer en gebeurtenissen is met Big Data-analyse vast te stellen: wat is het effect van bepaalde weersomstandigheden of meteorologische c.q. klimatologische gebeurtenissen op de klantbehoefte? Een ijsproducent zou bij een hittegolf op basis van sociale media kunnen nagaan op welke plaatsen zich de meeste toeristen bevinden.
Vier elementen
Veel organisaties zijn bezig met het inrichten van analyses op basis van Big Data. Voor die inrichting zijn vier elementen nodig:
1) Vraag. Als je geen vraag hebt, heb je geen Big Data nodig. Elke organisatie die succesvoller wenst te zijn dan ze nu is, dient zich af te vragen hoe deze grotere successen te bereiken zijn.
Veel antwoorden bevinden zich niet in de eigen systemen, maar zijn gratis verkrijgbaar op het internet. Als op een forum – terecht of onterecht – klachten worden besproken over de producten, diensten of bereikbaarheid van uw organisatie is dat een slechte zaak voor uw imago. Door analyse van wat op het forum wordt besproken, kunt u verbeteringen doorvoeren in de eigen organisatie om dit soort klachten in de toekomst te voorkomen.
2) Data. Doelloos rondsurfen op internet levert weinig bruikbare data op. Waar komen die bruikbare gegevens vandaan? Die data komt voort uit dataficatie. Dataficatie is waarschijnlijk het meest revolutionaire aspect van Big Data. De enorme gegevensverzamelingen moeten opgebouwd worden en dat gebeurt door het omzetten van de aspecten van ons dagelijks leven naar data. Google slaat bijvoorbeeld ons surf- en zoekgedrag op en zet het om in data. Mobiele telefoons met geolocatie kunnen – mits ze mobiele telefoons aanstaan – registreren waar we geweest zijn en dit omzetten in data.
3) Slimme mensen. Het hebben van een vraag en data is mooi, maar u heeft ook slimme mensen nodig die de vraag en Big Data kunnen vertalen naar bruikbare informatie. Een belangrijk kenmerk van Big Data-denken is het inventief gebruiken van data voor andere doeleinden dan waar deze oorspronkelijk voor bedoeld waren.
Met ‘slimme mensen’ bedoelen we mensen die ‘out of the box’ kunnen denken, sterk analytisch zijn en commerciële marktkansen en -mogelijkheden voor de organisatie zien. Uiteraard is het ook van groot belang dat deze personen enthousiast zijn om de vertaling van de Big Data te maken.
4) Middelen. Big Data wordt bij grote organisaties verwerkt door een cluster van systemen, die elk een stukje van de werklast voor hun rekening nemen. Veel grote organisaties verwachten meerdere Big Data-vraagstukken te beantwoorden en richten daarvoor een generieke voorziening in. Kleine organisaties hebben vaak niet de middelen om grootschalig te investeren in een omvangrijke en complexe IT-infrastructuur. Dat is voor een klein bedrijf ook niet nodig als deze zich in eerste instantie richt op één of twee Big Data-vraagstukken. Bovendien is schijfruimte tegenwoordig relatief goedkoop.
Aanpak
Zoals aangegeven lonen de resultaten van een Big Data-traject alleen als er ook vragen zijn die ermee beantwoord moeten worden. Niet alle vragen lenen zich ervoor om beantwoord te worden met een Big Data-onderzoek. Uiteindelijk is het van belang om de vraag zo scherp mogelijk op het netvlies te krijgen. De businessvraag is meestal niet geschikt om in één keer op te lossen en zal dus vertaald moeten worden naar een vraag die daadwerkelijk met Big Data ingevuld kan worden of die opgebroken kan worden in meerdere vragen. Bij deze vertaalslag komt expertise en ervaring kijken, maar is creativiteit ook een belangrijke factor.
Zodra de Big Data-vraagstukken bekend zijn, kan er nagedacht worden over een geschikte methode en bronnen om de vraag mee op te lossen. Bronnen kunnen zowel interne als externe bronnen zijn, variërend van publieke externe bronnen als betaalde bronnen. Vervolgens moet een infrastructuur ingericht worden die deze vraagstukken optimaal kan verwerken. Big Data drijft op parallelle verwerking en voor veel problemen staan grote clusters bestaande uit meerdere systemen te draaien. Uiteindelijk moeten de resultaten terugvertaald worden naar het oorspronkelijke businessprobleem. Figuur 1 geeft een generieke invulling van een Big Data-onderzoek weer. In de praktijk zitten er tussen de verschillende stappen iteraties.
Figuur 1. Generieke invulling van een Big Data- onderzoek
Een belangrijk aspect van Big Data-analyses is dat deze zoveel mogelijk geparallelliseerd kunnen worden. Hiervoor wordt vaak gebruik gemaakt van de ‘map/reduce’-techniek. Bij de map-stap wordt de data getransformeerd, gelabeld en geselecteerd tot een platte tabel. Alleen het relevante deel van de data blijft over en wordt omgezet zodat deze eenvoudiger verwerkt kan worden.
De reduce-stap gebruikt bovengenoemde tabel, voert hier verwerkingen op uit en aggregeert de resultaten. Een voorbeeld: een groenteboer verkoopt groente en fruit en wil het verschil tussen de goedkoopste en de duurste vruchten (fruit) vinden. MAP: Uit de beschikbare data van de groenteboer wordt het fruit geselecteerd en wordt alleen de prijs per stuk overgehouden. Het resultaat is een lijst met vruchten en hun prijs. REDUCE: De lijst met vruchten wordt gesorteerd op laag naar hoog. De laagste waarde en de hoogste waarde worden bewaard en daarmee is het antwoord op de vraag gegeven. Map/reduce is een krachtige aanpak die zich uitstekend leent om te verdelen over meerdere systemen.
Zinvol?
Wanneer is het zinvol om Big Data in te zetten? Hoewel veel organisaties de nodige vragen hebben die ze met Big Data kunnen beantwoorden, loont het vaak onvoldoende om hiervoor in eigen middelen te investeren. Zo zal een cluster van systemen een groot deel van de tijd stilstaan en moet je de mensen met het juiste competentieniveau een dagelijkse uitdaging kunnen bieden. Er zijn echter mogelijkheden om Big Data-vraagstukken uit te besteden:
‘As a service’
Voor veel kleinere (maar ook grotere) organisaties kan het lonen om Big Data uit te besteden. Meerdere organisaties bieden Big Data ‘as a service’ aan. Vaak zijn deze organisaties gericht op specifieke vraagstukken, zoals het bepalen van sentiment op basis van sociale media, het segmenteren van de doelgroepen, het identificeren van trends of het signaleren van fraude of misbruik. Van de hiervoor genoemde elementen die nodig zijn om een organisatie in te richten op basis van Big Data heb je toch nog steeds 1) en een deel van 2) nodig.
Een goede vraag die met Big Data kan worden opgelost is de eerste randvoorwaarde, maar ook het beschikbaar stellen van een deel van de eigen bedrijfsdata kan noodzakelijk zijn om correlaties tussen ontwikkelingen in het bedrijf te kunnen relateren aan publieke databronnen.
Infrastructuur uit de cloud
Het kan zijn dat de huidige bedrijfsvoering al vraagt om slimme analytische medewerkers, die bijvoorbeeld al veel dingen doen met business intelligence. Op dat moment kan het ook lonen om de Big Data-infrastructuur extern te betrekken bij een traditionele hostingpartij of bij een cloudleverancier. Aangezien Big Data-vraagstukken sterk kunnen verschillen in welke bronnen en bewerkingen noodzakelijk zijn, is het plezierig om een externe infrastructuur te gebruiken die flexibel op- en afgeschaald kan worden. Clouddiensten zoals Amazon EC2 en Microsoft Azure leveren deze flexibiliteit en kunnen op elk willekeurig moment aangepast worden.
Crowdsourcing
Een andere belangrijke trend naast Big Data is crowdsourcing. Bij crowdsourcing wordt de ‘crowd’ gebruikt om vraagstukken op te lossen. Dit kunnen zowel simpele repetitieve taken zijn (zoals het herkennen van items op duizenden foto’s) als complexe taken zoals het verzinnen van een alternatief mechanisme om de zonnecellen op het internationale ruimtestation ISS te besturen. De kracht van de crowd is dat heel veel mensen parallel kunnen werken en elkaar aanvullen qua kennis en kunde. Ook voor het oplossen van Big Data-vraagstukken kan crowdsourcing een belangrijk hulpmiddel zijn.
De website www.kaggle.com helpt haar klanten om wedstrijden uit te schrijven waarin zij deelnemers uitnodigt om met gebruik van beschikbaar gestelde data een probleem op te lossen.
Kosten
Big Data kan organisaties helpen om een beter inzicht in de eigen performance en de omgeving te krijgen, veelal resulterend in een hogere efficiëntie of een scherpere benadering van problemen. Een eigen Big Data-afdeling zal echter voor veel organisaties niet lonend zijn, vanwege de dure parallelle infrastructuur en de dure competenties die nodig zijn voor het ontwikkelen en oplossen van Big Data-vraagstukken. Als je echter kijkt naar de mogelijkheden op de markt om Big Data-vraagstukken uit te besteden, dan komt men op een kosteneffectief alternatief. Men kan in principe per probleem betalen als men Big Data as a service gebruikt en voor sentimentsvraagstukken bestaan veelal vaste tarieven. Deze tarieven zijn over het algemeen lager dan een eigen investering in een Big Data-infrastructuur en -afdeling. Voor de op de cloud gebaseerde Big Data-infrastructuren geldt ook dat deze tegen een laag tarief kunnen worden afgenomen als ze niet gebruikt worden en afhankelijk van de benodigde ‘power’ kunnen worden opgeschaald.
Conclusie
Naar onze mening is Big Data niet alleen bedoeld of geschikt voor grote organisaties.
Sterker nog, juist voor kleinere organisaties kan Big Data een belangrijk middel zijn om op een kosteneffectieve manier inzicht te krijgen in interne en externe ontwikkelingen. Eigen Big Data-faciliteiten en -specialisten zijn voor veel kleinere organisaties niet rendabel, vanwege de hoge vaste kosten en het feit dat de betrokken specialisten uitgedaagd willen worden. Gelukkig zijn er tegenwoordig genoeg externe bedrijven die kunnen helpen met het beantwoorden van specifieke vragen door middel van Big Data. Dat Big Data een krachtig instrument is voor organisaties om de eigen performance en de omgeving te begrijpen, wordt bevestigd door de steeds langer wordende lijst met referentiecases.
 
Eelco Rouw is senior consultant bij het onderdeel Architectuur en Innovatie van Quint Wellington Redwood. E-mail: e.rouw@quintgroup.com
Arjan Hassing is partner bij netwerkorganisatie The Perfect Fit. E-mail: arjan@theperfectfit.nl
 

Tag

Mkb

Onderwerp



Niet gevonden? Vraag het de redactie!

Heeft u het antwoord op uw vraag niet gevonden, of bent u op zoek naar specifieke informatie? Laat het ons weten! Dan zorgen we ervoor dat deze content zo snel mogelijk wordt toegevoegd, of persoonlijk aan u wordt geleverd!

Stel uw vraag