De uitdaging die Big Data heet

Pijnpunten en richtlijnen bij integratie van Big Data-analytics, Een onderzoek bij 73 bedrijven wereldwijd, uit sectoren als financiële diensten, consulting, technologie, overheid, telecom en retail, geven inzicht in hoe bedrijven zich vandaag aanpassen aan analytics en aan de nieuwe uitdagingen die Big Data creëert.

Jasmien Lismont, Jan Vanthienen, Bart Baesens & Wilfried Lemahieu

Gebruik van analytics in een organisatie is noodzakelijk om competitief te blijven. Het is echter een lang proces om analytics integreren in de organisatie [2] en er vervolgens de vruchten van te plukken. Ondertussen ontwikkelen innovatieve technologieën zich sneller dan bedrijven zich kunnen aanpassen. Zo dwingen de verschillende kenmerken van Big Data ons om nog sneller te reageren.

Hedendaagse toepassing
De werkelijke toepassing van het concept analytics is pas de laatste jaren aan het stijgen. Veel bedrijven bevinden zich nog steeds in de implementatiefase van analytics. Dit zien we terug in de technieken en doelstellingen die hiermee gepaard gaan. Marketinganalytics wordt bijvoorbeeld vaker toegepast dan HR-analytics. Deze laatste brengt bovendien gevoeligere, personeelgebonden inzichten met zich mee, wat sommige bedrijven afschrikt.
Daarnaast zien we dat bedrijven initieel eerder voor descriptive analytics dan voor meer geavanceerde predictive analytics [3] kiezen. Dit uit zich in de gebruikte technieken. Organisaties kiezen eerder simpele toepassingen die minder performante modellen creëren [7]. Zo werkt 74 procent met beslissingsbomen en met de welgekende lineaire regressie techniek. Echter, slechts 33 procent gebruikt neurale netwerken en slechts 22 procent support vectormachines.
Deze observatie kan gelinkt worden aan het groeiproces van organisaties. Data science-teams die net gestart zijn in bedrijven, dienen hun modellen te kunnen verantwoorden om het vertrouwen van het management te winnen.

 

 Implementatie

Veel bedrijven nog in de implementatiefase

Er is dus nog veel potentieel is op gebied van analytics en zijn toepassingen. Dit geldt ook voor Big Data-analytics. Werken met grote hoeveelheden of met ongestructureerde data, vergt niet alleen andere technieken, maar ook een nieuwe kijk op data en analytics. We zien dat reeds 45 procent van de bedrijven webanalyticssoftware heeft geïmplementeerd (tegenover 38 procent niet en 16 procent ongekend). Hadoop is door 40 procent geïnstalleerd (tegenover 49 procent niet) en 37 procent heeft textminingsoftware in gebruik (tegenover 49 procent niet).

Het analyticsteam
Er is veel interesse in de vraag hoe bedrijven analytics kunnen integreren. In grote lijnen zien we de volgende structuren: (1) een gecentraliseerd team of center of excellence, (2) een lokaal team, (3) een verspreid model, en (4) uitbesteding van analytics. Eerdere studies [3], [5], [6] tonen aan dat een verspreid model, waarbij data scientists ongecoördineerd op verschillende plaatsen in het bedrijf werken, het meest voorkomt. Toch leidt een gecentraliseerd model sneller tot maturiteit omdat dit schaal- en synergievoordelen bewerkstelligt [10]. Ook draagt dit bij aan overdracht van kennis en expertise wat een datagedreven cultuur aanmoedigt. Tegelijkertijd zal een werkelijk datagedreven bedrijfscultuur [10] vaak een gecombineerd model gebruiken met lokaal en niet gecoördineerde data scientists om kort op de bal te kunnen spelen.
Onze survey toont dat bedrijven verschillende combinaties gebruiken, maar ook dat centralisatie de voorkeur heeft. Bovendien signaleren we dat in bijna twee derde van de bedrijven, de verantwoordelijke voor analytics een hoge positie bekleedt, wat toont dat inzichten gedreven door data aan belang winnen. Drie veel voorkomende toedelingen van de verantwoordelijkheid zijn:
-    een bestaande chief-level executive (CXO) (29 procent),
-    een nieuw gecreëerde CXO functie (24 procent), bijvoorbeeld een chief analytics officer, of
-    het hoofd van het betreffende departement waar analytics wordt toegepast (29 procent).
Slechts in 8 procent van de bedrijven is een middenmanager verantwoordelijk, in 6 procent de chief executive officer en in 5 procent niemand.
In het algemeen, zijn de meeste analyticsteams relatief klein. Bijna de helft van de organisaties heeft tien of minder data scientists. Wel merken we dat de grootte van de teams groeit. Er is een positieve correlatie tussen de grootte van een team en de omvang van het bedrijf, het aantal jaar dat het bedrijf analytics uitvoert, als het bedrijf aan e-business doet en als het bestuur aanstuurt op een analytics cultuur. Daarnaast zijn data scientists in het algemeen mannelijk en jong met een gemiddelde leeftijd van 32. Slechts 20 procent van de teams heeft een evenwichtige genderdiversiteit en 7 procent heeft een overwegend vrouwelijk team.

Kwaliteiten van een data scientist
De analyticsteams groeien, maar het aantal data scientists groeit onvoldoende mee. McKinsey Global Institute [8] voorspelde in 2011 een tekort van 140.000 tot 190.000 mensen met geavanceerde analytische vaardigheden en bovendien een tekort van 1,5 miljoen managers en analisten die weten hoe ze inzichten uit Big Data kunnen omzetten in beslissingen. De juiste mensen met de juiste kwaliteiten vinden wordt dus steeds moeilijker en belangrijker.
Onze survey peilde de vaardigheden die bedrijven verwachten van hun data scientists. In het algemeen zoeken bedrijven naar een goede combinatie van kwantitatieve vaardigheden en inzicht in de bedrijfsproblematiek. Verder valt het op dat er enkele atypische vaardigheden belangrijk zijn geworden, zoals juridische kennis en inzicht in data kwaliteit. Minder belangrijk zijn hardware vaardigheden. Dit kan mogelijk verklaard worden door een grotere scheiding van het IT en analytics team. In 79 procent van de bedrijven heeft IT immers een ondersteunde rol voor analytics.
Daarnaast merken we op dat de huidige tekorten in drie grote categorieën vallen. Ten eerste, is er nog steeds een grote behoefte aan personen met kwantitatieve vaardigheden. Ten tweede wordt er een nadruk gelegd op de voeling met de departementen en het bedrijf waarbinnen analytics wordt toegepast. Dit is belangrijk om analytics op de juiste plaatsen toe te passen en data werkelijk te kunnen omzetten in inzichten en beslissingen. Ten slotte, is er een nieuwe behoefte ontstaan, namelijk kunnen werken met Big Data. Bedrijven zijn op zoek naar mensen die kunnen omgaan met uiteenlopende data en grote datavolumes. Het is niet gemakkelijk om al deze kwaliteiten in één persoon te vinden, dus het wordt nog belangrijker om het juiste team samen te stellen en hen de juiste opleiding te geven.

vaardigheden

Waardering van vaardigheden voor data scientists


Biedt cloud een oplossing?
Recent is er een nieuw concept van geautomatiseerde analytics [4], [11] opgedoken. Deze application programming interfaces (API’s) berusten op een cloudplatform voor de opslag en het delen van data en analytics modellen. Dat biedt de mogelijkheid met analytics aan de slag te gaan zonder grote soft- en hardware investeringen. Bovendien zouden deze oplossingen analytics toegankelijk maken voor personen zonder expertise. Met slechts enkele kliks kunnen bijvoorbeeld marketing, financiën en HR specialisten hun data visualiseren en inzichten genereren. We maken hierbij enkele kanttekeningen. Meer bepaald, men kan zich afvragen wie de verantwoordelijkheid draagt voor de besluiten die uit deze modellen voortvloeien: de verkoper van de API, de bedrijfsspecialist, IT of de manager? Daarnaast hebben leken moeite om inzichten te valideren [1], [11]. Daarom is het aangeraden om een minimum opleiding te bieden en de geijkte stappen van het analyticsproces als richtlijnen aan te houden [11].
Wel kunnen analytics API’s een (tijdelijke) oplossing bieden voor een tekort aan data scientists, en voor de complexiteit van Big Data. De cloud laat toe om grote hoeveelheden data op een flexibele manier en zonder grote investeringen op te slaan en hier vervolgens de nodige technieken op los te laten. Daarnaast steunen deze API’s op het creëren van een analyticsplatform [4] waar technieken intern en extern gedeeld kunnen worden. Dit kan in-house datascientists kennis laten maken met geschiktere technieken. Ten slotte is er een aantal API’s die zich specifiek focussen op het analyseren van tekst, video of web analytics. Daarmee kan een organisatie snel nieuwe soorten data analyseren zonder grote investeringen of een lange leercurve.

Maturiteit
In het verleden zijn verscheidenen maturiteitsmodellen voor data warehousing en business intelligence voorgesteld [9]. Modellen specifiek gericht naar analytics maturiteit zijn echter nog beperkt. Eén van de bekendste bestaat uit de vijf opeenvolgende fasen van analytics competitiviteit, ontwikkeld in 2007 door Davenport en Harris [2]. In 2010 werd dit aangevuld met het DELTA raamwerk [3], hetgeen staat voor toegankelijke, hoge kwaliteit data; bedrijfsoriëntatie; analytics leiderschap; strategische doelstellingen; en de analisten zelf. Dit model bevat verscheidene richtlijnen om per succes factor over te gaan naar een hoger niveau van analytics competitiviteit.
Ook wij zien verschillende niveaus van maturiteit terugkomen in onze resultaten. Bedrijven ontwikkelen zich op gebied van technieken en toepassingen. HR-analytics is bijvoorbeeld enkel aanwezig in de meest mature bedrijven. Bovendien, hoe langer een bedrijf analytics toepast, hoe vaker men voorspellende toepassingen in plaats van enkel descriptieve technieken nastreeft. Initieel starten de meeste bedrijven met simpele OLAP-technieken en segmentatie. Op een volgend niveau starten bedrijven met simpele, begrijpbare analyticstechnieken, bijvoorbeeld beslissingsbomen en regressietechnieken. Ten slotte passen de meest mature bedrijven ook geavanceerde [7] technieken toe, zoals neurale netwerken en ensemble technieken. Naast de groeicurve in technieken en toepassingen, bemerken we ook een groeicurve in organisatie. Aanvankelijk starten bedrijven met simpele, kleinschalige projecten. Dit evolueert dan naar analytics georganiseerd op departement niveau en ten slotte organisatiewijde analytics met een zeer data-gedreven beslissingsproces.

Conclusie
Big Data brengt nieuwe uitdagingen met zich mee in een reeds veranderende bedrijfsomgeving. Hoewel veel bedrijven bezig zijn te leren omgaan met analytics, merken we dat er toch reeds plaats is voor Big Data. Bedrijven kijken naar nieuwe tools, zoeken nieuwe vaardigheden in hun data scientists en streven een data-gedreven beslissingscultuur na. Echter, de weg is nog lang. Door een goede focus op de organisatie van zowel data als mensen, kunnen bedrijven zich uiteindelijk opwerken naar echte Big Data analytics competitieve bedrijven.

Jasmien Lismont, is als PHD Researcher verbonden aan de Onderzoeksgroep Beleidsinformatica, van de KU Leuven.

Prof. Dr. Jan Vanthienen, is Full professor aan de Faculteit Economie en Bedrijfswetenschappen van de KU Leuven

Prof. Dr. Bart Baesens, is hoogleraar aan de Faculteit Economie en Bedrijfswetenschappen van de KU Leuven.

Prof. Dr. Wilfried Lemahieu doceert Beleidsinformatica en Database Management aan de Faculteit Economie en Bedrijfswetenschappen van de KU Leuven.

 

Referenties
Alpar, P., and Schulz, M. Self-Service Business Intelligence. Business & Information Systems Engineering, 58(2): 151 – 155, 2016.
Davenport, T.H., and Harris, J.G. Competing on analytics: The new science of winning. Harvard Business Review Press, Boston, MA, 2007.
Davenport, T.H., Harris, J.G., and Morison, R. Analytics at work: Smarter decisions, better results. Harvard Business Review Press, Boston, MA, 2010.
Demirkan, H., and Delen, D. Leveraging the Capabilities of Service-Oriented Decision Support Systems: Putting Analytics and Big Data in Cloud. Decision Support Systems, 55(1): 412 – 421, 2013.
Griffin, J., and Davenport, T.H., Organizing Analytics: Building an Analytical Ecosystem for Today, Tomorrow, and Beyond. Technical report, Deloitte Global Services Limited, 2011.
LaValle, S., Lesser, E., Shockley, R., Hopkins, M.S., and Kruschwitz, N. Big Data, Analytics and the Path from Insights to Value. MIT Sloan Management Review, 52(2):21 – 32, 2013.
Lessmann, S., Baesens, B., Seow, H.-V., and Thomas, L.C. Benchmarking state-of-the-art classification algorithms for credit scoring: An update of research. European Journal of Operational Research, 247(1):124 – 136, 2015.
Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburgh, C., and Byers, A. H. Big Data: The Next Frontier for Innovation, Competition, and Productivity. McKinsey Global Institute, 2011. (http://www.mckinsey.com/insights/mgi/research/technology_and_innovation/... accessed August 4, 2012).
Muller, L., and Hart, M. Updating Business Intelligence and Analytics Maturity Models for New Developments. In Decision Support Systems VI – Addressing Sustainability and Societal Challenges – 2nd International Conference (ICDSST) Proceedings, pages 137 – 151, Plymouth, UK, May 2016.
Saxena, R., and Srinivasan, A. Business Analytics: A Practitioner’s guide. Springer-Verlag, New York, NY, 2013.
Van Calster, T., Lismont, J., Óskarsdóttir, M., vanden Broucke, S., Vanthienen, J., Lemahieu, W., Baesens, B. Automated Analytics: The Organizational Impact of Analytics-as-a-Service. In 1st Workshop on Enterprise Intelligence in conjunction with 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco, USA, August 2016.

 

Tag

Onderwerp



Niet gevonden? Vraag het de redactie!

Heeft u het antwoord op uw vraag niet gevonden, of bent u op zoek naar specifieke informatie? Laat het ons weten! Dan zorgen we ervoor dat deze content zo snel mogelijk wordt toegevoegd, of persoonlijk aan u wordt geleverd!

Stel uw vraag