Biedt de cloud uitkomst voor big data?

Biedt cloud uitkomst voor big data?
 
Cloud computing wordt vaak aangeprijsd als oplossing voor de opslag en verwerking van big data. De hardware en infrastructuuronafhankelijkheid van de cloud zou zich probleemloos vertalen naar gegevens en toepassingen. Maar is dat ook werkelijk het geval?
 
Rene Oskam
 
Het fenomeen ‘big data’ bezorgt ICT-organisaties kopzorgen en levert consumenten problemen op. Onder meer privacy wordt een heet hangijzer nu steeds meer informatie over consumenten wordt verzameld. Gebruikers die zich afvragen wat websites zoals Facebook precies over hen weten, moeten zich in allerlei bochten wringen om daar achter te komen. De kans is groot dat ze versteld zullen staan over de hoeveelheid persoonlijke gegevens die deze websites bewaren.
Bedrijven moeten enorme hoeveelheden klantgegevens bewaren, denk bijvoorbeeld aan de opslagcapaciteit die supermarktketens nodig hebben om informatie over de bestedingspatronen van hun klanten op te slaan. Dat roept een groot aantal vragen op, zoals wat de manier is waarop deze reusachtige hoeveelheden gegevens kunnen worden overgedragen en waar ze het beste kunnen worden bewaard. Misschien wel de interessantste vraag vanuit technisch opzicht is of de cloud een oplossing kan bieden voor de problemen waar eerdere initiatieven voor de uitwisseling van big data tegen aanliepen.
Cloud als datawarehouse
Het uitwisselen van gegevens gaat altijd met problemen gepaard, of dit nu gebeurt binnen het bedrijfsleven, de overheid of verticale sectoren zoals de gezondheidszorg. De grootste uitdaging is het bestandsformaat van de data, zowel voor de directe integratie als toegankelijkheid op de lange termijn.
Cloud computing wordt vaak aangeprijsd als oplossing voor de opslag en verwerking van big data. Dit enthousiasme is gebaseerd op de illusie van oneindige capaciteit. De werkelijkheid is echter anders. Als gegevens worden opgeslagen in een formaat dat niet op eenvoudige wijze door uiteenlopende toepassingen kan worden benut, vormt de cloud weinig meer dan een digitale dumpplaats voor bits en bytes.
Er wordt onterecht aangenomen dat de hardwareen infrastructuuronafhankelijkheid van de cloud zich probleemloos naar gegevens en toepassingen vertaalt. Deze hardnekkige misvatting is gebaseerd op een gebrekkig inzicht in de manier waarop gegevens worden omgezet en geschikt gemaakt voor koppeling met toepassingen. Big data zijn niet bijster geschikt voor overdracht via gangbare gestandaardiseerde methoden zoals RESTful API’s met JSON of in XML gecodeerde gegevens.
De uitwisseling van big data vereist veel meer zorg vanwege de enorme gegevensvolumes en
de noodzaak om gebruik te maken van een gegevensprotocol dat op eenvoudige wijze kan worden geïnterpreteerd door uiteenlopende platforms en programmeertalen. Helaas bijten deze twee vereisten elkaar. De formaten die het makkelijkst kunnen worden geïnterpreteerd door de meeste platforms en talen, leveren veel grotere gegevensreeksen op dan gegevens die zijn gecodeerd in compactere, ruimtebesparende formaten.
Cloud computing biedt geen oplossing voor dit specifieke probleem omdat het daar niet op is gericht. Het is waar dat de cloud de alomtegenwoordige toegang en direct schaalbare opslagcapaciteit biedt die nodig zijn voor een succesvolle gegevensuitwisseling. Cloud computing biedt echter geen oplossing voor de onvolkomenheden in het overdrachtsproces die de uitwisseling van big data vaak in de weg zitten. Voor deze hindernissen moet een oplossing worden gevonden voordat we ook maar van start kunnen gaan met het evalueren van de toegangscontrole en het beheer van een dergelijk datawarehouse. Als we aan deze problemen voorbijgaan, zal het niet lang duren voordat we in de knel raken met de wereldwijde privacyrichtlijnen die bepalen wie toegang mag hebben tot welke gegevens en vanaf welke locatie. De cloud biedt een prima oplossing voor uiteenlopende taken, en met name voor de parallelle analyse van big data. Deze gegevens moeten echter eerst naar de cloud worden overgezet en toegankelijk worden gemaakt voor de systemen die de analyse uitvoeren. Tot dusver zijn er weinig tekenen van initiatieven die zich in de praktijk hebben bewezen als een snelle, efficiënte en uiterst interoperabele oplossing. Mogelijk is dit een probleem waarvoor cloud computing simpelweg geen oplossing kan bieden – voorlopig tenminste.
Rene Oskam
werkt bij F5 networks Nederland. E-mail: r.oskam@f5.com.

Tag

Onderwerp



Niet gevonden? Vraag het de redactie!

Heeft u het antwoord op uw vraag niet gevonden, of bent u op zoek naar specifieke informatie? Laat het ons weten! Dan zorgen we ervoor dat deze content zo snel mogelijk wordt toegevoegd, of persoonlijk aan u wordt geleverd!

Stel uw vraag