Te veel servers staan voor niets te snorren

IT moet groener en daar wordt ook al jaren hard aan gewerkt. Toch worden ogenschijnlijk voor de hand liggende mogelijkheden soms niet of nauwelijks benut. Neem bijvoorbeeld het dynamisch bij- en afschakelen van servers in clusters.

In de wereld van Green IT wordt nogal geschermd met PUE-scores, die aangeven hoe efficiënt een datacenter omgaat met de energie die het verbruikt. De gedachte is dat de ondergrens van het energieverbruik van een datacenter wordt gedefinieerd door de stroom die wordt opgeslorpt door z’n processors. Alles wat een datacenter meer gebruikt is theoretisch gezien onproductief. Maar zelfs bij een welhaast per definitie onhaalbaar mooie PUE van 1,0 kan het nog steeds zo zijn dat er aanzienlijk energie wordt vermorst. Simpelweg omdat er processors zinloos aan staan.

Volgens onderzoek van IDC staat zo’n 75 procent van de servers in datacenters te snorren zonder dat de applicaties die er op draaien daadwerkelijk worden gebruikt. Gewoon, omdat de applicatie beschikbaar moet zijn. “Het is alsof je vanavond bij thuiskomst je auto parkeert en de motor stationair laat draaien, de hele nacht, omdat je niet kunt uitsluiten dat je alsnog onverwachts weg moet”, versimpelt Stijn Timmermans de situatie. Timmermans is reseller voor het Canadese softwarebedrijf TSO Logic. Z’n vergelijking gaat in die zin mank, dat auto’s enkelingen zijn, terwijl servers meestal in clusters draaien. Dat betekent dat de keuze – anders dan bij auto’s – niet ‘aan’ versus ‘uit’ hoeft te zijn, maar ook ‘meer of minder servers aan’ mag luiden.

TSO Logic, u raadt het al, levert software om servers in datacenters automatisch af en bij te schakelen, naar gelang de benuttingsgraad op dat moment. “Als op een bepaald moment bijvoorbeeld vier van de tien processors voldoende zijn om de voortgang van de bedrijfsprocessen te verzekeren, zet dan vijf processors uit. Dan is één processor standby voor als de gebruiksintensiteit oploopt. Op het moment dat die ook daadwerkelijk wordt aangesproken start onze software automatisch de zesde server op, als nieuwe standby. Op die manier kan het onbenut aanstaan van servers in rekencentra worden terugdrongen, van de huidige 75 procent (IDC) naar laten we zeggen 25 procent. Dat betekent een halvering van het energieverbruik, zonder dat de eindgebruikers er ook maar iets van merken,” rekent Timmermans voor.

Vreemd genoeg pakken datacenters die mogelijkheid vooralsnog nauwelijks op, ervaart Timmermans. “Als onze sales-mensen bij datacentermanagers het woord ‘uitzetten’ laten vallen dan schrikken die zich meestal wezenloos, want ze worden afgerekend op beschikbaarheid en niet op stroomverbruik. Beschikbaarheid is ook enorm belangrijk, natuurlijk. Dat is ook de reden dat zo’n server-cluster permanent aan staat. Ons punt is echter dat beschikbaarheid het niet per se nodig maakt hele clusters doorlopend aan te laten staan.”

 

Tot nog toe te hachelijk

Het klinkt als het ei van Columbus, wat de vraag oproept of dit niet al veel eerder is bedacht. Volgens Michiel Cuijpers van het Knowlegde Network Green Software (#KNGS) is het dat ook. “Vrijwel alle virtualisatie-stacks bieden in hun hypervisors voorzieningen om dynamisch op en af te schalen. De reden waarom daar nauwelijks gebruik van wordt gemaakt is dat de meeste organisaties verschillende virtualisatie-stacks naast elkaar in gebruik hebben. Die heterogeniteit maakt de relatie tussen beschikbaarheid en gebruik van capaciteit meteen stukken complexer, waardoor beheerders dynamisch af- en bijschakelen als te riskant zien. Voor ‘die paar euro aan energiebesparing’ vinden ze het gewoon te hachelijk of te veel gedoe. Als TSO er in slaagt om het makkelijk en betrouwbaar te maken, en daar lijkt het inderdaad wel op, dan voorzie ik dat de businesscase voor dynamisch op- en afschalen in heel veel rekencentra snel te maken is.”

TSO claimt ook in homogene omgevingen effectiever te zijn dan de oplossingen die worden meegeleverd met de diverse virtualisatiestacks. Die grotere effectiviteit zou berusten op diepgravender analytics ten aanzien van de wisselingen in de belasting. Zo zegt TSO onder meer de belasting van de servers tot op applicatieniveau naar herkomst te analyseren. Dat levert onder meer inzicht op in comateuze of excessief vermogen opslorpende toepassingen. Vanwege het vermogen op applicaties afzonderlijk te monitoren typeert TSO zijn oplossing als ‘application-aware power management’. Een claim waarop volgens Niels van der Zwan van Software Improvement Group, wel iets af te dingen valt: “Alleen als een applicatie enkel en alleen dedicated machines ­gebruikt, kun je met TSO meten wat deze applicatie verbruikt. Vaak is dat niet het geval omdat veel applicaties machines en resources delen. Denk bijvoorbeeld aan een SAN, dat wordt gedeeld tussen applicaties.”

 

‘Loadmanagement-paraplu’

Wat de software van TSO Logic in feite doet is het organiseren van een technologie-agnostische ‘loadmanagement-paraplu’ over de diverse hypervisors (VMWare, Microsoft Hyper-V, Linux, OpenStack, etc ) heen. De software (TSO Metrics) monitort de huidige en inkomende workload op server- en applicatie-niveau. In directe reactie op de gesignaleerde vraag worden afzonderlijke virtuele en/of fysieke servers door een tweede tool (TSO Power Control) af- dan wel bij ingeschakeld. Voorop staat daarbij dat applicaties de gewenste performance behouden.

TSO Logic werkt daartoe nauw samen met technologiebedrijven als F5, A10, VMware, Intel en VCE (VBlock). De software van TSO Logic kan dan ook uit de voeten met vrijwel alle gangbare hardware-merken en virtualisatiestacks. Mede daardoor is invoering doorgaans mogelijk zonder noemenswaardige verstoring van de operationele gang van zaken in het ­rekencentrum. Implementatie vergt volgens Timmermans hooguit twee dagen. Dat gebeurt door Canadese specialisten van TSO; zo nodig on site, maar meestal op afstand via een IP-adresbepaald ‘gaatje’ in de firewall.

Lead Solutions Architect Jan-Willem Lammers van VMWare vindt het verhaal van TSO ‘zeker interessant’, maar zou de besparingspercentages die Timmermans claimt wel graag bewezen zien via een praktijk-implementatie. VMWare’s eigen DPM (Distributed Power Management) is in gebruik bij enkele rekencentra in Nederland, onder meer van de centrale overheid. Toch kan ook Lammers geen besparingspercentage noemen: “Er spelen te veel factoren mee. Bij een van de grotere datacenters waar DPM werd geïmplementeerd was bijvoorbeeld de inrichting en de schaal van de processen al zodanig dat de behoefte aan servercapaciteit er al behoorlijk continu is; als er ’s nachts dan minder realtime toepassingen draaien worden er automatisch batchprocessen opgestart, zoals back-up en dergelijke. Het gevolg is dat DPM daar hoofdzakelijk van nut is doordat het nieuw geïnstalleerde servers, die dan aanvankelijk uit kunnen staan, automatisch aanzet als de gestage groei van de behoefte dat nodig maakt.”

 

Issues bij hosting

Een andere factor die grenzen stelt aan de inzetbaarheid van TSO’s technologie is de trend naar uitbesteding van de zorg voor de ‘ijzer­waren’. Daarbij ontstaat een taakverdeling tussen tussen het ‘laten snorren’ van de servers en het managen van de applicatie-processen. De software van TSO valt daarbij min of meer tussen wal en schip. De opdrachtorganisatie besteedt uit om worden ontzorgd wat infrastructuur betreft en daar past ‘gedoe’ met dynamisch bij- en afschakelen niet in. En de infrastructuurdienstverleners zien deze softwaretools als iets wat buiten hun jurisdictie valt. “Als multitennant DC operator/colocation provider beheren wij de serveromgevingen van klanten niet, dit ligt voor ons binnen het klantdomein. Maar met name voor hosters en ­enterprises is het verhogen van de energie efficiency van de ‘IT power’ een prima oplossing”, stelt managing director Eric Boonstra van Evoswitch. EvoSwitch is al vanaf de oprichting in 2007 zeer gespitst op mogelijkheden om het energieverbruik terug te dringen, waardoor ze kunnen bogen op een PUE van 1.2 en een CO2-neutrale site in Nederland. Boonstra: “Interessante vraag is of wij als multi-tennant DC operator een rol hebben om klanten te stimuleren dit soort software te gebruiken. Op deze manier kan de totale onbenutte capaciteit uit de DC’s gehaald worden.”

Ook manager ‘Bare Metal Servers’ Marc Burkels, van LeaseWeb, schuift het onderbenuttings-issue door richting klant. “Voor de hosting-infrastructuur van LeaseWeb zelf is de genoemde tool minder interessant. Wij besteden al heel veel aandacht aan de energie-efficiëntie van onze systemen en de gebruikte technologieën. Als IaaS-provider leveren wij hosting services inclusief het OS. Een klant is vervolgens volledig vrij om te bepalen wat hij met de hosting-infrastructuur gaat doen – welke software hij erop installeert en dus ook of hij software wil installeren die de servers kan aan- en uitschakelen. Een wat grotere klant van LeaseWeb zou misschien zelf kunnen besluiten om een dergelijke software tool in te zetten, bijvoorbeeld wanneer deze klant een cluster draait. De kwaliteit van dit specifieke tool zou ik wel eerst moeten onderzoeken.”

 

Nederland terughoudend

Wereldwijd wordt de software van TSO al door enkele tientallen rekencentra gebruikt in verschillende bedrijfskritieke omgevingen van onder meer banken, zorginstellingen, luchtvaartmaatschappijen, universiteiten en mediabedrijven. Maar in Nederland betonen datacenter beheerders zich vooralsnog terughoudend. Timmermans: “Bedrijven als KPN, CGI, Atos, Capgemini en ING kunnen hiermee onmiddellijk geld besparen. Als we het bij detacenterbeheerders presenteren vinden ze het ook reuze interessant, maar alswe een proof of concept voorstellen, dan wordt er vaak toch geaarzeld, zo van ‘tja, daar moeten we dan wel even tijd voor hebben, we komen er op terug’. En vervolgens belandt het toch onderop de stapel. Kennelijk heeft green IT niet echt prioriteit in deze wereld, waar availability eigenlijk voor iedereen het alfa en het omega is.”

Tenslotte zou men zich nog kunnen afvragen of de nadruk op PUE’s als maat voor energie-efficiëntie niet in de hand werkt dat datacenters slechts matig geïnteresseerd zijn in besparingen die niet bijdragen aan een lagere PUE, omdat ze in de breuk ‘totaal energieverbruik’ gedeeld door ‘het energieverbruik door de processors’ niet de teller maar de noemer verkleinen.

 

Businesscase doorgerekend

Voor de eigenaar van de serveromgevingen zit de winst in het terugdringen van de elektriciteitsrekening, bij datacentra verreweg de grootste kostenpost. TSO Logic hanteert naast reguliere licentiemodellen ook een zogeheten benefit share, waarbij het bedrijf 40 procent van de mogelijke financiële besparing ontvangt.

Een gemiddelde server gebruikt al snel 4000 kWh per jaar voor het draaien en rekenen. Een server die niets te doen heeft gebruikt 1750 kWh en daar zit de besparing. Een niet al te modern datacenter verliest daarbij een factor 1,7 aan koeling en andere ondersteunende systemen (PUE). Het werkelijke stroomverbruik van een server die niets doet komt daarmee op 2950 kWh per jaar. Een relatief klein servercentrum van 600 fysieke eenheden bespaart dus 1.327.500 kWh per jaar. Tegen een prijs van 11 cent per kWh en rekening houdend met toekomstige prijsstijgingen en groeiend processorverbruik boekt TSO Logic een maximale besparing in van bijna 1 miljoen euro over vijf jaar.

Tag

PUE

Onderwerp



Niet gevonden? Vraag het de redactie!

Heeft u het antwoord op uw vraag niet gevonden, of bent u op zoek naar specifieke informatie? Laat het ons weten! Dan zorgen we ervoor dat deze content zo snel mogelijk wordt toegevoegd, of persoonlijk aan u wordt geleverd!

Stel uw vraag