FLASH INFORMATIQUE FI



Cloud privé de l’EPFL, bilan et perspectives


Le service d’hébergement de machines virtuelles de l’EPFL, voilà un cloud privé qui ne fait pas de bruit médiatique, son premier quinquennat méritait bien un article pour fêter cet anniversaire.



The hosting of virtual machines at the EPFL, this is a private cloud that goes largely unnoticed by the media. Its 5th birthday deserves a celebrating article.


Fabien FIGUERAS


Introduction

Les avantages de la virtualisation sont nombreux, citons-en seulement trois qui nous semblent les plus significatifs : elle permet d’améliorer l’efficacité énergétique [1] en consolidant les instances de différents systèmes d’exploitation sur une même machine. Elle permet de gagner en flexibilité et en dynamique dans la gestion des ressources IT en disposant rapidement de machines, les modifiant selon les besoins et les rendant lorsqu’elles ne sont plus utilisées.
Dans cet article nous reviendrons sur l’historique du projet de mise en production de ce service et nous verrons quelles évolutions ont été apportées depuis son lancement. Ensuite nous présenterons quelques statistiques d’utilisation. Enfin nous terminerons par quelques perspectives d’avenir.

Historique du projet (2006-2007)

Dès 2004, à l’initiative du directeur du DIT, un groupe de réflexion a été mis sur pied pour se pencher sur la question de la virtualisation à l’EPFL. Fin 2005, les conclusions de l’étude menée avec un consultant ont conduit au lancement d’un projet de mise à disposition d’un service d’hébergement de machines virtuelles.
Une étude approfondie a été réalisée dans la deuxième moitié de 2006. Elle a permis de définir plus précisément le nombre et le type de machines virtuelles à supporter, le choix technique de l’hyperviseur (Xen, VMWare ou Microsoft ) et finalement l’analyse des coûts et la rentabilité de la solution proposée.
Au printemps 2007 un pilote a été réalisé au DIT. À la fin de l’été, tous les voyants étant au vert, le service fut ouvert pour toute l’École [2].
Le service était composé d’un site Web (myvm.epfl.ch) qui offrait aux utilisateurs la possibilité de demander des machines virtuelles (Windows ou Linux), de les modifier et de les supprimer. La machine virtuelle de base proposée était composée d’un CPU 64 bits, de 2 GB de RAM, de 36 GB de disque et d’une carte réseau, avec système d’exploitation installé ou non selon la volonté de l’utilisateur.
Des objectifs annuels de fiabilité et disponibilité ont été fixés : un maximum de deux pannes et un total de cinq heures d’interruption de service, soit plus de 99.94% de disponibilité. Ces objectifs ont toujours été dépassés  !
Aujourd’hui il est possible d’avoir jusqu’à 4 CPU, 32 GB de RAM et quelques centaines de GB de disque avec bien sûr toutes les combinaisons possibles des ressources.
Les ressources demandées sont garanties, contrairement au cloud public qui, pour d’évidentes raisons financières, partage au maximum les ressources physiques entre les machines virtuelles  ! Comme l’augmentation des ressources ne prend que quelques minutes, il est bien sûr recommandé de commencer avec la machine la plus petite possible et d’augmenter les ressources en fonction des besoins : des statistiques détaillées des ressources consommées par les machines sont disponibles en temps réel pour les utilisateurs. L’utilisateur a aussi accès à une console, bien utile en cas de plantage de l’OS de la machine virtuelle.

Évolutions techniques (2007-2012)

En 2007, les machines virtuelles fonctionnaient avec la version 3 de l’hyperviseur de VMWare ESX. Les serveurs pour l’hyperviseur étaient des Dell PE6950 quadri processeur bi-cores AMD 64 bits avec 32 GB de mémoire vive, 6 connexions pour réseau IP à 1Gbps et deux connexions fibre   à 2Gbps pour le réseau de stockage. Les disques des machines virtuelles étaient stockés sur une baie EMC. Depuis son ouverture en 2007, tous les composants de l’infrastructure sous-jacente ont évolué librement et chacun à leur propre rythme de manière quasi-transparente pour les utilisateurs. Les quatre générations de serveurs qui se sont succédées (PE6950, R805 et R805_2, R715) ont permis de passer de onze machines virtuelles par serveur à trente-six aujourd’hui  ! Les huit connexions IP et fibre ont été remplacées par deux connexions FCoE  à 10GBps. La baie de stockage utilise aujourd’hui des disques SSD   et des disques SAS  .
Ces évolutions ont permis d’augmenter les performances, de réduire le nombre de serveurs physiques et de faire régulièrement baisser le coût de la machine virtuelle depuis 2007 à un rythme légèrement supérieur à celui de la loi de ... Moore, loi qui divisant par deux le prix tous les 18 mois sur 5 ans donnerait un ratio de 3.33 alors que nous sommes à 3.81  ! Le service offert s’est aussi enrichi avec, entre autres, la possibilité de faire une image (snapshot) de la machine virtuelle à un instant précis.
Initialement uniquement hébergée dans la salle informatique du bâtiment MA, l’infrastructure s’est étendue à la salle informatique du bâtiment INJ. Ce qui permet aux utilisateurs dont le service supporte un fonctionnement sur plusieurs machines de les répartir sur les deux sites et d’obtenir ainsi un haut niveau de résistance aux sinistres.

Statistiques d’utilisation du service (2007-2012)

Le service a connu pendant les quatre premières années une croissance très forte, elle s’est cependant considérablement infléchie en 2011. La virtualisation des machines physiques vieillissantes doit être presque terminée et on rentre maintenant dans une croissance organique normale, mais quand même avec un taux de 17% en 2011  ! Sur l’ensemble des machines 6% ont 4 vCPU, 29% 2 vCPU et 65% 1 vCPU. La machine virtuelle moyenne dispose de 1’631 MHz de fréquence processeur, 2’748 GB de mémoire et 17 GB de disque.
55% des systèmes d’exploitation sont sous Linux et 45% sous Windows. 72% sont en 64 bits et 28% en 32 bits. 51% des Windows sont encore en 32 bits alors que seulement 14% des Linux le sont. 56% de la puissance CPU totale est allouée aux machines Windows et 44% aux machines Linux. 49% de la mémoire totale est allouée aux machines Windows et 51% aux machines Linux.
62% de l’espace disque est alloué aux machines Windows et 38% aux machines Linux. 99 machines virtuelles (21% du total) ont été sauvegardées par le service de sauvegarde centralisé Veritas Netbackup, dont 57% de Windows et 43% de Linux. En 2011, 108 TB ont été sauvegardés et le temps de sauvegarde journalier est en moyenne de 20 minutes par machine. Les machines Windows représentent 77% du volume sauvegardé pour 87% du temps total contre 33% du volume et 13% du temps pour les machines Linux.


Pourcentage d’OS Linux par distribution


Pourcentage d’OS Windows par distribution


Nombre de machines virtuelles

La courbe ci-dessus ne donne malheureusement qu’une image figée en fin d’année du nombre de machines virtuelles actives. Ainsi on pourrait croire qu’en 2011 il n’y a eu que 71 demandes de nouvelles machines alors qu’en fait c’est plus de 300 demandes qui ont été traitées.
Le graphique ci-dessous montre la répartition des différents processus du service depuis 2007. Le processus de snapshot a été ajouté en 2009 (il représente 10% des processus en 2011). En 2011 les trois principaux processus sont les créations (39%), les modifications (28%) et les suppressions (16%).


Répartition des processus du service

Nous garantissons que pour fournir une machine virtuelle standard avec ou sans OS, il ne s’écoulera en moyenne pas plus de 3 jours, en 2011 la moyenne est de 1,92 jour.
Pour les demandes spécifiques, aucune limite de temps n’est prévue, pour 2011 ces machines, qui nécessitent des échanges entre utilisateurs et administrateurs du service, ont été fournies en moyenne en 2.27 jours.
Les facultés disposent d’un quota annuel de machines virtuelles. Dans le cas où elles souhaiteraient plus de ressources, il est possible d’en acheter à un tarif convenu en début d’année.
Le graphique ci-dessous montre le nombre de machines virtuelles par faculté début 2012.
Depuis 2007, 199 machines virtuelles ont été créées puis supprimées, la durée de vie moyenne de ces machines est de 212 jours. 50% des machines ont eu une durée de vie supérieure à 385 jours.


Durée de vie en mois des machines virtuelles


Nombre de machines virtuelles par faculté au 09 fév. 2012

La répartition globale du nombre de machines est de 27 % pour les facultés et 73% pour les vice-présidences et le support des services à destination de l’école (VP-SC). Le graphique ci-après en montre la répartition début 2012.


Répartition du nombre de machines virtuelles au 09 fév. 2012

Et pour la suite  ?

Du côté de l’infrastructure, le site Web utilisateur est en cours de re-développement. La nouvelle version profitera du travail déjà réalisé pour les sites mynas, sanas et backup. La nouvelle version devrait être en production au début de l’été, une présentation sera organisée avant le passage en production.
La technologie FCoE déjà présente en MA sera déployée au printemps dans le nouveau centre informatique en INJ.
L’hyperviseur sera mis à jour au printemps pour la version la plus récente (vSphere 5). Cette version repousse les limites d’une machine virtuelle à 32 vCPU, 1 TB de RAM et presque 2TB par disque virtuel  ! Pour plus de détail, voir [3].
Nous avons, pendant l’été 2011, comparé les caractéristiques et le prix du cloud privé de l’EPFL aux offres du cloud public Amazon. Les résultats ont montré qu’à caractéristiques identiques et pour une utilisation permanente pendant un an, le prix d’une machine virtuelle chez Amazon était 30% plus cher que celui d’une machine hébergée dans notre cloud privé  ! Pour le calcul scientifique à hautes performances, actuellement point de salut dans le cloud public non plus [4].
Cependant dans le cadre de déploiements massifs, mais de courte durée, l’utilisation de ressources externes pourrait être utile. Nous allons donc étudier la faisabilité technique d’un Hybrid-Cloud : c’est-à-dire la possibilité de déployer dans un cloud public de nouvelles machines en plus de celles déjà existantes dans notre cloud privé et ce si possible de manière transparente pour l’utilisateur.

Conclusion

Pour conclure cet article je souhaiterais simplement remercier tous les collaborateurs du groupe exploitation du DIT qui ont participé à la mise en place de ce service, le font vivre au jour le jour et évoluer, pour la plus grande satisfaction de ses utilisateurs. En commençant par son responsable Jean-Claude De Giorgi, puis par ordre alphabétique : Patrice Beaud, Lucien Chaboudez, Éric Krejci, Julia Paolini et Alexandre Van Meteren.
J’encourage aussi tous les utilisateurs de machines virtuelles à témoigner auprès de leur collègues du temps qu’ils ont gagné en ne s’occupant plus d’installer, de maintenir et de remplacer des machines physiques.
Et n’oubliez pas, si vous avez des questions sur le service de virtualisation, vous pouvez contacter les administrateurs à l’adresse vmadmin, ils se feront un plaisir de vous renseigner.

Références

[1] Pérenne-IT, La virtualisation aide-t-elle à la réduction du réchauffement climatique  ?. FI SP/08
[2] Virtualisation (2ème partie) FI 6/07
[3] Configuration maximums for VMWare vSphere 5.0
[4] HPC dans le Cloud FI 7/11.





Glossaire

connexion fibre :
au sens Fiber Channel - Fibre Channel est un protocole défini par la norme ANSI X3T1 permettant une connexion haut débit (de l’ordre du gigabit, par seconde) entre un ordinateur et son système de stockage ou d’autre type de périphérique. Il garantit l’arrivée des données, il permet de créer un réseau pouvant transporter plusieurs protocoles de façon native comme l’IP (Internet Protocol) et il offre la possibilité d’un mode canal utilisé pour transporter le protocole SCSI dans le cas des SAN. Il a été conçu à l’origine pour les superordinateurs , mais il est maintenant devenu le protocole standard des SAN. Pour plus de détails, voir Wikipedia.
connexion fibre :
au sens média de transport - une fibre optique est un fil en verre ou en plastique très fin qui a la propriété d’être un conducteur de la lumière et sert dans la transmission de données. Pour plus de détails, voir Wikipedia.
FCoE (Fibre Channel over Ethernet) :
technique de réseau de stockage SAN consistant à faire passer les trames du protocole Fibre Channel sur un réseau Ethernet. La norme FCoE a été publiée en juin 2002. Pour plus de détails, voir Wikipedia.
SAS (Serial Attached SCSI) :
technique d’interface pour disques durs, elle constitue une évolution des bus SCSI en termes de performances, et apporte le mode de transmission en série de l’interface SATA. Pour plus de détails : fr.wikipedia.org/wiki/Serial_Attached_SCSI].
SSD (solid-state drive) :
matériel informatique permettant le stockage de données, constitué de mémoire flash. Le terme anglais solid-state signifie que ce matériel est constitué de mémoires à semi-conducteurs à l’état solide par opposition aux disques durs (HDD). Pour plus de détailsvoir Wikipedia.


Cherchez ...

- dans tous les Flash informatique
(entre 1986 et 2001: seulement sur les titres et auteurs)
- par mot-clé

Avertissement

Cette page est un article d'une publication de l'EPFL.
Le contenu et certains liens ne sont peut-être plus d'actualité.

Responsabilité

Les articles n'engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d'autres entités). Toute reproduction, même partielle, n'est autorisée qu'avec l'accord de la rédaction et des auteurs.


Archives sur clé USB

Le Flash informatique ne paraîtra plus. Le dernier numéro est daté de décembre 2013.

Taguage des articles

Depuis 2010, pour aider le lecteur, les articles sont taggués:
  •   tout public
    que vous soyiez utilisateur occasionnel du PC familial, ou bien simplement propriétaire d'un iPhone, lisez l'article marqué tout public, vous y apprendrez plein de choses qui vous permettront de mieux appréhender ces technologies qui envahissent votre quotidien
  •   public averti
    l'article parle de concepts techniques, mais à la portée de toute personne intéressée par les dessous des nouvelles technologies
  •   expert
    le sujet abordé n'intéresse que peu de lecteurs, mais ceux-là seront ravis d'approfondir un thème, d'en savoir plus sur un nouveau langage.