FLASH INFORMATIQUE FI



Stratégie de financement HPC à l’EPFL




Jean-Claude BERNEY


Une description détaillée des ressources de calcul du DIT est disponible dans le FI10/08 - Spécial calcul à haute performance à l’EPFL.

Dans sa séance du 8 décembre 2008, la Direction a approuvé une nouvelle stratégie de financement du calcul de haute performance (HPC). Cette stratégie vise une meilleure coordination et utilisation des ressources informatiques de calcul de puissance au niveau de l’Ecole (cf. hpc-dit.epfl.ch/papers/intranet/newHPCPolicy.pdf pour tous les détails). Elle a été établie à la demande de la VPAI  [1] à partir des réflexions et discussions entreprises au sein du CoPil HPC  [2] et du DIT en relation avec les vice-présidences VPAA, VPAI et VPPL  [3].
Cette nouvelle politique s’appuie sur les constats suivants :

  • le problème du HPC est un problème d’optimisation complexe dans lequel il faut tenir compte :
    • des caractéristiques des applications (qui peuvent évoluer dans le temps, évolution ou changements d’algorithmes,...) ;
    • de l’infrastructure matérielle et logicielle disponible au temps T ;
    • des budgets à disposition ;
    • des contraintes de délais liées aux projets : différence entre le développement et la production ;
    • de la consommation électrique acceptable. Il n’y a pas que l’aspect coût, mais également la sensibilité écologique. Avec la diversité des domaines étudiés à l’EPFL, il paraît bien difficile d’être optimal avec un seul supercalculateur homogène. Il est nécessaire de disposer de toute une hiérarchie de systèmes.
  • L’allocation des ressources de calcul centrales aux projets de recherche des utilisateurs se faisait jusqu’à présent uniquement sur des critères techniques et scientifiques dans une enveloppe financière définie a priori. Cependant, afin de contrôler les coûts d’investissement des infrastructures de calcul, qu’elles soient exploitées en central par le DIT ou dans les unités des Facultés, il apparaît nécessaire d’introduire un élément budgétaire modérateur.
  • La réflexion stratégique menée par le CoPil HPC n’a eu en pratique que peu d’influence directe concernant la gestion des ressources HPC dans les facultés à l’exception près du cluster Pléiades installé en STI. Il est difficile d’utiliser constamment et à sa pleine puissance un cluster local : la consolidation de clusters locaux permet, dans la grande majorité des cas, une économie de ressources considérable. Des serveurs locaux, correctement dimensionnés, restant toujours nécessaires pour le développement, par exemple.
  • La valorisation académique et scientifique des activités HPC devrait être absolument promue.

La stratégie de financement HPC à l’EPFL adoptée par la Direction se base sur une hiérarchie des infrastructures de calcul (cf. hpc.epfl.ch/) :

  1. Les super calculateurs (capability computing) de type Blue Gene®/L qui bénéficient d’un financement ad hoc et qui ne sont destinés qu’à des projets de recherche approuvés par la Direction.
  2. Les clusters centraux gérés par le DIT (capacity computing), comme Callisto. Le DIT finance 2/3 du matériel et du logiciel, le 1/3 restant étant financé par des laboratoires, instituts, sections, facultés.
  3. Les plates-formes HPC partagées par plusieurs laboratoires et gérées localement, comme Pléiades (consolidation de clusters). Le DIT finance 1/2 du matériel et du logiciel, le 1/2 restant étant financé par des laboratoires. Ces plates-formes offrent une plus grande proximité avec les utilisateurs et une plus grande souplesse dans l’allocation des jobs que les plates-formes centrales.
  4. Les plates-formes de laboratoire financées et gérées à 100% par les laboratoires. Ces ressources locales sont nécessaires dans les cas suivants : besoin d’une architecture spécifique, usage exclusif à 100% de la ressource, besoin de disposer immédiatement de la ressource notamment dans le cas de développements.
  5. La grille de calcul de l’EPFL, appelée Greedy, dont l’utilisation est gratuite (cf. greedy.epfl.ch/).

Pratiquement, et pour autant que cela ne remette pas en cause le programme de recherche des professeurs, ces derniers seront invités à privilégier des solutions consolidées ou centrales à des solutions locales, pour leur calcul HPC.
Cette mise en commun (consolidation) permet d’augmenter le taux d’utilisation des ressources et de faire des économies d’échelle : administrateurs systèmes et infrastructures locales telles que salles climatisées et systèmes de refroidissement.
Les participations financières des utilisateurs de ressources centrales seront réinvesties dans des extensions des plates-formes existantes, ou dans des systèmes futurs.
Cette nouvelle politique incitera les groupes de recherche à faire des demandes de financement spécifiques pour le HPC dans leurs projets de recherche (FNS, programmes de recherche européens,...), et cela aura pour conséquence d’augmenter globalement la somme d’argent allouée au HPC dans l’EPFL.
Un autre volet de la stratégie HPC concerne la valorisation académique et scientifique des activités HPC et la constitution de communautés d’intérêts communs en HPC.
La mise en oeuvre de cette stratégie a été confiée à la VPAI, qui s’appuiera pour cela notamment sur le CoPil HPC présidé par le professeur François Avellan. Ce dernier pourra s’appuyer sur le groupe HPC Tech, piloté par Vittoria Rezzonico, afin de faire en sorte que les machines centrales correspondent le mieux possible aux besoins des utilisateurs et que le rapport prix/performance soit le meilleur possible pour une gamme d’applications suffisamment large.

[1] Vice-Présidence pour les Affaires Institutionnelles de l’EPFL

[2] Comité de Pilotage HPC de l’EPFL

[3] Vice-Présidences pour les Affaires Académiques & Planification et Logistique



Cherchez ...

- dans tous les Flash informatique
(entre 1986 et 2001: seulement sur les titres et auteurs)
- par mot-clé

Avertissement

Cette page est un article d'une publication de l'EPFL.
Le contenu et certains liens ne sont peut-être plus d'actualité.

Responsabilité

Les articles n'engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d'autres entités). Toute reproduction, même partielle, n'est autorisée qu'avec l'accord de la rédaction et des auteurs.


Archives sur clé USB

Le Flash informatique ne paraîtra plus. Le dernier numéro est daté de décembre 2013.

Taguage des articles

Depuis 2010, pour aider le lecteur, les articles sont taggués:
  •   tout public
    que vous soyiez utilisateur occasionnel du PC familial, ou bien simplement propriétaire d'un iPhone, lisez l'article marqué tout public, vous y apprendrez plein de choses qui vous permettront de mieux appréhender ces technologies qui envahissent votre quotidien
  •   public averti
    l'article parle de concepts techniques, mais à la portée de toute personne intéressée par les dessous des nouvelles technologies
  •   expert
    le sujet abordé n'intéresse que peu de lecteurs, mais ceux-là seront ravis d'approfondir un thème, d'en savoir plus sur un nouveau langage.