FLASH INFORMATIQUE FI



Nouvelle politique HPC à l’EPFL




Vittoria REZZONICO


À l’EPFL, trois types d’informatique font appel de façon très importante à des serveurs de calcul :

  • l’informatique administrative (bureautique) ;
  • la recherche dans les domaines Informatique et Communications ;
  • le calcul comme support à la science et à l’ingénierie (Computational Science and Engineering, CSE).



fig.1 - les trois catégories de l’informatique en milieu universitaire

Un sondage a été effectué à l’EPFL durant l’été 2010 pour mesurer l’impact du CSE dans la recherche. Il en a découlé que le CSE est un pilier de la recherche, avec à peu près un millier d’utilisateurs, des grands investissements en argent pour des usages disparates, mais avec une base commune très similaire. Le CSE est une discipline transversale : elle ne connaît pas les frontières entre les facultés. Pour ces raisons, l’EPFL a décidé d’y accorder une importance majeure. Cette volonté s’est concrétisée déjà en 2009 par la création d’un master en CSE et du consortium CADMOS qui a permis de renforcer la recherche en CSE en finançant des nouvelles chaires.
Le 6 décembre 2010, en plus de la nomination d’un coordinateur du CSE à l’échelle de l’EPFL, la Direction de notre École a accepté les propositions suivantes :

  • une hiérarchie du CSE à trois niveaux ;
  • avec trois modes d’utilisation ;
  • avec une participation financière des laboratoires.

Les infrastructures pour le CSE

La communauté de l’EPFL a accès à trois types d’infrastructure :

équipements de test et développement

Ces équipements petits sont la propriété des laboratoires, lesquels, pour en améliorer l’efficacité, peuvent se regrouper pour partager les frais. La valeur maximale d’un cluster rentrant dans cette catégorie est fixée à 50’000 CHF ;

équipements mutualisés au niveau central

Il s’agit des clusters centraux (Callisto, Antares, Jupiter, etc.). Ces machines offrent toute une palette de services qui répondent aux besoins de la communauté. Leur planification se fait en concertation avec les laboratoires intéressés ;

équipements high-end

Parmi ces équipements on compte le Blue Gene/P mis à disposition par le consortium CADMOS ainsi que les supercalculateurs des institutions partenaires comme le CSCS. Avant de tenter l’accès à ces équipements, il est raisonnable de faire ses preuves sur des machines plus petites, idéalement, dans notre cas, sur les clusters mutualisés.



fig.1 - hiérarchie des infrastructures pour le CSE

Modes d’utilisation

L’accès aux équipements high-end est compétitif, c’est-à-dire qu’il est nécessaire de rédiger un dossier qui va être analysé par une commission. Les projets seront soumis à une sélection.

Pour ce qui concerne les équipements mutualisés, les utilisateurs auront deux choix :

achat semestriel de parts de la machine (location)

Les laboratoires achètent chaque semestre une part de la machine selon un certain tarif. Les achats doivent donc être anticipés. achat de noeuds en utilisation exclusive (copropriété)

Certains laboratoires expriment le désir d’avoir leurs noeuds. Ce mode de fonctionnement leur permet d’avoir accès immédiat à une portion de la machine pour toute la durée de vie du matériel. Lorsque leur portion n’est pas utilisée, le temps de calcul est mis à disposition de la communauté. Dans les deux cas, l’EPFL fournit :

  • les administrateurs système ;
  • l’électricité, les locaux et le refroidissement ;
  • les racks, la connectivité et les frontales ;
  • du stockage à haute performance (home, scratch) ;
  • des noeuds de test et des serveurs de visualisation. Les laboratoires ne paient donc que les noeuds de calcul.

Mutualisation = optimisation des ressources

La plupart des besoins se concentrant sur un nombre limité de solutions malgré la diversité des domaines abordés, des infrastructures mutualisées performantes devraient satisfaire la plus grande partie des utilisateurs du CSE au sein de l’EPFL. L’approche mutualisée permet une utilisation plus efficace des ressources si on considère le coût total de possession (TCO), en tenant compte des infrastructures ainsi que des ressources humaines. Pour ce qui concerne les infrastructures, on améliore l’efficacité énergétique et la redondance en utilisant des technologies à la pointe et des salles machine adaptées. Du côté ressources humaines, on optimise la répartition des tâches entre les acteurs du HPC (gestionnaires d’infrastructure, administrateurs système, experts applicatifs, chercheurs). Une gestion coordonnée des ressources humaines amène en bonus plus de transparence sur l’utilisation de ces ressources, permettant ainsi de mieux anticiper les évolutions nécessaires. Elle permettra aussi de créer une communauté multidisciplinaire, favorisant ainsi les projets communs et l’échange d’expériences.
Une rationalisation des ressources mettra à niveau les grandes disparités existant entre d’une part, les laboratoires qui sont bien établis dans le CSE et qui disposent déjà des moyens et connaissances nécessaires et d’autre part, les laboratoires qui aujourd’hui débutent dans le CSE et pour qui l’accès à de tels moyens et connaissances n’est pas simple.
Afin de rendre un éventuel passage aux serveurs mutualisés le plus agréable possible, il est nécessaire en premier lieu de faciliter l’accès à l’information et le partage d’expériences dans les domaines. Pour cela, le coordinateur CSE est à votre service ! Le rôle du coordinateur CSE sera également de mettre sur pied un réseau de spécialistes intégrés dans les groupes de recherche afin d’aider à l’optimisation des applications (parallélisation). L’optimisation des codes représente un énorme potentiel de gain de temps pour les chercheurs et d’économie d’énergie dans la perspective du green computing.

Intéressé ?

Dans les semaines qui suivent, vous pouvez vous attendre à une visite de ma part, vous pouvez aussi prendre les devants et me contacter directement. Je me ferai un plaisir de discuter avec vous de vos sujets de recherche et besoins, et je me réjouis de vous aider à vous orienter dans le paysage CSE de l’EPFL.



Cherchez ...

- dans tous les Flash informatique
(entre 1986 et 2001: seulement sur les titres et auteurs)
- par mot-clé

Avertissement

Cette page est un article d'une publication de l'EPFL.
Le contenu et certains liens ne sont peut-être plus d'actualité.

Responsabilité

Les articles n'engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d'autres entités). Toute reproduction, même partielle, n'est autorisée qu'avec l'accord de la rédaction et des auteurs.


Archives sur clé USB

Le Flash informatique ne paraîtra plus. Le dernier numéro est daté de décembre 2013.

Taguage des articles

Depuis 2010, pour aider le lecteur, les articles sont taggués:
  •   tout public
    que vous soyiez utilisateur occasionnel du PC familial, ou bien simplement propriétaire d'un iPhone, lisez l'article marqué tout public, vous y apprendrez plein de choses qui vous permettront de mieux appréhender ces technologies qui envahissent votre quotidien
  •   public averti
    l'article parle de concepts techniques, mais à la portée de toute personne intéressée par les dessous des nouvelles technologies
  •   expert
    le sujet abordé n'intéresse que peu de lecteurs, mais ceux-là seront ravis d'approfondir un thème, d'en savoir plus sur un nouveau langage.