FLASH INFORMATIQUE FI



tout public Lorsque les étoiles s’estompent, CADMOS brille plus fort


CADMOS vous connaissez  ? Acronyme pour Center for Advanced Modeling Science, le projet CADMOS a été lancé fin 2009 comme collaboration entre l’EPFL et les universités de Lausanne et de Genève comme moteur régional du calcul scientifique. Le but de ce bref article est de parcourir, de façon superficielle, les différents projets déposés et acceptés depuis mars 2010 dans le cadre du projet CADMOS et en les mettant en perspective avec un article de 1993 intitulé Les 5 Grand Challenges de l’EPFL écrit par Marie-Christine Sawley.



Do you know CADMOS  [1] ? Acronym for Center for Advanced Modeling Science, the CADMOS project has been launched end of 2009 as a collaboration between EPFL and the Universities of Lausanne and Geneva. CADMOS is the flagship of the computational science in the Lake Geneva region. The goal of this small paper is to give an overview of the different accepted projects within CADMOS. These projects will be viewed alongside the 5 Grand Challenges of EPFL described in 1993 in a paper written by Marie-Christine Sawley.


Vincent KELLER


Petit retour en arrière, il y a 17 ans à l’EPFL...

En novembre 1993, dans le premier numéro hors série du Flash Informatique et sous la plume de Marie-Christine Sawley [1], cinq applications pilotes ou domaines locomotives (c’était le terme employé à l’époque) étaient identifiés. Ces applications devaient permettre d’aider à la diffusion de l’expertise de ses utilisateurs en matière de simulation numérique (fameux troisième pilier de la recherche scientifique). Les applications Grand Challenges étaient :

  1. la compréhension des régimes turbulents en 3D sur des géométries complexes dans la dynamique des fluides computationnelle (CFD),
  2. la physique des plasmas,
  3. la physique de la matière condensée et la dynamique moléculaire,
  4. le traitement des signaux.

Ces quatre Grand Challenges permettaient de démontrer le besoin d’entrer de plain-pied dans l’ère du massivement parallèle avec l’achat d’un CRAY-T3D (une machine avec 128 processeurs Alpha - étendu à 256 une année plus tard - dont on peut toujours aujourd’hui admirer la carcasse dans les couloirs du CM) en remplacement du vieillissant CRAY-2 (lui aussi en exposition aux côtés du T3D). Le cinquième Grand Challenge identifié était celui de la révolution MPI/PVM, soit l’arrêt - provisoire - du pur séquentiel/vectoriel dans le développement des codes scientifiques et l’arrivée du message passing.
La conclusion de l’article, mise en perspective aux objectifs de CADMOS, est particulièrement pertinente et incroyablement d’actualité. Elle consistait en cinq objectifs que je vous livre in extenso :

  1. développer ou adapter en collaboration avec CRAY des applications existantes sur l’architecture T3D,
  2. développer les échanges avec les autres centres PATP (les centres de collaboration avec Cray) où l’EPFL peut jouer un rôle actif,
  3. identifier, stimuler et intégrer d’autres groupes faisant de la simulation et nécessitant d’importants moyens de calcul ainsi que donner de l’impulsion à certaines disciplines,
  4. rechercher des synergies avec les industriels potentiellement intéressés à ces techniques et
  5. former des ingénieurs en techniques de calcul massivement parallèle (3ème cycle).

L’auteure précise que ces applications Grand Challenges ne pourront être résolues sans recourir à des machines avec des puissances de l’ordre de 100 à 1000 fois plus grande que ce qui existait en 1992, à savoir des machines autorisant des performances de l’ordre du TF. Cette puissance a été atteinte en 1997.

Quelles sont les applications Grand Challenges aujourd’hui  ?

2010, sur l’arc lémanique

PNG - 10.9 ko
utilisation du BlueGene/P de CADMOS - de mars 2010 à septembre 2010

Aujourd’hui en 2010, le parc informatique prévu pour le calcul à haute performance au sein de l’EPFL est essentiellement formé des trois clusters centraux Callisto, Vega et Antares et d’autres clusters départementaux (comme la machine de STI Pleiades). Ces étoiles du calcul parallèle permettent à la majorité des applications de l’école de trouver processeur à leurs boucles. Il y a cependant des applications qui demandent une puissance de calcul encore supérieure. C’est là que CADMOS entre en piste. Ces applications sont en quelque sorte les Grand Challenges de l’arc lémanique en 2010. Quelles sont-elles  ? Ont-elles beaucoup varié en 17 ans  ? Y a-t-il des nouveaux venus  ?

Simulations numériques dans les sciences du vivant

C’est le nouvel arrivant. Au-delà de toute considération philosophique ou morale, un organisme vivant est d’une complexité colossale et ce n’est pas après-demain que l’être humain sera capable de simuler un organisme entier, même simple, sur un support de silicium. J’en prends le pari avec celui qui écrira un article sur les Grands Challenges de l’EPFL en 2027. Parmi les grands projets CADMOS dans les sciences du vivant, on en trouve plusieurs types : d’un côté ceux qui se rapprochent de la dynamique des fluides avec des simulations du système cardiovasculaire [2], du flux sanguin dans les anévrismes cérébraux en passant par des simulations des échanges chimico-physiques dans les cellules, et de l’autre le grand projet BlueBrain] qui vise à comprendre les fonctions du système nerveux central et ses dysfonctionnements par ingénierie inverse. Durant le premier semestre 2010, les simulations numériques dans les sciences du vivant ont représenté 51.6 % de l’utilisation totale du BlueGene/P.

Chimie numérique

C’est le second plus gros consommateur. Les applications de chimie computationnelle utilisent la célèbre méthode de Car-Parrinello dont les 25 ans ont été fêtés en 2010. Le laboratoire LCBC développe une extension hybride entre la mécanique quantique (QM) et classique (MM) ainsi que des simulations de dynamique moléculaire (MD) basées sur la DFT (Density Functional Theory) et la TDDFT (Time-Dependent DFT). Ces nouvelles techniques sont appliquées à des systèmes biologiques et chimiques tels que : les voies de signalisation dans les récepteurs couplés aux protéines G, les processus chimiques obtenus lors de thérapie de tumeurs profondes par faisceaux d’ions largement chargés (hadronthérapie), les transferts d’électrons à longue distance dans les protéines, l’optimisation de propriétés spectrales de colorants inorganiques utilisés dans les cellules solaires Grätzel. Les applications de chimie computationnelle, gourmandes en temps calcul et en communications inter-processus consomment environ un quart (25.4 %) de la puissance totale du BlueGene/P de CADMOS.

Physique des plasmas

La fusion thermonucléaire contrôlée pour la production d’énergie primaire n’est pas encore d’actualité, mais un grand pas a été fait dans la bonne direction avec le projet collaboratif mondial de réacteur expérimental ITER (International Thermonuclear Experimental Reactor) actuellement en construction à Cadarache dans le sud de la France. À travers le CRPP, l’EPFL est depuis longtemps l’un des grands acteurs sur le plan mondial de la fusion. Le tokamak à géométrie variable (TCV) - de loin la plus grande expérience du campus - permet de tester les formes du plasma ainsi que les aspects liés à son chauffage (plus de 100 millions de degrés atteints grâce aux sources hyperfréquence gyrotrons). Les expériences pratiquées sur le TCV ne sauraient être complètes sans la simulation numérique, notamment dans la compréhension des turbulences dans le transport de chaleur et des particules dans un plasma fortement magnétisé. Ces projets majeurs sont menés notamment sur le BlueGene/P de CADMOS. Ils représentent à eux seuls 12.1 % de l’utilisation totale.

Géophysique

Les méthodes de Boltzmann sur réseau LBM (Lattice Boltzmann Methods) sont des méthodes numériques prometteuses, simples à implémenter (le réseau est trivial en regard de celui des méthodes classiques d’éléments finis) et relativement novatrices. L’Université de Genève en est l’un des fers de lance mondiaux. L’idée du projet GeoLB de l’UNIGE pour CADMOS est d’appliquer la théorie de la dynamique des fluides computationnelle à la géophysique. Au lieu de résoudre les équations de Navier-Stokes, on utilise l’approche de Boltzmann en simulant le fluide comme un ensemble de particules fictives que l’on propage et collisionne. GeoLB s’intéresse à l’établissement de la physique qui gouverne l’arrivée d’un gaz porteur injecté à la base d’un milieu non poreux initialement saturé d’un liquide. Si le taux d’injection du gaz est suffisamment élevé, il se forme des chemins préférentiels dans le liquide. Cette physique pourra directement être appliquée à la compréhension des phénomènes volcanologiques. Le projet GeoLB consomme environ 7 % des ressources de CADMOS.

Dynamique des fluides computationnelle (CFD)

Le domaine de recherche de la dynamique des fluides computationnelle (CFD) est l’un des pères fondateurs du calcul à haute performance et des simulations numériques. Il est d’ailleurs présent dans plusieurs projets cités plus haut. Aujourd’hui et malgré le long chemin déjà parcouru, il reste un vaste champ de recherche et de la place pour des projets de haut niveau. Un seul projet, représentant 2.3 % de l’utilisation globale du BG/P de CADMOS est encore de la CFD. Le projet LESPRDHC (Large Eddy Simulation of Particle Removal inside a Differentially Heated Cavity) s’intéresse au rejet de matériaux fissiles dans l’atmosphère en cas d’accident nucléaire majeur. La dynamique des particules est simulée dans une cavité cubique à haut niveau de turbulence au moyen d’une simulation à grande échelle (Large Eddy Simulation - LES). L’objectif est d’avoir une compréhension fondamentale de la physique impliquée dans les scénarios d’un tel accident. Ensuite, les résultats seront utilisés pour dériver des modèles plus simples pour pouvoir analyser de façon plus précise les risques dans la sécurité nucléaire. Même avec les ordinateurs les plus puissants du monde, il n’est pas possible de faire une simulation complète du confinement.

Physique de la matière condensée

Dernier domaine traité par CADMOS et qui représente 1.6% de l’utilisation du BG/P, la physique de la matière condensée. L’étude effectuée par la chaire de simulation à l’échelle atomique sur le BlueGene/P s’inscrit dans la recherche de solutions pour la période post-silicium dans l’électronique à échelle nano. Deux matériaux sont étudiés : le Germanium (Ge) et l’arséniure de Gallium (GaAs) ou l’Indium arséniure de Gallium (InGaAs). Le problème de cette technologie est qu’elle produit un nombre important d’états défectueux. Le projet se propose donc d’identifier la nature et l’origine de ces états défectueux par simulation numérique basée sur la dynamique moléculaire ab initio.
On le voit donc, des cinq Grands Challenges de 1993, tous le sont encore, mais on compte un nouvel arrivant : les sciences du vivant. Le fameux cinquième challenge, capacité des chercheurs à dompter du massivement parallèle existe toujours, mais le terme massivement a été requalifié. Les 128 processus parallèles de 1993 se sont transformés en plusieurs dizaines de milliers (plusieurs millions dans le futur) de processus parallèles et concurrents en 2010  ; la problématique existe toujours.

Effets de bord et futur

Du côté de l’enseignement, un master en sciences computationnelles a été mis en place. Il regroupe des cours aussi divers que variés provenant de plusieurs facultés. Ce master est le premier pas dans la réalisation du voeu de 1993 : former des ingénieurs en sciences computationnelles prêts à relever les défis posés par le calcul scientifique ; un défi où il s’agira de faire cohabiter plusieurs millions de threads en parallèle pour résoudre un problème, trouver des nouveaux algorithmes et méthodes numériques, maîtriser des systèmes de fichiers parallèles, utiliser des tailles de mémoire considérables. Les étudiants décorés d’un bachelor en sciences de base ou en ingénierie et intéressés par les défis posés par la simulation numérique et par l’informatique appliquée sont vivement encouragés à suivre le cursus Master in Computational Science and Engineering (voir aussi ] Master CSE : un atout pour l’ingénieur du futur ->2246]). Il est à noter enfin que n’importe quel laboratoire de l’EPFL, de l’UNIL et de l’UNIGE peut déposer un projet éligible pour CADMOS. Ceci en tout temps. Il suffit de prendre contact avec l’auteur de l’article.

Remerciements

Mes remerciements appuyés vont à Laurent Villard, Jonas Lätt, Christoph Bosshard, Ursula Röthlisberger, Simone Deparis et Alfredo Pasquarello pour avoir corrigé les paragraphes qui les concernaient.



Glossaire

Modèle par échange de messages :
modèle de communication entre processus. Chaque processus communique avec un ou plusieurs autres processus par messages. Les processus peuvent s’exécuter sur des machines différentes reliées par un réseau. Un message contient généralement un identifiant du processus émetteur et celui du recepteur ainsi que les données à transmettre.
MPI/PVM (Message Passing Interface/Parallel Virtual Machine) :
normes définissant des bibliothèques de fonctions permettant d’exploiter le modèle par échange de messages. MPI est devenu un standard de facto pour les machines parallèles homogènes (comme le BlueGene/P). PVM, de par sa capacité à faire communiquer un réseau de machine hétérogènes a été à la base de plusieurs projets comme la bibliothèque SCALAPACK. Il existe plusieurs implémentations de MPI (comme MPICH, OpenMPI) et de PVM interfaçant les trois languages habituellement utilisé dans la haute performance C, C++ et Fortran ainsi que d’autres plus exotiques.
TF :
TéraFLOPS représentant 10 à la puissance 12 opérations en virgule flottante à la seconde.

[1] Marie-Christine Sawley, Les 5 Grand Challenges de l’EPFL, Hors-Série du Flash Informatique, EPFL, 1993.

[2] L. Formaggia, Alfio Quarteroni and A. Veneziani, Cardiovascular Mathematics, modeling and simulation of the circulatory system, ISBN : 978-88-470-1151-9, Springer, 2009.



Cherchez ...

- dans tous les Flash informatique
(entre 1986 et 2001: seulement sur les titres et auteurs)
- par mot-clé

Avertissement

Cette page est un article d'une publication de l'EPFL.
Le contenu et certains liens ne sont peut-être plus d'actualité.

Responsabilité

Les articles n'engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d'autres entités). Toute reproduction, même partielle, n'est autorisée qu'avec l'accord de la rédaction et des auteurs.


Archives sur clé USB

Le Flash informatique ne paraîtra plus. Le dernier numéro est daté de décembre 2013.

Taguage des articles

Depuis 2010, pour aider le lecteur, les articles sont taggués:
  •   tout public
    que vous soyiez utilisateur occasionnel du PC familial, ou bien simplement propriétaire d'un iPhone, lisez l'article marqué tout public, vous y apprendrez plein de choses qui vous permettront de mieux appréhender ces technologies qui envahissent votre quotidien
  •   public averti
    l'article parle de concepts techniques, mais à la portée de toute personne intéressée par les dessous des nouvelles technologies
  •   expert
    le sujet abordé n'intéresse que peu de lecteurs, mais ceux-là seront ravis d'approfondir un thème, d'en savoir plus sur un nouveau langage.