FLASH INFORMATIQUE FI



Content Management System de l’EPFL, serez-vous tous contents ?




Natalie MEYSTRE


Cet article est un résumé du rapport sur le futur CMS rédigé par le KIS (disponible sur demande). Il soulève une partie des voiles qui cachent le travail obstiné de cette équipe pour fournir le meilleur outil possible de mise en ligne de leur site Web pour l’ensemble de la communauté EPFL.

Situation actuelle

Le système de gestion de contenu (CMS) Jahia a été déployé à l’EPFL en 2002. À ce jour il héberge plus de 20’000 pages Web réparties sur 542 sites, dont la plupart sont des sites institutionnels de l’École. Le contenu Web est édité par 2’500 éditeurs (personnes autorisées à créer ou modifier le contenu). On constate 4’500’000 consultations de pages par mois en moyenne (l’indexation par les moteurs de recherche en constitue une partie considérable) générant un trafic sortant mensuel d’ordre de 200 GB.
Le support de Jahia 4 arrive à terme à la fin de l’année 2009. Même s’il semble possible de repousser cette échéance, il faut bien constater que les technologies utilisées sont aujourd’hui obsolètes : Jahia 4 repose sur une infrastructure logicielle déjà très ancienne (machine virtuelle Java en version 1.4.2, alors que la version actuelle de Java est 1.6)
Après plus de six ans d’exploitation, les points forts de Jahia 4 sont :

  • simplicité d’utilisation et d’apprentissage ;
  • mécanismes d’édition et de mise en forme du texte WYSIWYG ;
  • opérations de manipulation des boîtes de contenu directement intégrées à la page (in-site editing). Ce mode s’oppose à une manipulation des boîtes de contenu dans le back-end sans voir la mise en forme de la page, démarche très courante sur certains CMS et contre intuitive pour l’utilisateur ;
  • mise en forme de contenu respectant la charte graphique de l’EPFL ;
  • intégration des agrégateurs de contenu permettant d’incorporer dans les pages les informations provenant de différentes sources institutionnelles ;
  • gestion des utilisateurs basée sur l’annuaire de l’EPFL.

Et les points faibles sont :

  • absence de mécanisme de copier/coller pour les boîtes ou les pages ;
  • liens externes non multilingues ;
  • URL (noms de pages) incompréhensibles (numéros) ;
  • gestion difficile des dossiers et des fichiers du DMS (Document Management System) ;
  • gestion des droits d’accès trop complexe ;
  • mauvais usage de la terminologie (jargon informatique) ;
  • pas d’outil statistique pour l’analyse de fréquentation ;
  • l’outil de versioning ne fonctionne pas ;
  • difficulté à gérer correctement la montée en charge tout en respectant la stabilité du logiciel et ses temps de réponse ;
  • répartition de charge entre les serveurs impossible.

Bien que Jahia soit très apprécié des utilisateurs pour son ergonomie et facilité d’emploi, des améliorations sont clairement attendues dans la gestion des documents, des droits, et dans le relookage des interfaces utilisateurs. Par ailleurs, des améliorations au niveau de l’exploitation sont également attendues.

le cahier des charges du nouveau CMS

Le cahier des charges a été réalisé principalement sur la base des remarques faites au long des années par les rédacteurs de l’EPFL.

Pour l’éditeur

  • facilité d’apprentissage et d’utilisation sans compétences techniques spécifiques ;
  • terminologie utilisée simple et compréhensible ;
  • In-site editing ;
  • édition WYSIWYG multi-butineurs sur les plates-formes courantes ;
  • copier/coller des objets de contenu (boîtes, pages, sous-site entier) ;
  • annulation/répétition (Undo/Redo) d’actions ;
  • interface utilisateur en plusieurs langues (au moins en français et en anglais) ;
  • modèles respectant la charte graphique de l’EPFL ;
  • URL des pages lisibles ;
  • prise en charge de l’édition concurrente (verrous), lorsque deux personnes essaient de modifier le même objet ;
  • accessibilité ;
  • gestion aisée d’un site contenant plusieurs centaines de pages ;
  • plans de site (sitemaps) automatique ;
  • outils statistiques de fréquentation des pages.

Pour le contenu

  • possibilité de définir les paragraphes composés de flux d’information importés (flux RSS, données institutionnelles) ;
  • support multilingue
  • chaque élément d’une page peut contenir un texte simple directement modifiable par l’éditeur ;
  • gestionnaire de fichiers interne au CMS, accessible par WebDAV, facile à manipuler même en présence de plusieurs centaines de fichiers et permettant d’incorporer les documents provenant des DMS externes (my.epfl,...) avec le contrôle d’accès.

Pour les versions

  • accès aisé aux anciennes versions d’une boîte ou d’une page ;
  • visualisation des différences entre deux versions archivées ;
  • restauration d’une version antérieure ;
  • Staging : préparation d’une nouvelle version d’une page ou d’une boîte sans altérer la version en ligne ;
  • Workflow simple de publication d’une page ;
  • publication à une date donnée, que ce soit pour la mise en ligne ou hors ligne.

Pour la sécurité

  • authentification par un serveur de single sign-on (Tequila) ;
  • possibilité de protéger des pages du site à l’aide d’un accès authentifié (intranet) ;
  • gestion des droits (ACL) sur les boîtes et les pages, facilement compréhensible, basée sur les utilisateurs et groupes LDAP.

Pour le moteur de recherche

  • indexation en temps réel ;
  • recherche sur l’ensemble du site accessible à l’utilisateur, et pas uniquement sur la partie publique ;
  • indexation des fichiers de type PDF, OpenOffice, MS-Office ;

Pour l’administration et l’exploitation

  • gestion décentralisée des sites Web : le KIS crée un site, donne les droits appropriés à l’administrateur et laisse le site à l’entière responsabilité de ce dernier ;
  • support de plus de 1’000 sites et 100’000 pages ;
  • rapidité : réponse en moins d’une seconde lors de consultation, moins de trois secondes en édition ;
  • bonne stratégie de répartition de charge ;
  • possibilité de migration des sites entre serveurs de CMS ;
  • possibilité d’avoir un failover ;
  • possibilité de backup avec point in time recovery.

Autres

  • accès au code source, et droit de faire des modifications spécifiques ;
  • langue de templating facile à maîtriser ;
  • technologie moderne respectant les principes du Web 2.0 ;
  • documentation à jour ;
  • qualité du support (commercial/communautaire) ;
  • confiance en la technologie face aux attaques de hackers ;
  • intervention sur site en cas d’urgence.

Les onze candidats retenus

Le site cmsmatrix.org référence actuellement 1’023 CMS différents. A partir de l’analyse des CMS effectuée par l’intégrateur français SMILE et de plusieurs sites Web traitant du sujet nous avons sélectionné huit CMS open source et trois CMS commerciaux comme candidats sérieux pour des analyses plus approfondies, à savoir OpenCMS, Lenya, InfoGlue, Jalios, Magnolia, Jahia 6, Typo3, EzPublish, Drupal, SPIP et Plone. Pour les trois candidats commerciaux, nous avons demandé des présentations de leur produit en nous basant sur des cas d’utilisation typiques de l ’EPFL. Pour les huit candidats open source, nous les avons installés, testés et cherché l’avis de tiers.
La première étape de la sélection a consisté à vérifier l’ergonomie des CMS candidats. Parmi les critères du cahier des charges, des aspects indispensables ont été évalués, permettant de réduire la liste de manière substantielle :

  • Edition in-site ;
  • édition du texte WYSIWYG ;
  • copier/coller des boîtes de contenu et des pages ;
  • qualité du gestionnaire de fichiers, avec une possibilité de charger des dossiers de documents (si possible par WebDAV) ;
  • noms de pages propres (choisis par l’éditeur).

Les CMS éliminés

OpenCMS : le mécanisme de copier/coller est disponible uniquement au niveau de pages, mais pas au niveau des boîtes de contenu. La manipulation des boîtes de contenu ne peut pas se faire directement depuis la page. Il existe bien une fonctionnalité, appelée direct edit, mais en réalité il s’agit d’un raccourci vers le gestionnaire de ressource dans le backend. A l’usage le CMS est peu intuitif, et demande un certain temps d’apprentissage à l’éditeur.
Lenya : la gestion des boîtes de contenu est partiellement réalisée à l’aide d’une extension (écrite en XUL) pour Firefox. Cette fonctionnalité n’est donc pas disponible pour IE. Il n’y a pas de copier/coller, il faut travailler au niveau des fichiers XML eux-mêmes.
Infoglue : l’édition de contenu se fait exclusivement dans le back-end, il n’y a donc aucune édition possible sur la page directement. Il y a une gestion des assets qui permet d’ajouter ou d’enlever des documents, mais l’accès à ces documents passe impérativement par le backend, il n’y a pas d’accès par WebDAV.
Typo3 : l’édition de contenu se fait principalement dans le backend. S’il existe bien une fonctionnalité appelée frontend editing, qui permet directement depuis la page d’éditer une boîte de contenu, il n’est par contre pas possible d’ajouter directement depuis la page une nouvelle boîte de contenu sans passer par le backend.
EZPublish : l’édition de contenu ne peut se faire que dans le backend. Il existe toutefois une fonctionnalité qui permet de prévisualiser la page où se trouve le contenu édité. Ce CMS demande un certain temps d’apprentissage à l’éditeur.
Drupal : ce CMS est très atypique dans son mode de fonctionnement, une page est divisée en plusieurs zones, qui peuvent être alimentées par des noeuds (=contenu en terminologie Drupal) au travers de modules (programmes de traitement en PHP). Cette approche encourage une édition dans le backend qui est très loin d’être intuitive et présente des difficultés pour l’apprentissage
SPIP : ce CMS orienté pour l’édition de journaux en ligne offre des possibilités très limitées : entre autres il oblige l’utilisateur à se limiter à certains types de contenu (sans extension possible), et n’offre aucun gestionnaire de fichiers. L’édition de texte se fait à l’aide d’un langage à balise spécial.

La deuxième étape de la sélection était de vérifier, sur les CMS restants, les capacités multilingues :

  • toutes les boîtes de contenu doivent être disponibles dans toutes les langues du site,
  • l’interface éditeur doit être disponible en français et en anglais.

Plone : le CMS Plone pose problème. En effet, pour activer ses capacités multilingues il faut utiliser le module d’extension de LinguaPlone permettant de traduire le contenu dans différentes langues. Hélas, si ce module gère les traductions, les opérations de copier/coller de pages dans Plone n’en tiennent pas compte en se limitant à la langue principale du site. Le dynamisme de la communauté de développeurs permet toutefois d’espérer que cette lacune sera comblée prochainement.

La troisième étape de la sélection consistait à étudier la gestion multi-sites des CMS restants. A l’inverse de CMS léger comme Joomla  ! ou Drupal qui pourraient être installés de manière automatique lors de la création d’un nouveau site, ces CMS doivent posséder les outils nécessaires pour la gestion de sites en interne

  • gestion des pages indépendante pour chaque site ;
  • gestion des utilisateurs et des droits par site ;
  • gestion des langues par site.

Magnolia : La gestion multi-sites doit être simulée à l’aide de branches séparées dans l’arbre de pages. Malgré l’aide de la société Magnolia dans la configuration de sites de test, cette dernière se révèle impossible à administrer en pratique, car un administrateur de site aurait de facto les droits d’administration sur toutes les pages du CMS.
Plone : Il n’y a pas d’outils d’administration spécifiques pour gérer les aspects multi-sites, même s’il existe un hack au niveau de Zope, qui permet de faire fonctionner plusieurs sites Web sous une même instance de Plone.

Le choix


Magnolia, un CMS merveilleusement ergonomique, et Plone, figure de proue dans le monde des CMS open source, ne permettent pas de gérer correctement les aspects multi-sites définis dans notre cahier des charges.
Jahia 6 est donc retenu au terme de notre évaluation pour remplacer Jahia 4.

Ce CMS vient de sortir en version beta en janvier 2009. Par rapport à notre cahier des charges, seule la fonctionnalité de undo n’est pas implémentée dans Jahia 6, il est toutefois possible de récupérer la dernière version d’une boîte de contenu préalablement validée.
Les travaux d’intégration ont débuté.



Cherchez ...

- dans tous les Flash informatique
(entre 1986 et 2001: seulement sur les titres et auteurs)
- par mot-clé

Avertissement

Cette page est un article d'une publication de l'EPFL.
Le contenu et certains liens ne sont peut-être plus d'actualité.

Responsabilité

Les articles n'engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d'autres entités). Toute reproduction, même partielle, n'est autorisée qu'avec l'accord de la rédaction et des auteurs.


Archives sur clé USB

Le Flash informatique ne paraîtra plus. Le dernier numéro est daté de décembre 2013.

Taguage des articles

Depuis 2010, pour aider le lecteur, les articles sont taggués:
  •   tout public
    que vous soyiez utilisateur occasionnel du PC familial, ou bien simplement propriétaire d'un iPhone, lisez l'article marqué tout public, vous y apprendrez plein de choses qui vous permettront de mieux appréhender ces technologies qui envahissent votre quotidien
  •   public averti
    l'article parle de concepts techniques, mais à la portée de toute personne intéressée par les dessous des nouvelles technologies
  •   expert
    le sujet abordé n'intéresse que peu de lecteurs, mais ceux-là seront ravis d'approfondir un thème, d'en savoir plus sur un nouveau langage.