FLASH INFORMATIQUE FI



La gestion électronique de documents




Patricia PLAZA GRUBER


Qu’est-ce que c’est ?

Au sens large, une GED (gestion électronique de documents) permet d’organiser et de gérer des documents numériques (textuel, graphique, sonore, etc.) à l’aide de différents outils et techniques. A l’origine, ces systèmes permettaient de dématérialiser les documents papier qui pouvaient alors être stockés dans des lieux plus ou moins distants (et souvent meilleur marché) et ainsi désengorger les bureaux du papier accumulé. L’accès partagé aux documents ainsi que les possibilités de recherche offertes par cette technologie sont vite devenus des atouts de poids.

Selon l’APROGED (association des professionnels de la GED), il existe plusieurs types de GED, correspondant à différents usages des documents ou métiers : une GED de production et partage de documents, une GED d’archivage, une GED d’indexation de ressources documentaires, une GED de gestion de documents techniques, etc.

Comment ça marche ?

Un dispositif de GED est intimement lié au cycle de vie des documents, de leur création à leur élimination en passant par leur stockage, archivage, diffusion et retrouvage. Il est constitué de plusieurs étapes, dont voici les principales :

L’acquisition de données

Il existe plusieurs modes d’acquisition des documents dans une GED :

  • la capture de documents papier ;
  • l’intégration de documents électroniques.

L’acquisition de documents papier se fait par numérisation, à l’aide d’un scanner, c’est la dématérialisation proprement dite des documents. Lors de cette étape, différentes technologies peuvent être appliquées pour faciliter ultérieurement le traitement ou la recherche des documents, comme par exemple :

  • la reconnaissance automatique de documents (RAD) qui distingue un type de document d’un autre à partir de son image. Grâce à cette technique les documents peuvent être triés automatiquement avant leur traitement ;
  • la lecture automatique de documents (LAD) qui segmente et extrait des informations des documents numérisés. Ces informations pourront servir à la gestion proprement dite des documents (indexation, classement, etc.) ;
  • la reconnaissance optique de caractères (OCR) qui lit les mots du texte et enregistre un fichier texte sous l’image numérisée. Cela permettra aux utilisateurs d’effectuer une recherche en texte intégral sur les documents reconnus.

Par documents électroniques nous entendons les fichiers issus des logiciels de bureautique courants (suite Office par exemple) ou les e-mails. Leur acquisition dans un système de GED se fait de manière plus directe que pour les documents papier, qui doivent être numérisés, et les métadonnées existantes (les propriétés d’un document Word, l’en-tête d’un e-mail) peuvent être utilisées pour faciliter leur classement ou leur indexation.
La question des formats des fichiers acquis dans la GED est également traitée lors de cette étape. En effet, stocker un document sous son format natif (une version x de word par exemple) ne garantit pas son accessibilité ou sa lisibilité dans le temps. Il est alors conseillé de mettre en place un dispositif de conversion des documents vers un format de fichier plus pérenne, standard ou à défaut ouvert (XML, PDF pour les documents textuels, TIFF ou PNG pour les images).

L’indexation des documents et leur classement

L’indexation consiste en la description des documents et a pour but de faciliter leur exploitation ou leur retrouvage. Cette description peut porter sur la forme du document (titre, auteur, date, type, etc.) ou sur son contenu (selon le nombre d’occurrences d’un terme dans un document, une liste de mots-clés ou un thésaurus) et se fera en renseignant un jeu de métadonnées préalablement définies.
Si une partie de l’indexation peut être réalisée de manière automatique (en extrayant des données des propriétés des documents ou de leur contenu lors de la numérisation), on ne peut exclure un travail manuel pour certaines données (par exemple la date figurant sur un document). Il est important alors d’évaluer la charge de travail que cette indexation manuelle va représenter par rapport au gain attendu (classement ou recherches plus efficaces).
Le plan de classement est une organisation hiérarchique de dossiers sous forme d’arborescence. Les documents y sont regroupés en fonction des activités et processus de travail de l’organisation ou du service dans lequel le système de GED est déployé. Cette organisation, familière puisqu’elle rappelle celle des fichiers sous Windows, offre à la fois une vue synthétique des activités d’une organisation et permet une recherche plus intuitive des documents.

Le stockage des documents

Le volume et la nature des documents, ainsi que les temps d’accès vont déterminer la manière dont vont être stockés les documents.
L’établissement de la durée de conservation pour chaque type de document (pratique empruntée à l’archivistique) va faciliter l’élimination périodique de documents ou leur stockage sur d’autres supports afin ne pas saturer le système d’informations obsolètes.

La recherche de documents et la consultation

Il existe plusieurs manières de rechercher des documents :

  • la recherche en texte intégral : c’est une recherche de type Google. Elle porte sur les mots des documents et nécessite une reconnaissance optique de caractères des documents numérisés. La plus simple, elle est aussi la moins précise ;
  • la recherche avancée : elle concerne les métadonnées. Elle permet de rechercher des documents selon des critères spécifiques (un auteur, un titre, une date, etc.) pour autant que le champ sur lequel porte la recherche ait été renseigné lors de l’indexation des documents. Il est possible d’effectuer des recherches en combinant plusieurs critères de recherches avec des opérateurs booléens. Certaines GED offrent également la possibilité de combiner la recherche en texte intégral avec la recherche avancée ;
  • la recherche via le plan de classement : cette recherche correspond à une démarche plus intuitive. Elle est utile lorsqu’on n’a pas une idée précise de ce que l’on recherche ou que l’on veut avoir une vision complète d’un dossier.

Depuis l’écran de résultat d’une recherche, l’utilisateur doit pouvoir visualiser un document, l’imprimer et avoir accès aux documents voisins (classés dans le même dossier).

La diffusion des documents

Les documents peuvent être diffusés selon deux méthodes :

  • la méthode pull  : l’usager va chercher lui-même les documents dont il a besoin. C’est le cas lorsqu’il effectue directement une recherche dans la GED ;
  • la méthode push  : le système pousse l’information vers l’usager, via son e-mail ou un panier personnel dans la GED. Cela se réalise grâce à un système d’abonnement.

Le projet de GED de l’EPFL

En 2007, l’EPFL a cherché à acquérir un système de GED pour gérer au quotidien les flux de documents de différents services et secrétariats. Le Service académique, le Service des Affaires professorales, le Service du Délégué à la recherche, l’Ecole doctorale, la Vice-présidence pour les Affaires académiques, le Secrétariat Général, et le Secrétariat de la Présidence ont alors exprimé le souhait de s’équiper d’un tel outil. Pour le Service académique et les Affaires professorales, la GED sera utilisée pour gérer les dossiers des étudiants et des professeurs. Dans les secrétariats et le service du Délégué à la recherche elle servira à gérer le courrier entrant et les documents produits dans ces unités.
A la suite d’une procédure d’appel d’offre publique, le logiciel Alfresco a été choisi et la réalisation de ce projet a commencé, au mois de février dernier, par le Service académique.



Cherchez ...

- dans tous les Flash informatique
(entre 1986 et 2001: seulement sur les titres et auteurs)
- par mot-clé

Avertissement

Cette page est un article d'une publication de l'EPFL.
Le contenu et certains liens ne sont peut-être plus d'actualité.

Responsabilité

Les articles n'engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d'autres entités). Toute reproduction, même partielle, n'est autorisée qu'avec l'accord de la rédaction et des auteurs.


Archives sur clé USB

Le Flash informatique ne paraîtra plus. Le dernier numéro est daté de décembre 2013.

Taguage des articles

Depuis 2010, pour aider le lecteur, les articles sont taggués:
  •   tout public
    que vous soyiez utilisateur occasionnel du PC familial, ou bien simplement propriétaire d'un iPhone, lisez l'article marqué tout public, vous y apprendrez plein de choses qui vous permettront de mieux appréhender ces technologies qui envahissent votre quotidien
  •   public averti
    l'article parle de concepts techniques, mais à la portée de toute personne intéressée par les dessous des nouvelles technologies
  •   expert
    le sujet abordé n'intéresse que peu de lecteurs, mais ceux-là seront ravis d'approfondir un thème, d'en savoir plus sur un nouveau langage.