FLASH INFORMATIQUE FI



VisualAudio, une technique visuelle d’extraction du son des anciens disques phono




Ottar JOHNSEN

Frédéric BAPST

Christoph SUDAN

Silvain STOTZER


Introduction

Le projet VisualAudio a été proposé par la Phonothèque Nationale Suisse à Lugano, organe chargé de conserver le patrimoine sonore helvétique. Ce projet se base sur les deux constatations suivantes :

• 1) Sur un disque phonographique, l’information est extraite par l’intermédiaire d’une aiguille qui suit la position latérale du sillon. Si l’on observe ce sillon au moyen d’un microscope, on peut voir le déplacement radial du sillon. Cela signifie que l’information musicale est visible.

• 2) De nombreux disques anciens, en particulier les originaux des productions radiophoniques, qui sont des pièces uniques, sont dans un état de dégradation excluant une lecture par un moyen mécanique. D’où l’intérêt d’une lecture sans contact.

Le film photographique s’est ainsi rapidement imposé comme une solution potentielle étant donné la résolution des films hautes définitions. Le principe de VisualAudio consiste donc à prendre une photo du disque, à archiver le film, puis à scanner le film et à traiter l’image obtenue afin d’extraire le contenu sonore du disque (voir fig. 1). L’Ecole d’ingénieurs et d’architectes de Fribourg a été chargée de la réalisation de ce projet.

Fig. 1 : Concept général de VisualAudio 

La solution photo résout également plusieurs défis importants inhérents aux systèmes d’archivage :

• rapidité du processus d’archivage : le temps de la prise de photo est relativement court et le développement peut être fait de façon automatique ;
• durée de vie élevée : jusqu’à plusieurs centaines d’années pour certains films. Ceci évite de devoir faire périodiquement des copies des documents ;
• stockage de l’information sous forme visuelle, donc pas dépendante d’une technologie particulière qui peut rapidement devenir obsolète.

Disques phonographiques

Depuis l’invention du phonographe vers 1880 et jusqu’à l’introduction des bandes magnétiques dans les années 50, le seul moyen d’enregistrement sonore était le disque phono. Une grande partie du patrimoine audio mondial se trouve ainsi conservé sur des disques 78 tours et 33 tours.

Tout comme pour l’informatique dans les années 70, la standardisation du mode d’enregistrement et des modes de fabrication des disques ne s’est pas faite immédiatement. On trouve des vitesses de rotation standard de 16, 33, 78 tours/minutes, ainsi qu’une multitude de vitesses dépendantes des différents fabricants de tourne-disques, allant de 68 à 84 tours/minute. Le format et le poids des têtes de lecture dépendent également de l’époque, du matériau utilisé et du fabricant.

Avant l’apparition du vinyle dans les années 30, les disques étaient gravés ou pressés dans des matières telles la cire ou le shellac. Ces matières organiques se dégradent avec le temps, et sont également sujettes à l’attaque de certains champignons.

Tab. 1 : Quelques caractéristiques physiques indicatives des enregistrements phonographiques 

Prise de vue

La prise de vue est la partie critique de VisualAudio. Elle est effectuée une fois au début du processus afin d’archiver les disques sous forme de film photographique.

Comme pour l’écoute d’un disque avec un tourne-disque conventionnel, il est préférable de nettoyer convenablement les disques avant de les photographier afin d’enlever un maximum de poussière ou corps étrangers.

Les films photographiques de haute résolution ont une définition de 600 lignes/mm, ce qui signifie 1200 points/mm ou, pour utiliser un langage plus informatique, 30480 dpi. La résolution est ainsi de l’ordre du micron, ce qui permet de suivre le déplacement du sillon avec une précision suffisante.

Dans le cadre de VisualAudio, une première série de photos a été faite en 2001, afin d’étudier la faisabilité du système. Une deuxième série de prises de vue est en cours à l’Ecole d’Arts Appliqués de Vevey afin de déterminer exactement le matériel, les films et le type de développement le plus adéquat à ce projet.

Acquisition de l’image digitale

Fig. 2 : Le prototype d’acquisition de l’image 

Fig 3 : Extrait d’un anneau d’acquisition. Cette image représente environ un 1/100e de la rotation du disque. La largeur réelle de cet anneau est de 2mm. Cette acquisition ayant été effectuée sur un film négatif, les sillons apparaissent en clair sur cette image 

Le contenu du disque est ainsi stocké sur film photographique de façon optique. Encore faut-il pouvoir en restituer le contenu sonore. Un prototype électro-optico-mécanique à été construit à l’Ecole d’ingénieurs et d’architectes de Fribourg (voir fig.2). Celui-ci se présente sous la forme d’un plateau de verre monté sur un moteur rotatif. Le film est placé sur ce plateau et la digitalisation de l’image est faite par une caméra CCD linéaire fixe de 2048 pixels de large, qui prend des images à intervalles réguliers (avec des fréquences de 25’000 à 200’000 lignes par rotation du disque). Cette caméra, combinée à la rotation du film sur le plateau de verre, effectue un scan rotatif et fournit une image rectangulaire d’un anneau du disque (voir fig.3). Un 2e moteur procède ensuite au déplacement radial du disque afin de passer à l’acquisition de l’anneau suivant.

Traitement de l’image

Une fois digitalisée, l’image des sillons est traitée et analysée afin de déterminer la position et les déplacements du sillon. Une première étape consiste à corriger les imperfections de l’image acquise. Des perturbations de l’image peuvent en effet provenir des diverses étapes du processus d’acquisition : le disque lui-même (fissure, griffure, poussière,...), de la photo, ou du scan (poussière, optique, capteurs CCD défaillants,...).

Ensuite, la position du sillon est estimée à l’aide d’un simple seuillage ou d’une méthode plus élaborée. Une fois les bords du sillon détectés, on peut appliquer certaines corrections plus complexes nécessitant des connaissances sur la structure de l’image. On sait par exemple qu’un sillon est continu, et que pour un disque monophonique, la largeur du sillon est constante. On peut ainsi détecter la présence de poussière, champignon ou d’autre élément perturbateur sur l’image acquise, et éviter d’en tenir compte lors de l’extraction du contenu sonore.

Voici quelques exemples de corrections à apporter :

• interpolation du sillon si celui-ci est interrompu ;
• si un des deux bords du sillon est abîmé, on peut n’utiliser que l’information fournie par l’autre bord du sillon.

Extraction du son

Le déplacement du sillon est ainsi transformé en signal sonore. Ce signal est encore traité par des filtres passe-bande afin de ne restituer que la bande passante de l’enregistrement original. Certaines pondérations fréquentielles peuvent y être encore appliquées, conformément au type d’enregistrement original (par exemple : courbe d’égalisation RIAA).

Le but du projet VisualAudio est d’archiver et de récupérer le son des disques en restant le plus fidèle possible à l’enregistrement original. Il est possible d’ajouter encore une phase de restauration du son afin d’enlever le bruit de souffle ou les craquements qui pourraient être dus à l’enregistrement ou au mauvais état de conservation du disque au moment où la photo a été prise. Ces techniques de restauration sont des sujets controversés, mais déjà bien décrits dans la littérature et il existe dans le commerce des applications donnant de très bons résultats. Ainsi cette partie de traitement resterait optionnelle lors du processus de VisualAudio.

Un extrait de son produit au moyen de VisualAudio peut être écouté sur : www.eif.ch/visualaudio.

Résolution et qualité du système

L’objectif final de ce projet est d’obtenir le meilleur rapport signal sur bruit. Il ne sera certainement jamais possible d’atteindre la même qualité de son qu’un disque 33t de bonne qualité joué sur un tourne-disque moderne. Mais afin de garantir la préservation des disques à archiver, le son extrait par VisualAudio doit pouvoir approcher le rapport signal sur bruit des anciens disques 78t. Le calcul de ce rapport peut être estimé comme suit : le sillon d’un disque 78t a une déviation standard d’environ 75 µm. En travaillant avec une caméra CCD linéaire de 2048 pixels de 10x10µm et un agrandissement optique de 10x, on obtient une résolution radiale de 1µm. Ce système contient donc 75 pas de quantification, ce qui mène à un rapport signal sur bruit théorique de 39 dB.

Les tests effectués sur le premier prototype ont donné des rapports signal sur bruit allant de 15 à 20 dB. Ceci s’explique par des variations dues à l’éclairage (50Hz), à des vibrations du moteur rotatif, et la présence de poussière lors de la prise de photo notamment.

Des améliorations de notre prototype sont en cours afin d’éliminer ces problèmes. La mise au point de nouveaux algorithmes de détection du sillon (estimation subpixel, filtrage, modélisation du sillon,...) devraient également permettre un gain sensible de qualité sonore.

On peut finalement résumer les avantages et inconvénients d’un tel système :

Avantages

• Permet d’archiver et de lire un disque sans contact.
• En travaillant avec des images d’une certaine largeur, et non pas sillon par sillon, il est possible de récupérer l’information contenue sur les parties intactes de disques cassés ou fendus, même si ceux-ci ne sont plus utilisables avec un tourne-disque traditionnel.
• Les disques sont archivés sous un nouveau format permettant de récupérer l’information plus tard par de nouvelles technologies.
• Le film photo est un support durable, dont la durée de vie se compte en plusieurs dizaines, voire centaines d’années.
• Les archives doivent contenir le plus grand nombre possible de documents. Parmi ceux-ci seul un petit nombre sera consulté. Le temps d’archivage de chaque document doit ainsi être réduit au minimum, puisque effectué à grande échelle. La photo réduit ce temps d’archivage.
• Le temps de lecture du film et de traitement informatique au moyen du prototype VisualAudio est actuellement équivalent au temps d’écoute avec un tourne-disque.

Inconvénients

• Pas encore utilisable pour les disques gravés en profondeur.
• Pas directement utilisable pour les cylindres. Cette technologie était antérieure au disque phonographique (1870-1910 environ), et consistait à enregistrer la musique sur un cylindre de cire.
• Des irrégularités de la surface du disque, sans effet lors de l’audition avec un tourne-disque traditionnel, peuvent influencer la qualité du son extrait par VisualAudio.

Conclusion

Ce projet génère un intérêt grandissant tant auprès des professionnels de l’audio et de la sauvegarde du patrimoine que du côté scientifique. De plus, il illustre également l’excellente collaboration entre le Département d’Informatique de l’Université de Fribourg et l’Ecole d’Ingénieur et d’Architecte de Fribourg. Il reste encore à convaincre les partenaires industriels de la qualité d’un tel système, et des différents débouchés commerciaux qui en découlent.

Remerciements

La réalisation du projet VisualAudio a été possible grâce à la collaboration des personnes suivantes que nous remercions vivement : S. Cavaglieri, P. Pellizzari, N. Bosi, O. Chassot, C. Miauton, Y. Pauchard, L. Altwegg, P. Bovet, J. Miauton, L. Schmitt, S. Ruegsegger, T. Fumey, R. Ingold.

Ce projet est subventionné par le FNRS, No de projet 21-64984.01 et par la HES-SO, projet 01-01TI.

Pour en savoir plus

http://www.eif.ch/visualaudio

http://diuf.unifr.ch/diva/

Disques phono

http://shellac.org/wams/wtext1.html

http://www.geocities.com/SoHo/museum/8764/

Préservation du son

http://www.iasa-web.org/

http://www.fonoteca.ch/fr/presentation/

Restauration du son

http://www.cedar-audio.com/



Cherchez ...

- dans tous les Flash informatique
(entre 1986 et 2001: seulement sur les titres et auteurs)
- par mot-clé

Avertissement

Cette page est un article d'une publication de l'EPFL.
Le contenu et certains liens ne sont peut-être plus d'actualité.

Responsabilité

Les articles n'engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d'autres entités). Toute reproduction, même partielle, n'est autorisée qu'avec l'accord de la rédaction et des auteurs.


Archives sur clé USB

Le Flash informatique ne paraîtra plus. Le dernier numéro est daté de décembre 2013.

Taguage des articles

Depuis 2010, pour aider le lecteur, les articles sont taggués:
  •   tout public
    que vous soyiez utilisateur occasionnel du PC familial, ou bien simplement propriétaire d'un iPhone, lisez l'article marqué tout public, vous y apprendrez plein de choses qui vous permettront de mieux appréhender ces technologies qui envahissent votre quotidien
  •   public averti
    l'article parle de concepts techniques, mais à la portée de toute personne intéressée par les dessous des nouvelles technologies
  •   expert
    le sujet abordé n'intéresse que peu de lecteurs, mais ceux-là seront ravis d'approfondir un thème, d'en savoir plus sur un nouveau langage.