Sons, paroles et musiques dAfrique (MRAC)
Le 1 octobre 2003, le projet DEKKMA a ete lance dans le cadre du Programme pluriannuel de soutien au developpement de la societe de linformation (PPSI) de
Problemes de conservation et daccessibilite
Comme dans toutes les archives sonores a valeur historique, on retrouve dans celles du MRAC differents supports (les cylindres de cire, les Sonofils, les bandes magnetiques, les disques pour gramophones, les cassettes audio, les CD, …). Ceci a pour consequence que la qualite technique des enregistrements nest pas toujours satisfaisante (notamment pour ceux datant davant les annees 1950), mais, surtout, que letat materiel des supports sonores les plus anciens ne permet pas dutilisations frequentes. Le fait que les supports sonores les plus anciens puissent subir les outrages du temps rend necessaire le transfert des collections audio completes vers un support durable, avant que des pans entiers de ces archives ne soient endommages ou definitivement perdus.
Laccessibilite des archives constitue un second probleme. Actuellement, pour une etude approfondie, il faut effectuer des copies de travail de loriginal, avec le risque constant de
lendommager. En outre, les meta-donnees (systeme de fiches) et information contextuelle liees directement aux enregistrements ne peuvent etre consultees que sur place. Pour y remedier et pour ouvrir les archives sonores a un public plus important, une banque de donnees et un acces en ligne sont necessaires.
Les objectifs du projet
Dans la realisation de ce projet, il convient de tenir compte de divers facteurs si lon veut elaborer un instrument complet et efficace pour une utilisation interne et externe.
¦ La digitalisation sonore
La digitalisation de lensemble des archives sonores du service dethnomusicologie du MRAC est realisee dans son propre studio audio.
A travers des initiatives et des publications recentes, desgroupes de travail internationaux ont argumente quant a la necessite de la digitalisation ainsi que sur les aspects techniques et autres elements corollaires au processus de numerisation. La source la plus importante a ce sujet est lInternational Association of Sound and Audiovisual Archives (IASA). Comparativement aux autres institutions plus avancees, le projet de digitalisation des archives sonores ethnomusicolo-giques du MRAC est assez tardif et une approche urgente savere necessaire pour suivre les standards internationaux dans le domaine de larchivage audio.Il va de soi que les differents supports sonores necessitent chacun une approche qui leur est propre et quune partie des enregistrements les plus anciens (cylindres de cire et Sonofils) doivent etre restaures avant que lon puisse passer a la fabrication dune copie. Quant aux autres supports sonores, nous partons du principe que les premieres copies digitales doivent approcher le plus possible loriginal et que le travail de restauration ne peut seffectuer que sur cette premiere copie.
Les rouleaux de cire (457 pieces) les plus anciens datent de 1910 et ont ete enregistres par le capitaine Armand Hutereau dans la province du Uele (R.D. Congo). Ils ont une grande valeur historique et proviennent dune periode ou les enregistrements sonores en etaient a leurs premiers balbutiements, ce qui est particulierement vrai pour lAfrique ou la nature du materiau exigeait les plus grandes precautions. Ces rouleaux de cire seront dabord restaures puis copies sur support digital durable, pour etre enfin transcrits sur disque dur. Cette tache sera realisee en collaboration avec le Museum fur Volkerkunde de Berlin, qui dispose egalement dune grande collection de ce type de support et qui a developpe un systeme de res-tauration et de digitalisation adapte.
La collection de Sonofils pose de grands problemes sur le plan de la restauration, en raison de la nature du materiau. Il sagit, en effet, dun fil metallique tres fin enroule sur une bobine, qui doit, dans de nombreux cas, etre dabord demele puis passe dans un lecteur adequat, avant detre copie.
Pour la collection de disques pour gramophones, nous nous limitons dans un premier temps a la digitalisation des disques 78 et 45 tours (au total 1.142 pieces) datant des annees 1940 et 1950.
Les archives sonores comptent un total de 1.750 bandes magnetiques dune duree moyenne de 60 minutes. La plus grande partie de ces bandes est restee en bon etat et peut etre digitalisee directement. A cet egard, la qualite et lage du materiel sont determinants. Sur ce type de support, le son est code magnetiquement et le materiel encourt inevitablement des degradations.
Les archives abritent en outre 650 cassettes audio dune duree moyenne de 60 minutes, quelques centaines de cassettes DAT et de CD qui seront enregistres lors dune phase ulterieure du projet de digitalisation.
La digitalisation des meta-donnees
Nous entendons par la la digitalisation des donnees qui ont un lien avec les enregistrements audio et qui ne sont actuellement disponibles qua travers un systeme de fichiers. Ces meta-donnees sont notamment constituees dinformations relatives au pays et au lieu ou lenregistrement a ete effectue ou au peuple concerne, et fournissent des donnees sociales, anthropologiques et culturelles quant a la fonction, aux instruments de musique, aux executants et aux genres musicaux.
Partant de la forme standardisee de cette information, une banque de donnees digitale propre a ete developpee et est disponible sur Internet en francais, neerlandais et anglais. Tous les elements mentionnes sur le fichier initial associe a lenregistrement audio sont controles quant a leur exactitude et adaptes, le cas echeant, avant detre integres dans la banque de donnees.
Banque de donnees et systeme dintegration
Il a ete necessaire darchiver tant les enregistrements musicaux numerises que les meta-donnees, et ce, de preference, de maniere a ce quune future actualisation et toute recherche dinformations se poursuive de facon efficace et (semi-)automatique. En dautres termes, il fallait structurer et conserver toutes les donnees disponibles de sorte que les archives soient accessibles aisement et a travers un systeme dexploitation convivial. Pour cette raison, nous avons choisi de developper une solution qui integre une banque de donnees faite sur mesure, multilingue et capable de contenir toutes les donnees disponibles, afin deviter toute perte dinformation. Il y a dautres exigences a respecter. Le systeme developpe doit etre integre pratiquement sans transition dans dautres systemes dinformation existant au sein du Musee, et les donnees doivent etre facilement transferables ou interchangeables. En raison de lequipement materiel et logiciel preexistant du Musee, nous avons choisi de travailler avec un systeme de banques de donnees relationnel, ce qui est actuellement la technologie utilisee le plus couramment. Apres etude approfondie, nous avons elabore, au moyen de la technique de modelisation « Enhanced Entity Relationship », un projet de schema de banque de donnees fait sur mesure, que nous avons ensuite mis en oeuvre. Ceci garantit, pour les donnees, un format de stockage optimal et independant. Pour promouvoir lechange de donnees, la deuxieme phase du projet elaborera un certain nombre de procedures visant a convertir
les donnees dans un format dechange standard. Un acces convivial a la banque de donnees est obtenu par lutilisation dun site web integre et cree sur mesure. La digitalisation de linformation contextuelle Linformation contextuelle concerne la documentation complete, presente dans le service, qui est en relation avec une source sonore, a savoir des photos, des videos, des notes de terrain, des publications, des informations generales relatives aux instruments de musique et a la culture musicale du peuple ou lenregistrement a ete effectue,
… Une partie importante de cette information contextuelle peut etre consultee a travers la banque de donnees placee sur Internet. Celle-ci presente a lutilisateur un contexte large dans lequel il peut situer lenregistrement. Le travail est execute par un personnel competent familiarise avec cette matiere : soit les chercheurs ont realise eux-memes les prises de son sur le terrain, soit ils sont familiarises avec la culture musicale de leur pays au point quils peuvent ajouter des informations precieuses aux meta-donnees existantes. Cest le cas notamment de J.-B. Nkulikiyinka, ancien chef du Ballet national du Rwanda et musicologue implique dans le projet.
A la recherche dun contenu musical
Depuis quelques annees, une partie des etudes sont consacrees aux manieres de decrire les contenus musicaux interessants et dutiliser ensuite ces descriptions pour retrouver la musique dans la banque de donnees. Cette approche offre la possibilite deffectuer une recherche dans une banque de donnees sur la base dun exemple sonore, ou sur celle dune description des proprietes emotionnelles de la musique. Cette analyse combine deux approches. La premiere consiste a tirer du son des observations de structure. Il sagit, par exemple, de detecter des informations sur la tonalite, didentifier les instruments de percussion, de reconnaitre les couleurs des sons (chantes ou instrumentaux). La deuxieme approche concerne les observations subjectives que lon tente de decrire. Celles-ci peuvent avoir trait, par exemple, au caractere structurel de la musique (la melodie, ou encore le modele rythmique) ou le caractere emotionnel qui emane de la musique (gai, melancolique). Ensuite, il sagit de voir dans quelle mesure les descriptions verba-les peuvent etre associees aux caracteristiques physiques de la musique, afin de creer un lien entre les descriptions basees sur le contenu et les observations de lenergie physique de la musique. Le projet DEKKMA adapte les algorithmes du projet MAMI a la musique africaine. Lobjectif est de voir dans quelle mesure il est possible de rechercher, dans une banque de donnees, une musique sur base de son contenu.
Vers une solution integree et rationnelle de stockage de donnees
Pour que le projet produise de bons resultats, il est necessaire de developper des fonctions qui a la fois seront utiles dans la gestion interne du service dethnomusicologie (acquisition, documentation, accessibilite et conservation des documents, contenu) et permettront aux utilisateurs externes davoir acces aux archives sonores du Musee, y compris a linformation contextuelle, et de pouvoir ecouter des exemples musicaux. Tout cela exige bien entendu une strategie interne sur le plan de lequipement informatique, des logiciels, de lentretien et de la protection.
Etant donne lexplosion du nombre de projets de digitalisation gourmands en espace disque (plusieurs dizaines de TeraBytes), il etait imperatif de repenser la maniere de stocker tous les fichiers produits par ces activites en vue de diminuer le cout total dexploitation du parc des serveurs du MRAC. Une solution elegante sest imposee naturellement : la virtualisation de serveurs et de leurs ressources (memoires, disques durs, cartes reseau, onduleurs…) via le logiciel VMWare. Lequipement de base est assez lourd mais est vite rentabilise car il permet de faire evoluer les ressources en fonction de la demande, de maniere centralisee, en evitant ainsi une gestion multiple des serveurs. Cette solution permet de mieux gerer les ressources materielles des serveurs (une seule interface web) mais aussi celle de lespace du local serveur, des connexions reseau, des contrats dentretien, de la puissance electrique et des peripheriques. Il est egalement possible de faire cohabiter plusieurs types de systemes dexploitation differents.
Lespace de stockage prevu dans le cadre du projet sera progressivement etendu a raison de 1,5 TB par an pendant 4 ans. Les protections dusage sont de mise : alimentation et onduleurs redondants ; disques geres par un controleur de type RAID5E permettant le remplacement a chaud de deux disques, simultanement defectueux, sans perte de donnees. Dans lattente dune solution darchivage centralisee, une copie de sauvegarde est prise sur support LTO de deuxieme generation permettant le stockage de 200 GigaBytes de donnees non compressees par cartouche.
Le projet DEKMMA se terminera le 31 decembre
Jos Gansemans / Marc Leman / Guy De Tre / Andre De Muelenaere