Pour la création des fichiers audio pour Gramophone virtuel, voici les points dont on a tenu compte :
- Grandeur adéquate de la pointe de lecture
- Vitesse de lecture adéquate
- Convertisseur analogique-numérique
- Réduction du bruit numérique
- Enregistrement et montage audionumériques
- Codage RealAudio
Au cours du processus de lecture, il était nécessaire de prendre en considération que la largeur des sillons a changé au cours des années le fait les enregistrements n'ont pas été faits de façon constante à une vitesse exacte de 78 tours par minute jusqu'au milieu des années 1930. Par conséquent, il fallait déterminer la grandeur de la pointe de lecture ainsi que sa vitesse, après avoir préalablement enregistré sur une bobine afin de réduire l'usure des disques.
1. Grandeur adéquate de la pointe de lecture
Avec le temps, il y a eu une diminution graduelle de la largeur des sillons des disques 78 tours en raison du perfectionnement du processus d'enregistrement. Un contact adéquat entre la pointe de lecture et les parois du sillon est essentiel à l'obtention d'une qualité sonore optimale au cours de la reproduction. Par conséquent, il importe de choisir une grandeur et une forme de pointe de lecture adéquates.
De plus, en choisissant la pointe de lecture appropriée, les différents types d'usure peuvent être compensés. Par exemple, il est possible d'utiliser une plus petite pointe de lecture afin de suivre plus creux dans le sillon afin de compenser un disque ayant subi des dommages dans le haut du sillon. Dans certains cas, le fait de suivre différentes parties du sillon ne fera pas une différence perceptible dans la qualité de reproduction, mais dans d'autres cas, il y aura une amélioration remarquable.
2. Vitesse de lecture adéquate
Pour ce projet, étant donné l'âge et la fragilité des enregistrements, les disques ont été joués à 78 tours par minute et enregistrés sur bobines. La vitesse des enregistrements a été, par la suite, réglée en changeant la vitesse de la platine d'enregistrement lors de la lecture. De cette façon, les disques n'étaient joués qu'une fois et une copie de conservation du disque a été faite.
Bien que ces disques soient désignés sous le nom de 78 tours, la vitesse d'un 78 tours n'est devenue une norme exacte qu'au milieu des années 1930. Même de légères variations de la vitesse de lecture changeront le ton de l'enregistrement et apporteront une différence considérable au timbre d'un enregistrement. Une différence de 5 p. cent de la vitesse de lecture est presque égale à un demi-ton (c.-à-d. la note la devient un la bémol et ainsi de suite). Un «78 tours » enregistré à 76,6 tours par minute doit être joué à 76,6 tours par minute afin d'obtenir une reproduction fidèle.
Il peut être difficile de déterminer la vitesse de lecture idéale. Le fait d'avoir une partition indiquant la bonne clé constitue un bon départ. Malheureusement, les interprètes n'avaient aucun scrupule à transposer un morceau afin de l'adapter à leur voix et, bien entendu, toute musique enregistrée n'est pas disponible sous forme de partition. De plus, le « diapason de concert », qui est maintenant LA=440 Hz, a changé au cours des années (et est maintenant en cours de changement dans le monde entier). De plus, les instruments à cordes préfèrent les dièses alors que les cuivres, eux préfèrent les bémols. Lorsqu'on donnait le ton à un enregistrement vocal, la diction, la résonance, la simplicité du ton et la vitesse du vibrato de l'interprète étaient évaluées avec soin.
3. Convertisseur analogique-numérique
Bibliothèque et Archives Canada se conforme aux normes de préservation audio établies par l’Association internationale d’archives sonores et audiovisuelles, soit une fréquence d’échantillonnage de 96 kHz et une profondeur (résolution) de 24 bits.
La section 2.3 des Recommandations pour la production et la conservation des objets audionumériques présente les normes touchant la profondeur (résolution) en bits.
4. Réduction du bruit numérique
Trois catégories générales de bruits se trouvent sur les enregistrements sonores : le claquement, le grésillement et le souffle. Le CEDAR (restauration audionumérique améliorée par ordinateur) supprime ou réduit ces imperfections au moyen du De-Clicker DC1, du De-Crackler CR1 et du De-Hisser DH2. Ces dispositifs sont basés sur deux processeurs de 40 bits à pointe flottante qui traitent le son en temps réel (c.-à.-d. qu'il n'y a aucune période d'attente pendant que les dispositifs calculent les résultats).
- Suppression du claquement :
L'avantage de la suppression de bruits transitoires de haute fréquence et de haute énergie, comme les claquements, devient immédiatement évident. Le DC-1 enlève les claquements et toute musique sous-jacente. Il recrée ensuite l'onde sonore manquante par l'analyse des échantillons antérieurs et postérieurs au claquement et interpole les résultats à l'aide d'algorithmes de poids fort. Le nombre d'échantillons qu'examine le DC-1 dépend de la longueur du claquement. Un court claquement exige moins d'échantillons (10) qu'un claquement plus long (de 60 à 200) afin de reconstruire l'onde sonore. Le dispositif De-Clicker peut supprimer jusqu'à 2 500 claquements par seconde par canal en temps réel.
- Suppression du grésillement :
Le grésillement est une succession de petits bruits secs, ajoutés au son original en raison d'une mauvaise qualité de la surface du disque, d'une friture causée par de l'équipement mal relié ou mal pris à terre ou de distorsion provenant de la surcharge des sorties d'un mélangeur d'amplificateur ou d'écrêtage numérique. Tous ces éléments rendent le son discordant. Le grésillement est une forme de bruit plus subtile et difficile à supprimer qu'un claquement. Le dispositif De-Crackler traite de ce problème en divisant le signal d'entrée en signal « véritable » et en signal de « grésillement et distorsion » et en s'occupant uniquement du signal avec le grésillement. Tout d'abord, l'opérateur détermine le niveau de « grésillement et de distorsion » présent dans le signal d'entrée, puis définit la quantité de grésillement que doit enlever le CR-1. Ensuite, le mode de grésillement est établi pour le premier niveau (net et bien défini) ou le deuxième niveau (« flou » et moins bien défini). Enfin, le signal est combiné de nouveau. Le CR-1 doit être réglé à l'oreille et, s'il est mal réglé, il peut nuire à la qualité sonore.
Le souffle est très évident pour une personne qui l'entend, mais beaucoup plus difficile à discerner pour une machine. Par conséquent, il est moins facile à enlever qu'un claquement net ou un grésillement. Le dispositif DH-2 enlève le souffle en analysant le contenu tonal, transitoire et d'ambiance du signal à des centaines de bandes de fréquence tout en supprimant celles qui ne détectent aucun signal musical. L'opérateur doit tout d'abord régler le paramètre de niveau de bruit, afin de donner au DH-2 une idée quelconque de la quantité de bruit présente dans tout signal donné. Ensuite, l'opérateur doit régler l'atténuation, qui établit une limite maximum de la quantité de bruit que le DH-2 enlèvera à n'importe quelle fréquence donnée. Enfin, l'opérateur règle l'algorithme d'intensité pour conserver la quantité appropriée de présence en déterminant la vitesse à laquelle le DH-2 enlèvera le bruit. Le DH-2 est le dispositif du CEDAR le plus difficile à régler. S'il est mal réglé, il peut nuire énormément à la qualité sonore.
L'effet auditif net de la suppression de bruits d'enregistrements sonores peut être spectaculaire. L'utilisation judicieuse de la réduction du bruit numérique peut efficacement libérer la musique des défauts de son support d'enregistrement, découvrant des détails qui étaient auparavant masqués par le bruit.
5. Enregistrement et montage audionumériques
Le montage a été effectué sur une station audio numérique sur PC, appelée Pyramix de la société Merging Technologies, qui allie l'enregistrement sur disque rigide en temps réel, le mélange audio, le montage, le traitement des effets sonores et le matriçage CD-R. Le système utilise une carte contenant quatre microprocesseurs DSP 3210 d'AT&T, de 32 bits à virgule flottante, qui offrent une puissance de crête totale de 133 Mflops (millions d'opérations en virgule flottante par seconde). Toutes les opérations sont exécutées en 32 bits. La fonction d'enregistrement enregistre de 16 à 32 bits.
Une fois les extraits enregistrés sur le disque rigide, la station audio numérique affiche la forme de l'onde afin de voir et manipuler visuellement les ondes sonores. Le montage des bobines exige qu'on coupe physiquement le support avec une lame de rasoir, puis qu'on rattache ensemble les sections. Ce processus rend très difficile, sinon impossible, la correction des erreurs de mise au point. Le montage audionumérique consiste à placer des marqueurs au début et à la fin des sections à mettre au point. Les points de montage peuvent être bougés, supprimés ou modifiés à n'importe quel moment. Pendant qu'ils sont en place, ils ordonnent à la station audio numérique la prochaine mesure à prendre, sans aucunement modifier le fichier original.
Aussi, bien que l'équivalent de la coupure de la bande soit possible sur une station audio numérique, une fonction appelée fondu enchaîné existe aussi. Celle-ci permet simultanément de fondre au noir un signal tandis qu'un autre fond au blanc au point du montage. Cette opération peut se produire en millisecondes (ou selon la durée de chaque séquence) et produit un montage coulant et uni. Les niveaux d'enregistrement peuvent être changés et les fondus au blanc et au noir peuvent être bougés ou changés à n'importe quel moment.
6. Codage RealAudio
Le codage RealAudio réduit la grandeur des fichiers audio de façon que les renseignements puissent « circuler » de façon continue dans Internet à une vitesse à laquelle le modem de l'utilisateur (connexion Internet) peut répondre. Par exemple, un fichier monographique non condensé .WAV de « Meet me in St. Louis » réalisé par Robert Price (Berliner 1426) est de 10 236 kilo-octets. S'il est condensé pour un modem de 14,4 K, le fichier passe à 130 kilo-octets (1,2 p. cent du volume du fichier original), pour un modem 28,8 à 246 kilo-octets (2,4 p. cent) et un modem de 56 K à 485 kilo-octets (4,7 p. cent). Chaque extrait a été condensé trois fois, pour des modems de 14,4, de 28,8 et de 56 kilo octets.
Pour de plus amples renseignements sur l'enregistrement audionumérique, consultez l'article « Les enregistrements audionumériques de la Bibliothèque nationale du Canada » (archivé).