24 bit VS 16 bit: quelle résolution choisir?
Résolution, haute définition...
Des termes associés à l’idée d’un gain en précision de l’audio, par analogie avec la résolution d’une image…mais est-ce vraiment le cas?
- L'audio marketé comme "Hi-Res" est-il vraiment supérieur à celui du CD?
- Quelle résolution de production adopter:
16 bit ou 24 bit?
Conversion Analogique à Numérique
Pour pouvoir enregistrer un son avec un ordinateur, on doit convertir une onde mécanique en tension électrique.
Cette tension est à son tour convertie en signal numérique pour pouvoir être traitée et stockée par l’ordinateur avant d’être re-convertie dans le sens inverse pour la reproduction de l’onde sonore.
C’est la fonction des convertisseurs analogique à numérique et numérique à analogique.
Lors de cette opération on passe d’un signal analogique qui varie de façon continue avec le temps (le signal électrique) à une représentation numérique qui comporte une séquence de valeurs distinctes (le code binaire).
On parle de discrétisation du signal.
Un signal très discret
Pour discrétiser on échantillonne le signal analogique dans le temps, c’est à dire qu’on mesure sa tension électrique à intervalles réguliers.
Ce sont ces valeurs mesurées périodiquement qui vont constituer notre signal discret.
Celui-ci a deux dimensions:
le temps qui contient l’information en termes de fréquences.
l’amplitude qui concerne l’intensité sonore ou la tension en volts.
Afin que cette suite de relevés de tension puisse être traitée par l’outil informatique, chaque échantillon doit être quantifié sur une échelle dont le pas et le nombre d’échelons découle de la résolution utilisée.
Cela implique d’arrondir chaque échantillon à la valeur permise la plus proche sur l’échelle.
Quantification
Quantifier c’est coder le signal audio en langage binaire, un langage informatique en base deux, composé uniquement de deux valeurs: 0 et 1.
Pour une résolution de 3 bits on aura (23) valeurs possibles donc huit mots de trois bits, affectés à huit niveaux de quantification.
Pour une résolution de 2 bits on ne dispose plus que de 4 mots pour coder toutes les valeurs de tension relevées lors de l’échantillonnage.
La quantification se fait donc avec une perte d’information d’autant plus grande que la résolution est basse.
Cette erreur de troncature, différence entre le signal analogique et le signal quantifié, se traduit par du bruit de quantification.
Plus la résolution est basse, plus le pas de quantification est grand, plus les valeurs quantifiées sont approximatives.
Résultat: une augmentation du niveau de bruit de fond et une réduction de la plage dynamique.
Plage Dynamique
La plage dynamique, en gros, c’est la différence entre le son le moins fort et le son le plus fort que tu puisses entendre ou qui puisse être reproduit par un support ou une machine.
Par exemple, la plage dynamique de l’oreille humaine se situe entre zéro et cent-vingt décibels. C’est l’écart entre le seuil de l’audition et celui de la douleur.
Les cassettes audio ont quelque chose comme cinquante décibels de plage dynamique, alors que le disque vinyle arrive aux environs de soixante-dix décibels.
Le CD, contrairement aux deux autres support cités, est numérique.
Il est encodé avec une résolution de 16 bit.
Cette résolution lui confère une plage dynamique de quatre-vingt-seize décibels !
Pour résumer:
Le rapport entre les niveaux forts et les niveaux faibles d’une modulation est appelé dynamique.
Idéalement, cette dynamique doit se placer entre le niveau maximum et le seuil du bruit de fond, dans ce que l’on nomme la plage dynamique.
Dans ce cadre, l’écart entre un maximum de modulation et le niveau de bruit de fond est appelé rapport signal sur bruit (SNR pour Signal to Noise Ratio).
Plus il est élevé meilleure est la qualité de la transmission du signal.
SQNR
En numérique, le bruit vient de l’erreur de quantification, le rapport signal sur bruit devient donc SQNR (Signal to Quantization Noise Ratio).
De façon approximative (mais pratique) on dit qu’il est de 6 dB par bit.
Pour 4 bits, par exemple, le SQNR sera de 24 dB.
Pour ceux qui comprennent mieux avec une formule mathématique:
SQNRdB = 20Log (2 n bit)
➽ si tu n'est pas au point niveau calculs des décibels: vidéo pour toi
Donc sachant cela:
16 bit
216 = 65 536 niveaux de quantification.
16 bits x 6 dB = 96 dB de plage dynamique.
24 bit
224 = 16 777 216 niveaux de quantification.
24 bits x 6 dB = 144 dB de plage dynamique.
Mais du coup...augmenter la résolution, est-ce aussi augmenter la précision de l ‘enregistrement et de la reproduction audio ?
Pour commencer, tu peux regarder ce petit bout de vidéo où je fais une écoute comparative.
En vrai...
La résolution n’affecte pas la précision du rendu audio.
Comme on l’a vu elle affecte la plage dynamique.
Plus on monte en résolution, plus le seuil du bruit est bas.
En 16 bit il n’y a aucun souci de reproduction de la forme d’onde, on bénéficie de plus de soixante-cinq-mille niveaux de quantification: le bruit est si bas qu’il est inaudible.
L’audio n’est ni plus ni moins détaillé qu’en 24 bit…c’est exactement la même chose en terme d’écoute, seule la plage dynamique change.
C’est d’autant plus vrai que l’industrie du disque joue encore le jeu de la “guerre du volume” et la majorité des musiques commercialisées aujourd’hui ont une plage dynamique fortement réduite par la compression et le clipping tant en mix qu’en mastering.
Alors…24 bit ou pas? Et pour quoi faire?
Headroom
L’utilité du 24 bit tient au fait que, vu que la plage dynamique est très grande, on gagne du headroom.
Ce qu’on nomme headroom c’est une réserve avant saturation.
On se fixe un niveau de travail qui nous permet d’avoir une marge en cas de dépassement imprévu, lors d’un enregistrement par exemple, et d’éviter l’écrêtage.
Pour donner un exemple:
Quand je garde une marge de sécurité de dix décibels, je module à 10 dBFS.
Ce qui fait que je n’utilise pas tous les bits disponibles pour coder mon signal.
Mécaniquement c’est comme baisser la résolution: je bénéficie de moins d’échelons de quantification.
Mon rapport signal sur bruit est moins bon et ma plage dynamique diminue.
Ce qu’il faut comprendre, en fait, c’est que le 24 bit n’ajoute pas de headroom sous forme de décibels supplémentaires avant saturation comme par magie!
Non…le “0 dBFS” c’est le maximum, en seize ou en vingt-quatre bits.
La marge qu’on gagne vient du fait qu’on fait baisser le seuil du bruit en augmentant la résolution.
À l’époque où on ne travaillait qu’en 16 bit, on nous conseillait de “moduler au plus proche du zéro” (dBFS), sans jamais l’atteindre, pour utiliser le maximum de bits disponibles.
Aujourd’hui, en 24 bit, le seuil du bruit est tellement bas que cette façon de faire parait archaïque.
On peut vraiment se permettre un headroom de 10 dB sans aucun souci et ainsi travailler avec un certain confort dont il serait dommage de se priver.
Au final, ça nous permet de travailler en structurant notre gain comme en analogique. J’explique tout ça en détails dans mes “Fiches du French” sur le Gain Staging (téléchargement gratuit ici).
Conclusion
Pour conclure, je dirais d’abord que le 16 bit ne pose aucun souci au niveau de la reproduction.
J’irai même jusqu’à dire que le 24 bit n’ajoute rien à l’expérience d’écoute qui soit réellement perceptible.
Pour de la musique commercialisée, du point de vue de l’auditeur, 16 ou 24 bits c’est la même chose.
Donc pas de différence au niveau de la perception , j’insiste sur ce mot.
Par contre, en résolution de production il vaut mieux utiliser le 24 bit pour bénéficier du headroom supplémentaire et appliquer une structure du gain digne de ce nom.
Un dernier mot sur l’audio étiqueté Hi-Res: la résolution, le bit depth, n’est qu’une partie du sujet, puisque de hautes fréquences d’échantillonnage sont utilisées ( 96 kHz).
Donc nous pourrons continuer cette conversation dans un prochain post !!!
En attendant n’hésite pas à commenter cet article et à le partager si il t’a été utile.
A plus !