In een ander topic hebben we al vrolijk bekeken over waarom bits, transcodes en dergelijke ongein belangrijk zijn voor de gemiddelde muziekluisteraar. In een studio gaat het nog wat verder. We spreken dan over sample rates, bit depths, aliasing, enz. enz.
Als je een tijdje al aan het produceren bent, zullen de meeste termen je wel bekend in de oren klinken, en de meeste zullen ook een vrij goede basis hebben qua kennis. Sommige hebben dit echter niet, en ik ga je hier ook niet vertellen "dit is de preset die je moet gebruiken", maar eerder wat informatie geven over wat deze termen nou precies betekenen en doen, en dan je je eigen beslissingen laten nemen over wat je er mee doet.
Sample rates
Een vrij bekende term die de meeste producers ook veel horen, maar wat betekent het allemaal, en hoe beïnvloed het mijn audio? Wat zijn de voordelen bij het gebruiken van hoge sample rates?
Om maar wederom te beginnen met de basisbeginselen: alle geluid is een vibratie van materie, in ons geval de vibratie van lucht dat we opnemen als geluid. Het menselijke gehoor reikt over het algemeen gezien van 20 Hz tot 20 kHz, maar bij volwassenen is dit eerder tot rond de 16 kHz. Dus, om een goede opname te maken moeten we ervoor zorgen dat we dit spectrum volledig benutten, en dit is waar sample rates in het spel komen.
In de audio wereld is een analoog signaal opgenomen als een verandering/fluctiatie in voltageniveaus over een bepaald tijdsbestek, maar het digitale proces zit anders in elkaar. In de digitale wereld worden stukjes van de voltages over een erg kort tijdsbestek gepakt, en geconverteerd naar binaire data voor opslag of reproductie. De sample rate is de snelheid waarmee dit gebeurt. Dus als je bijvoorbeeld 1.000 stukjes (samples) opneemt per seconde, betekent dit dat onze samplerate 1.000 Hz (1 kHz) zal zijn. Hoe beïnvloed dat ons geluid?
De Nyquist Shannon samplingtheorie zegt dat om een signaal op te nemen, de sample rate minstens tweemaal de frequentie dient te zijn als de frequentie die je op wilt nemen. Wat betekent dit voor onze 1 kHz sample rate? Het betekent dat de hoogst mogelijke frequentie die we op kunnen nemen, 500 Hz zou zijn - ja, zo simpel is het, of niet?
Je weet waarschijnlijk wel dat CD's opgenomen worden op een sample rate van 44,1 kHz - ja, de analoog-naar-digitaal converter meet de voltages 44.100 keer per seconde! Nogmaals, wat betekent dit voor ons geluid? Als we de Nyquist theorie toepassen betekent dit dat de hoogste frequentie die we op kunnen nemen 22.050 Hz is - ver boven de beste oren (van mensen, moet ik toevoegen!).
Waarom moeten we dan ooit hoger gaan dan 44,1 als we het extra opgenomen materiaal toch niet kunnen horen? Omdat aliasing.
Aliasing
Dus, we hebben onze samplerate ingesteld op 44,1 kHz en we zijn klaar om wat dan ook op te nemen. Dus de maximale frequentie die we kunnen gaan opnemen (ook wel bekend als de Nyquist frequntie) is 22.050 Hz. Maar, wat gebeurt er als er iets boven die frequentie in onze signal chain komt, en dan in deo pname?
Hier wordt het iets moelijker, want als dit ongeattenueerd blijft, zullen deze frequenties aliasingartifacts veroorzaken. Aliasing wordt veroorzaakt door een signaal dat over de Nyquist frequentie zit en opgenomen wordt: het wordt in feite "gespiegeld" langs de Nyquist frequentie, waardoor het een "alias" van zichzelf creëert binnen het hoorbare geluidsspectrum. Als we een voorbeeld pakken is dit iets makkelijker te begrijpen.
Onze sample rate is 10 Hz, waardoor de Nyquist frequentie 5 Hz is; dus geen audio mag hierboven gaan, anders wordt het gealiased. Een toon van 7,5 Hz wordt echter opgenomen, waardoor een alias gemaakt wordt (gespiegeld op de Nyquist frequentie) op 2,5 Hz.
Dus, nu we weten wat aliasing is, hoe voorkomen we het? Antialias filters!
Als producer heb je vast wel eens een low pass filter gebruikt; een antialias filter is niet veel anders, het haalt alle audio weg boven de Nyquist frequentie (als het een goed ontworpen antialias filter is, natuurlijk). Tegen de tijd dat de audio bij de Nyquist frequentie komt, zou de filter het voldoende geattenueerd moeten hebben zodat het niet eens opgenomen wordt.
Maar dit verklaart nog niet waarom we hoge samplerates nodig hebben. Helaas, niet alle antialiasing filters zijn zo perfect als zij zouden moeten zijn in theorie, waardoor aliasing nog steeds een probleem is. Door je audio te upsamplen naar een hogere samplerate, kun je drastisch het risico verminderen dat aliasingartifacts in je audio voorkomen, waardoor het werk van de antialias filter veel makkelijker wordt.
Bitdiepte (Bit depth)
Bit depth is voor vele een beetje een mysterie. Bit depth is in feite het aantal discrete stappen dat gesampled kan worden, ook wel bekend als quantization. Je weet hoe sample rates bepalen hoeveel samples opgenomen worden per seconde? Daar ga ik nu wel van uit. Maar dat stelt nog niet vast hoe accuraat elk van die samples is - dit wat bit depth bepaalt.
Quantizatie is de vertegenwoordiging van de amplitude van een signaal (wat in het analoge domein continu is); in tegenstelling tot sample rate. Dit gedeelte van het proces bepaalt wat elke waarde van de 44.100 samples per seconde zou moeten zijn.
8 bit audio (wordt nauwelijks meer gebruikt) is geschikt om de amplitude van een signaal te samplen met een nauwkeurigheid van 256 coderingsstappen. Dit betekent dat elke analoge signaal dat tussen deze stappen valt, vervalt of afgerond wordt naar het dichstbijzijnde figuur - wat bekend staat als quantization distortion/fout. 16 bit audio is al veel beter, aangezien het de amplitude van een signaal kan samplen tot een nauwkeurigheid van 65.536 stappen.
Bit depth bepaalt ook het maximale dynamische bereik van je opnames, waardoor de algemene regel is:
Dynamisch bereik = bit depth x 6
Dus, het dynamische bereik van een 8 bit opname ligt rond de 48 dB, en het dynamische bereik van een 16 bit opname ligt rond de 96 dB. De noise floor (laagst mogelijke waarde dat je op kunt nemen) van allebei deze depths is helaas minder dan de signaal-/ruisverhouding van vrijwel elke degelijke analoge uitrusting (de SNR van mijn E-MU geluidskaart is 120 dB). 24 bit audio geeft ons daarom een dynamisch bereik van rond de 144 dB, wat betekent dat zelfs als al je tracks piekten op -40 dB, de resolutie alsnog accurater zou zijn dan dat van een 16-bit bestand.
Als je een tijdje al aan het produceren bent, zullen de meeste termen je wel bekend in de oren klinken, en de meeste zullen ook een vrij goede basis hebben qua kennis. Sommige hebben dit echter niet, en ik ga je hier ook niet vertellen "dit is de preset die je moet gebruiken", maar eerder wat informatie geven over wat deze termen nou precies betekenen en doen, en dan je je eigen beslissingen laten nemen over wat je er mee doet.
Sample rates
Een vrij bekende term die de meeste producers ook veel horen, maar wat betekent het allemaal, en hoe beïnvloed het mijn audio? Wat zijn de voordelen bij het gebruiken van hoge sample rates?
Om maar wederom te beginnen met de basisbeginselen: alle geluid is een vibratie van materie, in ons geval de vibratie van lucht dat we opnemen als geluid. Het menselijke gehoor reikt over het algemeen gezien van 20 Hz tot 20 kHz, maar bij volwassenen is dit eerder tot rond de 16 kHz. Dus, om een goede opname te maken moeten we ervoor zorgen dat we dit spectrum volledig benutten, en dit is waar sample rates in het spel komen.
In de audio wereld is een analoog signaal opgenomen als een verandering/fluctiatie in voltageniveaus over een bepaald tijdsbestek, maar het digitale proces zit anders in elkaar. In de digitale wereld worden stukjes van de voltages over een erg kort tijdsbestek gepakt, en geconverteerd naar binaire data voor opslag of reproductie. De sample rate is de snelheid waarmee dit gebeurt. Dus als je bijvoorbeeld 1.000 stukjes (samples) opneemt per seconde, betekent dit dat onze samplerate 1.000 Hz (1 kHz) zal zijn. Hoe beïnvloed dat ons geluid?
De Nyquist Shannon samplingtheorie zegt dat om een signaal op te nemen, de sample rate minstens tweemaal de frequentie dient te zijn als de frequentie die je op wilt nemen. Wat betekent dit voor onze 1 kHz sample rate? Het betekent dat de hoogst mogelijke frequentie die we op kunnen nemen, 500 Hz zou zijn - ja, zo simpel is het, of niet?
Je weet waarschijnlijk wel dat CD's opgenomen worden op een sample rate van 44,1 kHz - ja, de analoog-naar-digitaal converter meet de voltages 44.100 keer per seconde! Nogmaals, wat betekent dit voor ons geluid? Als we de Nyquist theorie toepassen betekent dit dat de hoogste frequentie die we op kunnen nemen 22.050 Hz is - ver boven de beste oren (van mensen, moet ik toevoegen!).
Waarom moeten we dan ooit hoger gaan dan 44,1 als we het extra opgenomen materiaal toch niet kunnen horen? Omdat aliasing.
Aliasing
Dus, we hebben onze samplerate ingesteld op 44,1 kHz en we zijn klaar om wat dan ook op te nemen. Dus de maximale frequentie die we kunnen gaan opnemen (ook wel bekend als de Nyquist frequntie) is 22.050 Hz. Maar, wat gebeurt er als er iets boven die frequentie in onze signal chain komt, en dan in deo pname?
Hier wordt het iets moelijker, want als dit ongeattenueerd blijft, zullen deze frequenties aliasingartifacts veroorzaken. Aliasing wordt veroorzaakt door een signaal dat over de Nyquist frequentie zit en opgenomen wordt: het wordt in feite "gespiegeld" langs de Nyquist frequentie, waardoor het een "alias" van zichzelf creëert binnen het hoorbare geluidsspectrum. Als we een voorbeeld pakken is dit iets makkelijker te begrijpen.
Onze sample rate is 10 Hz, waardoor de Nyquist frequentie 5 Hz is; dus geen audio mag hierboven gaan, anders wordt het gealiased. Een toon van 7,5 Hz wordt echter opgenomen, waardoor een alias gemaakt wordt (gespiegeld op de Nyquist frequentie) op 2,5 Hz.
Dus, nu we weten wat aliasing is, hoe voorkomen we het? Antialias filters!
Als producer heb je vast wel eens een low pass filter gebruikt; een antialias filter is niet veel anders, het haalt alle audio weg boven de Nyquist frequentie (als het een goed ontworpen antialias filter is, natuurlijk). Tegen de tijd dat de audio bij de Nyquist frequentie komt, zou de filter het voldoende geattenueerd moeten hebben zodat het niet eens opgenomen wordt.
Maar dit verklaart nog niet waarom we hoge samplerates nodig hebben. Helaas, niet alle antialiasing filters zijn zo perfect als zij zouden moeten zijn in theorie, waardoor aliasing nog steeds een probleem is. Door je audio te upsamplen naar een hogere samplerate, kun je drastisch het risico verminderen dat aliasingartifacts in je audio voorkomen, waardoor het werk van de antialias filter veel makkelijker wordt.
Bitdiepte (Bit depth)
Bit depth is voor vele een beetje een mysterie. Bit depth is in feite het aantal discrete stappen dat gesampled kan worden, ook wel bekend als quantization. Je weet hoe sample rates bepalen hoeveel samples opgenomen worden per seconde? Daar ga ik nu wel van uit. Maar dat stelt nog niet vast hoe accuraat elk van die samples is - dit wat bit depth bepaalt.
Quantizatie is de vertegenwoordiging van de amplitude van een signaal (wat in het analoge domein continu is); in tegenstelling tot sample rate. Dit gedeelte van het proces bepaalt wat elke waarde van de 44.100 samples per seconde zou moeten zijn.
8 bit audio (wordt nauwelijks meer gebruikt) is geschikt om de amplitude van een signaal te samplen met een nauwkeurigheid van 256 coderingsstappen. Dit betekent dat elke analoge signaal dat tussen deze stappen valt, vervalt of afgerond wordt naar het dichstbijzijnde figuur - wat bekend staat als quantization distortion/fout. 16 bit audio is al veel beter, aangezien het de amplitude van een signaal kan samplen tot een nauwkeurigheid van 65.536 stappen.
Bit depth bepaalt ook het maximale dynamische bereik van je opnames, waardoor de algemene regel is:
Dynamisch bereik = bit depth x 6
Dus, het dynamische bereik van een 8 bit opname ligt rond de 48 dB, en het dynamische bereik van een 16 bit opname ligt rond de 96 dB. De noise floor (laagst mogelijke waarde dat je op kunt nemen) van allebei deze depths is helaas minder dan de signaal-/ruisverhouding van vrijwel elke degelijke analoge uitrusting (de SNR van mijn E-MU geluidskaart is 120 dB). 24 bit audio geeft ons daarom een dynamisch bereik van rond de 144 dB, wat betekent dat zelfs als al je tracks piekten op -40 dB, de resolutie alsnog accurater zou zijn dan dat van een 16-bit bestand.
Comment