Psykoakustikk er læra om korleis høyrsla fungerer og korleis hjernen tolkar lydsignala som øyret fangar opp.

Øyrene fungerer som sensorar som omformar lyd til nervesignal som vert sende til hjernen, som så analyserer desse. Hjernen nyttar informasjon og lydtrykknivå, tidsvariasjon korttids frekvensanalyse osb. for å klassifisering og attkjenning ulike lydar. Forskjellen i lyden (intensitet og fase) som vert fanga opp av dei to øyrene vert nytta for å bestemma kva retning lyden kjem frå. I tillegg til signala frå øyrene nyttar hjernen òg informasjon som er lagra i hugen for å utføra ei avansert analyse av lyden, slik at det vert mogleg å kjenna att stemmen til personar ein kjenner, kompliserte musikkstykke, o.l. Høyrsla kan òg formidla informasjon om omgjevnadane, som til dømes om lyttaren er i eit stort eller eit lite rom.

Korleis lyd vert oppfatta kan varierer mykje frå person til person, både på grunn av forskjellar i øyrene og på grunn av neurologiske forskjellar. Med aukande alder vert høyrsla dårlegare, spesielt for høge frekvensar. Utforminga av øyrene fungerer som eit filter òg er med på å påverka signala som vert fanga opp av det indre øyre og senna til hjerne.

Psykoakustikk er studiet av dei audiative funksjonane og oppfatninga av lyd hjå menneske. Det er eit tverrfagleg felt, i skjeringspunktet mellom akustikk, fysiologi og psykologi. Fram til høyrslenervane spelar akustikk og fysiologi ein viktig rolle, men psykoakustikken må òg ta omsyn til korleis hjernen analyserer og tolkar signala frå øyrene. Dei nevropsykologiske funksjonane er vanskelege å måla og pysykoakustikkarar må utføra omfattande samanliknande målingar på mange personar for å studera korleis ulike lydstimuli vert oppfatta. Resultata dei kjem fram til vil vera eit gjennomsnitt av korleis dei ulike testpersonanane oppfattar lyd og einskilde personar kan oppfatta lyd på ein måte som i større eller mindre grad avvik frå gjennomsnittet. Det er òg i nokon grad mogleg å trena seg opp til å kjenna att einskilde lydar eller eigenskapar ved lyd.

Frekvensrespons og dynamikkområde

endre
 
Fig. 1 Fletcher-Munson-kurvene.

Høyrsla til eit gjennomsnittsperson dekkjer grovt sett frekvensområdet 20 Hz til 20 kHz, men det kan vera store individuelle skilnader. Den øvre grensa minkar med alderen og hjå personar som vert utsette for kraftig støy. Vaksne personar høyrer sjeldan noko særleg over 15–16 kHz. For å høyra frekvensar ned til 20 Hz krevst det høge lydtrykknivå. Frekvensar under 20 Hz vert ikkje oppfatta med øyrene, men med heile kroppen. Dei såkalla Fletcher-Munson-kurvene, Fig. 1, viser at ved 20 Hz må lydtrykknivået opp i rundt 70 dB for å vera høyrbart.

Frekvensoppløysinga til høyrsla er om lag 2 Hz i mellomtoneområdet for einskilde tonar. Men når ein lyttar til lyd som inneheld fleire tonar kan ein indirekte høyra mindre frekvensforkjellar enn dette. Eit døme på dette er at to frekvenskomponentar kan gje opphav til ein lågfrekvent interferenstone med frekvens lik forskjellen mellom dei to opphavlege frekvenskomponentane. Dette fenomenet er det same som produktmodulasjon (òg kalla hetrodyning) som vert nytta innan radiokommunikasjon.

Oppfatninga av tone er med god tilnærming logaritmisk, noko som har ført til at musikalske skalaer òg er logaritmiske. 12-tone-skalaen som vert nytta i vestleg musikk er eit døme på dette. Når ein tone vert multiplisert med om lag   (denne faktoren kan avhenga litt av steminga) ender ein opp med den neste høgare halvtonen. Om ein aukar tonen med 12 notar svarar dette til ei dobling av frekvensen (ein oktav opp). Tilsvarande, om ein reduserer tonen med 12 notar tilsvarar dette ei halvering av frekvensen (ein reduksjon med ein oktav). I lågfrekvensområdet vert halvtone, men òg 1/100 halvtone, nytta for å måla frekvensoppløysinga til høyrsla.

Fletcher-Munson-kurvene, Fig. 1, viser at høyrsla har eit dynamikkområde på rundt 120 dB. Den lågaste lydtrykket eit gjennomsnittsperson er om lag 20 μPa (2·10−5 N/m2), ved 1 kHz, men i området 2 – 5 kHz er følsamheita fleire dB betre. Den øvre grensa (smertegrensa) ligg ein plass 20 Pa (120 dB over 20 μPa), men som vist i Fig. 1 er den frekvensavhengig og ved 4 kHz ligg den rundt 110 dB. Smertegrensa er likevel ikkje så klårt definer som Fig. 1 kab gje inntrykk av, men er avhengig av for lenge det høge lydtrykket varer. Langvarig lydtrykknivå over 120 dB fører til skade på høyrsla, men lydtrykknivå frå 80 dB og oppover kan skada høyrsla om ein vert utsett for det dagleg i lang tid.

Følsamheitskurvene i Fig. 1 markerer lydtrykknivået, som funksjon av frekvens, som subjektivt vert oppfatta som like høgt som lydtrykket der kurvene passerer 1 kHz. Lydtrykket som tilsvarar ei slik kurve vert skalert i phon. Frå Fig. 1 ser vi at 60 phon svarar til eit lydtrykknivå på 60 dB ved 1 kHz (som er referansnivået), vel 80 dB ver 40 Hz, om lag 55 dB ved 3 – 4 kHz og vel 70 dB ved 20 kHz. Phon er ein subjetiv storleik som varierer frå person til person. Dei fyrste som målte og plotta slik følsamheitsforver var Fletcher og Munson ved Bell Labs[1]. Dei nytta reine sinustonar som testpersonane lytta til over høyretelefonar. Resultata viste variasjonar frå person til person, så kurvene i Fig. 1 er eit gjennomsnittet av resultata frå alle testpersonane.

I 1956 publiserte Robinson og Dadson[2] følsamheitskurver målte med lydkjelder plasserte frammon testpersonane i eit lyddaudt rom. Dei nytta òg sinustonar som testsignal. Kurvene til Robinson og Dadson vart standardiserte av ISO i 1986. I 2003 vart denne standarden revidert, etter at det vart utført fleire nøyaktige målingar[3].

Referansar

endre
  1. Fletcher og Munson, Loudness, its definition, measurement and calculation, J. Acoust. Soc. Am., Vol. 5, 1933, ss. 82-108.
  2. Robinson, D. W. og Dadson, R.S., A re-determination of the equal-loudness relations for pure tones, Br. J. Appl. Phys. Vol. 7, 1956, ss. 166-181.
  3. Acoustics -- Normal equal-loudness-level contours, ISO 226, 1986.