Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Audiosignaalinen käsittely / Kari Jyrkkä

Samankaltaiset esitykset


Esitys aiheesta: "Audiosignaalinen käsittely / Kari Jyrkkä"— Esityksen transkriptio:

1 Audiosignaalinen käsittely / Kari Jyrkkä
OSA 1 Sisältö: Johdanto (ääniteknologian osa-alueet) Ihmiskorvan toiminta ja rakenne Kuulokäyrä ja peittoilmiö Huffman ja LZW koodauksen periaate MP3 kooderin toimintaperiaate Puheenkoodausmenetelmät Puheen malli ja ennustus puheenkoodauksessa Audiosignaalinen käsittely / Kari Jyrkkä

2 Audiosignaalinen käsittely / Kari Jyrkkä
Johdanto Ääniteknologian osa-alueet Laaja-alainen alue tämäkin... Alan tutkimusta Audiosignaalinen käsittely / Kari Jyrkkä

3 Audiosignaalinen käsittely / Kari Jyrkkä
Johdanto Merkittävät audiosignaalinkäsittelyn alueet High fidelity music reproduction Voice telecommunications Speech synthesis / recognition Kaikkien edellisten ”tuomarina” toimii ihmiskorva. Audiosignaalinen käsittely / Kari Jyrkkä

4 Audiosignaalinen käsittely / Kari Jyrkkä
Johdanto The Scientist and Engineer's Guide to Digital Signal Processing, copyright © by Steven W. Smith. For more information visit the book's website at: Tympanic membrane = tärykalvo Middle ear bones (hammer,anvil,stirrup) = Keskikorvan luut (vasara,alasin,jalustin) Cochlea = simpukka Audiosignaalinen käsittely / Kari Jyrkkä

5 Audiosignaalinen käsittely / Kari Jyrkkä
Johdanto The Scientist and Engineer's Guide to Digital Signal Processing, copyright © by Steven W. Smith. For more information visit the book's website at: Audiosignaalinen käsittely / Kari Jyrkkä

6 Audiosignaalinen käsittely / Kari Jyrkkä
Johdanto Kotitehtävät Onko ihmiskorva herkkä äänisignaalin voimakkuuden vai vaiheen vaihtelulle? Selvitä, mitä seuraavat termit tarkoittavat Loudness Pitch Timbre Mihin korvan simpukan taajuusselektiivisyys perustuu? korvanrakenne Korvan toiminta Taajuuksien erottelu Ihmisen korva on herkkä vain äänisignaalin amplitudin eli voimakkuuden vaihteluille. Äänisignaalin vaihella ei ole merkitystä. Loudness = Kuuluvuus, äänekkyys. Ääniaallon intensiteetin mitta. Usein äänen intensiteettiarvo kerrotaan logaritmisella asteikolla, decibel SPL (Sound Power Level) Pitch = Äänen perustaajuus. Eli millä taajuudella puhujan äänihuulet värähtelevät. Timbre = Äänen sointu, äänenväri Korvan toiminta: Ääni etenee ilmanpaineen vaihteluina. Korvanlehti kokoaa äänivärähtelyn ja keskittää ne korvakäytävään. Korvakäytävää pitkin ääni siirtyy keskikorvaan, jossa sijaitsevat tärykalvo ja täryontelo. Täryontelossa olevat kuuloluut siirtävät äänen soikean ikkunan kautta sisäkorvassa olevaan simpukkaan. Simpukassa sijaitsee korvan varsinainen kuuloaistilein eli Cortin elin, jossa on yli aistinsolua. Soluissa on tuntokarvoja, jotka värähtelevät paineaaltojen mukaan ja karvojen värähtrly muuttuu näin sähköärsykkeiksi, jotka siirtyvät keskushermostoa pitkin aivojen kuulokeskukseen. Audiosignaalinen käsittely / Kari Jyrkkä

7 Ihmisen kuulon ominaisuuksia
Johdanto Ihmisen kuulon ominaisuuksia Kuulon dynaaminen alue on noin 120 dB Ihminen tunnistaa noin 1dB äänenvoimakkuuden muutoksen. Äänen tehon kasvattaminen 10 kertaiseksi kuulostaa 2 kertaa kovemmalta ääneltä. Kuulo on herkimmillään 1-4 kHz taajuisille äänille. Kuuloaisti osaa mitata äänen suunnan. Kuuloaisti ei osaa arvioida hyvin etäisyyttä. Tehtäviä: Kuinka paljon äänen amplitudi muuttuu, jos voimakkuus muuttuu 1 dB? Jos huoneen äänieristystä parannetaan niin paljon, että melun teho pienenee huoneessa tuhannes osaan, niin kuinka hyvältä parannukselta se kuulostaa ihmisestä? Tutkitaan Matlabin avulla, kuinka vaiheen muutos vaikuttaa kuuloon. Audiosignaalinen käsittely / Kari Jyrkkä

8 Audiosignaalinen käsittely / Kari Jyrkkä
Johdanto Kuulokäyrä Tehtäviä: Laske kuinka paljon suurempi äänenpaine tarvitaan Hz taajuiselle äänelle verrattuna 6000 Hz taajuiseen ääneen. Pohtikaa, miten kuulokäyrän muotoa voidaan käyttää hyödyksi puheen/audion koodauksessa? Nolla decibeliä määritellään intensiteetiksi (sound pressure level) W/m2 . Äänenpaineen arvo esimerkiksi 40 dB kohdalla voidaan laskea kaavasta 10log10(x / W/m2 ) = 40 dB. Kuulokäyrän alapuolelle jääviä äänenpainearvoja ei kuulla. Audiosignaalinen käsittely / Kari Jyrkkä

9 Audiosignaalinen käsittely / Kari Jyrkkä
Johdanto Peittoilmiö Maskikuvio Kuulokynnys muutuu siten, että korva ei kuule maskisignaalin viereisiä taajuuksia yhtä herkästi kuin ilman maskisignaalia. Maskikuvion muoto riippuu maskisignaalin tyypistä. Kohina- ja laajakaistaiset signaalit peittävät tehokkaammin kuin säännölliset äänet. Ei samanaikainen = maskisignaali poistuu, mutta korva ei hetkeen kuule maskisignaalin viereisiä taajuuksia yhtä herkästi kuin ennen. Samanaikainen Ei samanaikainen Audiosignaalinen käsittely / Kari Jyrkkä

10 6.2 Peittoilmiön käyttö audion koodauksessa
Johdanto 6.2 Peittoilmiön käyttö audion koodauksessa Johdatus signaalinkäsittelyyn, luentomateriaalimoniste 2, kappale 6.2 Suodinpankki, jolla 32 kHz taajuudella näytteistetty signaali suodatetaan ja suodatustulos laskostetaan 500 Hz (16000/32) levyisiksi taajuuskaistoiksi. Suodatettu 32kHz signaali desimoidaan 32:lla = > jolloin näytetaajuus kunkin alikaistan kohdalla on enää 1000 Hz (mutta sehän riittää 500 Hz signaalille). 1kHz alikaistasignaalien näytteet kvantisoidaan peittoilmiön mukaisesti (= vähemmän bittejä näytteille, joita ei kuitenkaan kuulokynnyksen takia kuulla). Lopuksi kvantisoitu signaali voidaan koostaa interpoloimalla ja suodattamalla kaistanpäästösuodattimella interpoloinnissa syntyvät kopiot pois. Audiosignaalinen käsittely / Kari Jyrkkä

11 Audiosignaalinen käsittely / Kari Jyrkkä
Johdanto Miten tämä toimikaan? Suodinpankki, jolla 32 kHz taajuudella näytteistetty signaali suodatetaan ja suodatustulos laskostetaan 500 Hz (16000/32) levyisiksi taajuuskaistoiksi. Suodatettu 32kHz signaali desimoidaan 32:lla = > jolloin näytetaajuus kunkin alikaistan kohdalla on enää 1000 Hz (mutta sehän riittää 500 Hz signaalille). 1kHz alikaistasignaalien näytteet kvantisoidaan peittoilmiön mukaisesti (= vähemmän bittejä näytteille, joita ei kuitenkaan kuulokynnyksen takia kuulla). Lopuksi kvantisoitu signaali voidaan koostaa interpoloimalla ja suodattamalla kaistanpäästösuodattimella interpoloinnissa syntyvät kopiot pois. Audiosignaalinen käsittely / Kari Jyrkkä

12 Audiosignaalinen käsittely / Kari Jyrkkä
Tehtävä Lue materiaali MP3 audiopakkauksesta ja vastaa seuraaviin kysymyksiin Mikä vaikuttaa (yleisesti) pakkausalgoritmin tehokkuuteen? LZW algoritmin toimintaperiaate? Mitä ovat MPEG-1 audiolayer I,II ja III? Mikä on niiden pakkaussuhde? Miten MP3 kooderi on määritelty speksissä? Mikä on psykoakustinen malli? Kuinka moneen taajuuskaistaan MP3 algoritmissa äänisignaali jaetaan? Kuinka pitkiä äänilohkoja kompressoidaan kerralla? Mikä on ratkaiseva osa MP3 kooderissa koodatun äänen laadun kannalta? Mihin MP3 kooderi käyttää Huffman koodausta? Mistä ns. ”ennakkokohina” johtuu? Audiosignaalinen käsittely / Kari Jyrkkä

13 Audiosignaalinen käsittely / Kari Jyrkkä
LZW algoritmi The code that the LZW algorithm outputs can be of any arbitrary length, but it must have more bits in it than a single character. The first 256 codes (when using eight bit characters) are by default assigned to the standard character set. The remaining codes are assigned to strings as the algorithm proceeds. The sample program runs as shown with 12 bit codes. This means codes refer to individual bytes, while codes refer to substrings. Audiosignaalinen käsittely / Kari Jyrkkä

14 Audiosignaalinen käsittely / Kari Jyrkkä
Kompressointi Miten tämä toimikaan? Audiosignaalinen käsittely / Kari Jyrkkä

15 Audiosignaalinen käsittely / Kari Jyrkkä
MP3 kooderi / dekooderi Audiosignaalinen käsittely / Kari Jyrkkä

16 Audiosignaalinen käsittely / Kari Jyrkkä
Huffman koodaus Tehtävä: Oletetaan, että MP3 algoritmin alikanavien näytteistä tulee kvantisoinnin jälkeen seuraavanlaisia bittikuvioita: 011 todennäköisyydellä 0.05 Suunnittele Huffman koodi ja arvioi sen kompressointikykyä. Audiosignaalinen käsittely / Kari Jyrkkä

17 Audiosignaalinen käsittely / Kari Jyrkkä
Tehtäviä Tehtävä: Laske montako bittiä tarvitaan, jotta kvantisointikohina ei kuuluisi kompressoidusta audiosignaalista, kun Signaali/maskisuhde = 20 dB Signaali/maskisuhde = 0 dB Signaali/maskisuhde = -20 dB Audiosignaalinen käsittely / Kari Jyrkkä

18 Audiosignaalinen käsittely / Kari Jyrkkä
Laatu vs. bittinopeus Audiosignaalinen käsittely / Kari Jyrkkä

19 Audiosignaalinen käsittely / Kari Jyrkkä
Laatu vs. bittinopeus Eight to Fourteen modulation Error concealment = 1) bit corrections 2) sample interpolation 3) mute Interpolointi / suodatus ennen digitaali/analogia muunnosta. Tehtävä: Laske/arvioi kuinka nopea signaaliprosessori tarvitaan digitaaliosien prosessointiin. Tehtävä: Mitä Dolby stereo & Dolby Surround Pro Logic äänellä tarkoitetaan? Audiosignaalinen käsittely / Kari Jyrkkä

20 Puheenkoodaus menetelmät
Aaltomuodon koodaus PCM ITU G.711 Differentiaalinen modulaatio Adaptiivinen kvantisointi Demo Lähteenkoodaus (vokooderit) materiaalia Audiosignaalinen käsittely / Kari Jyrkkä

21 Audiosignaalinen käsittely / Kari Jyrkkä
Companding Ajetaan analoginen signaali ennen A/D muunnosta epälineaarisen muunnoksen läpi ja näytteistetään signaali vasta sitten. Käytetään A/D muunninta, joka muuntaa epälineaarisilla väleillä Käyetään 12-bitin muunninta ja muutetaan taulukon avulla 8 bittisiksi. Audiosignaalinen käsittely / Kari Jyrkkä

22 Audiosignaalinen käsittely / Kari Jyrkkä
Companding Tehtävä Oletetaan, että kompressoitavan signaalin vaihteluväli on [-4.096V,+4,096V]. Käytä G.711 speksin taulukkoa 1a muuntamaan seuraavat signaaliarvot digitaalisiksi kompressoiduiksi arvoiksi 0.001 V 0.002 V 1.025 V 1.035 V 1.090 V Audiosignaalinen käsittely / Kari Jyrkkä

23 Audiosignaalinen käsittely / Kari Jyrkkä
Tehtävä Lue materiaali puheenkoodauksen toimintaperiaatteesta ja vastaa seuraaviin kysymyksiin: Selvitä seuraavien aaltomuotokoodaustapojen periaate Differentiaalinen koodaus Adaptiivinen kvantisointi Deltamodulaatio Alikaistakoodaus Selvitä seuraavien lähteenkoodausmenetelmien periaate Lineaariprediktio Kanvavokooderi Formanttivokooderi Selvitä MOS ja DMOS arvojen merkitys Piirrä lineaaripreditioon perustuvan kooderin lohkokaavio kaavojen (2.1) ja (2.2) perusteella Audiosignaalinen käsittely / Kari Jyrkkä

24 Audiosignaalinen käsittely / Kari Jyrkkä
Puheen malli Mallin parametri Soinnillinen (vokaalit, pulssigeneraattori lähde) vai soinniton (konsonantit, kohinageneraattori lähde) äänne. Äänenkorkeus (pitch) Suodattimen kertoimet, joilla matkitaan äänenpolun (vocal tract) vastetta. Audiosignaalinen käsittely / Kari Jyrkkä


Lataa ppt "Audiosignaalinen käsittely / Kari Jyrkkä"

Samankaltaiset esitykset


Iklan oleh Google