LPC LPCC PLP MFCC LSP/LSF Δ ΔΔ Matemaattinen kikka Levinson-Durbin

Slides:



Advertisements
Samankaltaiset esitykset
Yleistä Läsnäolovelvollisuus Poissaolojen selvitys Käyttäytyminen
Advertisements

Viime kerralta: Puheentuotto (vokaalit)
LPC LPCC PLP LSP/LSF Matemaattinen kikka Levinson-Durbin algoritmi
Luku 1. Siirtotekniikan käsitteitä – Taajuus
MAB8: Matemaattisia malleja III
M-ary Frequency Shift Keying Timo Mynttinen1 M-ary Frequency Shift Keying •M-ary FSK on suuren mielenkiinnon kohteena verrattuna binaariseen FSK:hon. •Parempi.
DEE Sähkökäyttöjen ohjaustekniikka
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä 10 – Juho Kokkala Optimointiopin seminaari - Syksy 2010 Kernel-tasoitus.
Estimointi Laajennettu Kalman-suodin
Tiedonsiirronperusteet
Tavoite Oppia seuraavat asiat •Yksikkö Beli, desibeli •Analoginen signaali •Digitaalinen signaali •Diskreettiaikainen signaali.
Luku 2 – Tietoliikenteen tekniikka
Sensorifuusio Jorma Selkäinaho.
Kuvan pakkaaminentMyn1 Kuvan pakkaaminen •Bittikarttakuva muodostuu kuvapisteistä, ja jokaisessa kuvassa on tietty määrä kuvapisteitä pysty- ja vaakasuunnassa.
Langattomien laitteiden matematiikka 1
Derivaatta MA 07 Derivaatta tarkoittaa geometrisesti käyrälle piirretyn tangentin kulmakerrointa.
Puhesignaalin analysointi = akustinen fonetiikka
SGN-4010 PUHEENKÄSITTELYN MENETELMÄT Luento 4
KANTATAAJUINEN BINÄÄRINEN SIIRTOJÄRJESTELMÄ AWGN-KANAVASSA
AS Automaation signaalinkäsittelymenetelmät
Valitse seuraaviin vaihtoehtotehtäviin oikea vastaus…
Taylor polynomi usean muuttujan funktiolle
KANNANVAIHTO?.
Kertausta: lähde-suodin –malli
TMA.003 / L3 ( )1 3. Funktioista 3.1. Kuvaus ja funktio Olkoon A ja B ei-tyhjiä joukkoja. Tulojoukon A  B = {(x,y) | x  A, y  B} osajoukko on.
2. Vuokaaviot.
Lähettimet ja vastaanottimet
TIEP114 Tietokoneen rakenne ja arkkitehtuuri, 3 op ALU.
Kinematiikka Newtonin lait: Voima Statiikka Mikko Rahikka 2000
Homogeeninen kemiallinen tasapaino
Murtoyhtälöt - Yhtälö, jossa nimittäjässä tuntematon
Algoritmi-harjoituksia…
Mittaustekniikka 26 AD-muuntimia Liukuhihna – Pipeline Muunnos tehdään useassa peräkkäisessä pipeline- asteessa, joissa kussakin ratkaistaan joukko bittejä.
Langattomien laitteiden matematiikka 1
Vaihemodulaatio Vaihemodulaatio ja taajuusmodulaatio muistuttavat suuresti toisiaan. Jos moduloidaan kantoaallon vaihekulmaa, niin samalla tullaan moduloiduksi.
Ääni ja kuuleminen Kuuloaisti toimii ihmisellä jo sikiövaiheessa.
Vektorin komponentit 2 vektoria määrittävää tason, kun E.1.
T Elektroniikan mittaukset: LAB 3 johdanto
PARAABELI (2. ASTEEN FUNKTION KUVAAJIA)
Muuttujien riippuvuus
5. Lineaarinen optimointi
2.2.2 Avaruuden vektori koordinaatistossa
Kymmenkantainen logaritmi
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmöijän nimi Systeemitieteiden kandidaattiseminaari – Syksy/Kevät 200X Informaation leviäminen.
5. Fourier’n sarjat T
PDF –dokumentit Adobe Acrobatilla Taina Joutsenvirta Valtiotieteellinen tiedekunta
Luonnollisen logaritmifunktion derivaatta
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä 22 – Jussi Kangaspunta Optimointiopin seminaari - Syksy 2010 Ohjaamaton.
ÄÄNI.
Kompleksisuus Yleistä.
TANGENTTI Suora, joka sivuaa käyrää.
5. Datan käsittely – lyhyt katsaus Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman.
Mitä osattava (minimivaatimus)?. Yhtälöiden ja epäyhtälöiden ratkaiseminen –Huom! Määrittelyehdot Peruslaskutoimitukset –polynomien erityisesti binomin.
Osa 5. Joustoista Kysynnän hintajousto (price elasticity of demand) mittaa, miten kysynnän määrä reagoi hinnan muutokseen = kysytyn määrän suhteellinen.
Excel kaikille lyhyesti ja helposti Kaaviot Kakkospainikkeen pikavalikko on tehokas työväline.
Audiosignaalinen käsittely / Kari Jyrkkä1 Sisältö: –Lineaariprediktioon perustuvan puheenkooderin ja dekooderin toteutus projektityönä Puhesignaalin.
Arviointi Arviointiasteikko ja -merkinnät Tutkinnon osan arviointi
Case: Kansallinen tulorekisteri
Mitkä asiat vaikuttavat heilurin taajuuteen?
Mitkä asiat vaikuttavat heilurin taajuuteen?
Signaalinkäsittelymenetelmät / Kari Jyrkkä
Määritä äänen taajuus Kiinnitä mikrofoni statiiviin ja johdot tietokoneeseen Käynnistä mittaus ja lyö äänirautaan. Määritä kuvaajasta äänen taajuus.
Alkoholijuomien matkustajatuonti yhteensä ja juomaryhmittäin 5/2004 ─ 4/
Muuttujamuunnoksista
1.4.2 Vektorien määräämä avaruus
Spektri- ja signaalianalysaattorit
Signaalien datamuunnokset
Signaalit ja järjestelmät aika- ja taajuusalueissa
LUKU 1 TIETOLIIKENNEJÄRJESTELMIEN ANALYYSI
Ylinäytteistetyt A/D-muuntimet
Esityksen transkriptio:

LPC LPCC PLP MFCC LSP/LSF Δ ΔΔ Matemaattinen kikka Levinson-Durbin Puhesignaali Levinson-Durbin algoritmi Kepstri-analyysi Rekursiivinen laskenta LP-analyysi LPC LPCC Fourieranalyysi Kuulonmukainen spektrin muokkaus 1 Käänteinen Fourier-muunnos PLP Spektrin muokkaus 2 MFCC Δ CC ΔΔ

Mel-Frequency Cepstral Coefficients Usually Hanning Padded with zeros to next power of 2

MFCC:t lasketaan (yleensä) seuraavasti: Laske ikkunoidun puhekehyksen tehospektri Fourier-muunnoksen avulla. Laske tehospektristä Mel-asteikon mukaisten kolmiosuotimien/ikkunoiden ‘tehosummat’. Ota kustakin ‘tehosummasta’ logaritmi – useimmiten 10-kantainen. Laske logaritmiselle tehosummavektorille kosinimuunnos. MFCC:t ovat kosinimuunnoksen painokertoimia. Kepstrin keskiarvon vähennys (CMS): Vähennä kustakin MFC-kertoimesta pidemmän ajan keskiarvo, jotta häiriöäänten vaikutus vähenisi.

Mel - taajuusasteikko 1 Mel yksikkö on määritelty yhdeksi tuhannesosaksi 1000 Hz:n taajuisen äänen subjektiivisesta äänenkorkeudesta. eli 1000 Hz = 1000 Mel

’Mel-tehosummat’ Kunkin Mel-asteikon mukaisen kolmiosuotimen/ikkunan määrittämät ’tehosummat’ lasketaan seuraavan lausekkeen mukaisesti: jossa: e[j][t] on tehosumma puhekehyksen t j :nnen Mel-suotimen ulostulosta. N on tehospektrin taajuuspisteiden lukumäärä Hj[k] on Mel-suodin/ikkuna St[k] on puhekehyksen DFT. P on Mel-suodinten lukumäärä

Kosini-muunnos kosinimuunnoksen kantavektorit Logaritmiset tehosummat esitetään kosinimuunnoksen kantavektoreiden painotettuna summana. Summa on äärellinen 0…P-1, koska tehospektri on diskreetti, eli vain äärellinen määrä ’taajuus-tehoja’ on määritelty.

Kepstrin keskiarvon vähennys MFCC-vektorin kustakin elementistä vähennetään kyseisen elementin keskiarvo, joka on laskettu joko opetusdatan perusteella tai se lasketaan dynaamisesti taustamelun muuttuessa.

LSP / LSF LP-kertoimet ovat hyvin herkkiä kvantisoinnille: kerrointen kvantisoinnista johtuen suotimesta tulee hyvin helposti epästabiili. LP-kertoimet sopivat myös hyvin huonosti interpoloitaviksi puhekehysten keskikohtien välillä, koska ne eivät edusta mitään fyysistä asiaa. LP-kertoimet muutetaan usein puheenkoodauksessa ja puhesynteesissä ns. Line Spectral Pairs (LSP) / Line Spectral Frequencies (LSF) muotoon. Näitä ei pidä sekoittaa parametrisen spektrianalyysin LSF-taajuuksiin! LSP/LSF:lle pieni kvantisointi ei tee suurta muutosta. LSP/LSF:ä voidaan interpoloida puhesynteesissä siten, että saadaan jatkuva LSP/LSPF-käyrä.

LSP/LSF:n laskenta LSP/LSF:t lasketaan LP-kertoimista matemaattisen kikan avulla. Ne sisältävät täsmälleen saman informaation kuin LP-kertoimetkin. Kun LP-polynomi on muotoa: Muodostetaan sen avulla polynomit: Näiden polynomien nollakohdat ovat kompleksitason yksikköympyrällä. Etsitään nollakohdat ja muutetaan niiden kulmat taajuuksiksi: