SGN-4010 PUHEENKÄSITTELYN MENETELMÄT Luento

Slides:



Advertisements
Samankaltaiset esitykset
Viime kerralta: Puheentuotto (vokaalit)
Advertisements

Kokeen laatiminen ja arviointi Tiia Karpin
LPC LPCC PLP LSP/LSF Matemaattinen kikka Levinson-Durbin algoritmi
Luku 1. Siirtotekniikan käsitteitä – Taajuus
Pääkaupunkiseudun 8. luokkien palvelukyky Espoo, Tapiolan koulu Joulukuu 2013.
1 EU:n tuki ystävyyskuntatoiminnalle 2006 ehdotuspyyntö ja tulevaisuuden perspektiivit Helsinki, Risto Raivio johtava hallintovirkamies.
XX RESPONSE KEHITTÄMISKUMPPANUUS RESPONSE-KEHITTÄMISKUMPPANUUS
Intelligent Gaze-Added Interfaces by Salvucci & Anderson Anssi Kainulainen Tampere University Computer Human Interaction Group.
LPC LPCC PLP MFCC LSP/LSF Δ ΔΔ Matemaattinen kikka Levinson-Durbin
Nopeus s t v nopeus = matka: aika v = s :t
LAADUKKAAT PALVELUT LAADUKKAILLA HANKINNOILLA PALVELUJEN PAKETOINTI – SEMINAARI
W w w. h a m k. f i Wiki koulutus Leenakaija Lehto
3.45 3.40.
Langattomien laitteiden matematiikka 1
Perusopetuksen huoltajat 2014 Generated on :04.
Brade & Vilpponen 1 ITP2TM003 Java-ohjelmointi I Kevät op.
KE Teknillisen kemian seminaarikurssi. Seminaariesitykset Ti klo 9-10 Ohjeita esim. –J. W. Niemantsverdriet: How to give successful oral.
Tietokannat II Lasse Bergroth Turun yliopisto, IT-laitos Kevät 2013
Elinkeinopoliittinen mittaristo 2014 Pelkosenniemi 1.
Vakuutusmaksutulo yhteensä 9,1 mrd € Työeläkevakuutusyhtiöiden markkinaosuudet 2007.
1 Senioreiden säästäminen ja maksutavat 2014 SENIOREIDEN SÄÄSTÄMINEN JA MAKSUTAVAT
TMA.003 / L3 ( )1 3. Funktioista 3.1. Kuvaus ja funktio Olkoon A ja B ei-tyhjiä joukkoja. Tulojoukon A  B = {(x,y) | x  A, y  B} osajoukko on.
Elinkeinopoliittinen mittaristo 2014
Mittaustekniikka (3 op)
Yrittäjien äänestyskäyttäytyminen 50,7 57,6 55,0 23,4 20,3 21,9 11,4 9,3 8,0 5,2 5,5 6,9 4,2 4,5 3,6 0,7 1,7 1,3 1,7 0,0 0,0 0,7 0,0 0,0 2,7 1,0 3,3.
Ohjelmistotekniikka - Tenttiin valmistautumisesta Kevät 2003 Hanna-Kaisa Lammi LTY/Tite.
2. Vuokaaviot.
Tilastollisen tutkimuksen perusteet - 6 op
Opetussuunnitelma, koulun kehittäminen ja arviointi 5op
UMF I Luento 2. Aika Luennot, Klo 14–16 to 4.9 – ke 10.9 ke 24.9 – ke 1.10 ke – pe Demot, Klo 10–12/12–14/14–16 Pe 12.9, Ti 16.9, Pe 19.9.
UMF I Luento 1. Aika Luennot, Klo 14–16 to 4.9 – ke 10.9 ke 24.9 – ke 1.10 ke – pe Demot, Klo 10–12/12–14/14–16 Pe 12.9, Ti 16.9, Pe 19.9.
Syntaksin harjoituskurssi CYK140 Syksy 2007, 2. periodi Luennot ja kurssin suorittaminen Anu Airola Yleisen kielitieteen laitos.
Internet-projekti - MUM2TM Heikki Hietala Jukka Mutikainen TIKO – Malmi
Seinäjoki kisa A Tuomari: Tytti Lintenhofer ALO 12kyl, 4pys Kyl:
Maatalous, maaseutuyrittäminen rahavirrat 2008 ja 2007 Pohjois-Savo Jari Kauhanen MTK- Pohjois-Savo.
KVV-maisteriohjelman HOPS-työskentely Miksi? Miten? Kuinka monelle?
Polun pyöreä pöytä Eero Tuomenoksa Polku Eero Tuomenoksa Ohjelma 18:00 Polun tämän hetken tilanteen esittely 18:50 Polun kehityssuunnat.
Rahoitusmarkkinat ja sijoitustoiminta
Maitotaito PIENEN VAUVAN PÄIVÄ Maitotaito.
SEIRI-ajankäytätön apuväline
Visual Basic –ohjelmointi ITP2TM002
Viikko 12 (19. – ) 7.LK TET-VIIKKO Maanantai: (19.3.) -9.LK tukarit: Suunnittelupalaveri klo Tiistai: (20.3.) -6A ja 9D: Ympäristömessut.
FSD:n seminaari Tutkimusmenetelmien oppimateriaalit ja verkko-opetus Tampere Tapani Alkula, HY Esimerkkinä on Helsingin yliopiston sosiologian.
Analyysi II Katsaus.
Arvostelu Teppo Räisänen, Principal Lecturer Oulu University of Applied Sciences, School of Business and Information Management
Digitaalinen signaalin käsittely, 2 ov
Mistä voit anoa hyväksilukuja? muissa oppilaitoksissa suoritettuja kursseja aktiivinen koulun ulkopuolinen toiminta: esim. järjestö-, kulttuuri-, ohjattu.
University of Joensuu Dept. of Computer Science P.O. Box 111 FIN Joensuu Tel fax Tietojenkäsittelytieteen.
Porin Yksikkö/Elektroniikkatuotanto 1 Tanja Jokinen ELEP-1110 SÄHKÖ- JA PIIRITEKNIIKAN PERUSTEET 4 Op Syksy 2005 www-sivut:
ELEP-1110 SÄHKÖ- JA PIIRITEKNIIKAN PERUSTEET
Heuristinen arviointi Käyttöliittymäseminaari Jere Salonen.
Suomen Lääkäriliitto | Finnish Medical AssociationLääkärit Suomessa | Physicians in Finland Tilastotietoja lääkäreistä ja terveydenhuollosta 2014 Statistics.
Kohti viittä konseptia
A! Aalto University 1 Case SÄHKE-asiakirjojen automaattinen luokittaminen asiakirjojen tekstin pohjalta Katariina Nyberg Semantic Computing Research Group.
Liike Nopeus ja kiihtyvyys.
University of Joensuu Dept. of Computer Science P.O. Box 111 FIN Joensuu Tel fax Tietojenkäsittelytieteen.
Porin Yksikkö / Elektroniikkatuotanto Tanja Jokinen 1ELEP-1210 Elektroniikan peruskurssi ELEP-1210 ELEKTRONIIKAN PERUSKURSSI 5 op Kevät 2006.
Fonetiikan opiskelijainfo
ELEP-1110 SÄHKÖ- JA PIIRITEKNIIKAN PERUSTEET
Porin Yksikkö / Elektroniikka Tanja Jokinen 1ELEP-1210 Elektroniikan peruskurssi ELEP-1210 ELEKTRONIIKAN PERUSKURSSI 5 op Kevät 2007 www-sivut:
Porin Yksikkö / Elektroniikka Tanja Jokinen 1ELEP-1210 Elektroniikan peruskurssi ELEP-1210 ELEKTRONIIKAN PERUSKURSSI 5 op Kevät 2009 www-sivut:
1 Tanja Jokinen ELEP-1110 SÄHKÖ- JA PIIRITEKNIIKAN PERUSTEET 4 Op Syksy 2007 www-sivut:
Audiosignaalinen käsittely / Kari Jyrkkä1 Sisältö: –Lineaariprediktioon perustuvan puheenkooderin ja dekooderin toteutus projektityönä Puhesignaalin.
T Audiosignaalien käsittely, 3 op
T Signaalinkäsittelymenetelmät, 5 op
University Exam at 2.30 – 5.30 p.M. L1
Englannin valinnainen lisäkurssi
Signaalinkäsittelymenetelmät / Kari Jyrkkä
University Exam at 2.30 – 5.30 p.M. L1
PUHETEKNOLOGIA RIKOSTEN TUTKINNASSA
Esityksen transkriptio:

SGN-4010 PUHEENKÄSITTELYN MENETELMÄT Luento 1 18.1.2012 TTY/Signaalinkäsittelyn laitos Katariina Mahkonen

Kurssin sisältö? Miksi olet täällä? Mitä haluat oppia tällä kurssilla? Name/Title of the presentation to be changed on the master page 5.12.2007

Kurssijärjestelyt (2) Materiaali: Pääasiallisena materiaalina luentomoniste Osalla luentokerroista luentokalvot (Lisälukemista kaipaaville: kurssikirja T.F. Quatieri, Discrete-Time Speech Signal Processing: Principles and Practice, Prentice Hall PTR, 2002) Harjoitustehtävät (5 tehtävää / harjoituskerta) Tentissä pärjää osaamalla luentojen, harjoitusten, prujun ja kalvojen asiat Tähän toteutuskertaan liittyvät 3 tenttiä: 5.3.2012, 6.4.2012 ja viimeisen ajankohta on vielä avoin, mutta ilmestyy kyllä POP:iin aikanaan.

Harjoitusryhmät Ryhmät: Harjoitusryhmiin ei tarvitse ilmoittautua Pe 10-12, TC303 Pe 12-14, TC303 Harjoitusryhmiin ei tarvitse ilmoittautua

Harjoituskäytäntö Harjoituksia 5 x 2h = 10h (alkavat viikolla 50) Pisteitä jaossa kullakin kerralla 5p (eli yhteensä 25 p) Hyväksyttyyn tenttiin saa lisäpisteitä seuraavasti: 10 harjoituspistettä tai enemmän (40 %) => 1 piste 15 harjoituspistettä tai enemmän (60 %) => 2 pistettä 20 harjoituspistettä tai enemmän (80 %) => 3 pistettä l. arvosanan korotus Tehtäviä ei tarvitse ratkaista etukäteen, mutta on suositeltavaa tutustua tehtäviin ja käsiteltäviin aiheisiin ennen harjoituksiin tuloa.

Kurssi on aiempina toteutuskertoina sisältänyt: Jotakin ihmisen puheentuottoelimistöstä Artikulatorista fonetiikkaa eli äänteiden luokittelua Vähän fyysisestä puheentuoton mallintamisesta: suoran putken akustiikkaa Akustisten piirteiden signaalinkäsittelyllisiä määritysmenetelmiä: Lineaariprediktio, Autokorrelaatiomenetelmä Yleiskatsaus puhesynteesiin Name/Title of the presentation to be changed on the master page 5.12.2007

Matemaattisia esitietoja Osaatko vastata seuraaviin kysymyksiin? Mikä on suodattimen impulssivaste/taajuusvaste? Miten signaaleiden konvoluutio lasketaan? Mitä eroa on FIR- ja IIR-suodattimilla? Miten FFT lasketaan? Entä z-muunnos? Mitä ovat suodattimen nollat ja navat? Asioita voi kerrata esim. kurssin SGN-1200 prujusta

Mitä puheenkäsittely on? Tarkoittaa (loogisesti) puhesignaalin käsittelyä Sovelluksia: Koodaus (esim. matkapuhelimet) Tunnistus (puheesta tekstiksi) Synteesi (tekstistä puheeksi) Ehostus (laadun parannus) Muokkaus (muokataan äänestä toisenlainen) Puhujantunnistus (kuka puhuu) Käytetään signaalinkäsittelyn menetelmiä Fourier-muunnos, ikkunointi, autokorrelaatio,... Myös erityisesti puheelle soveltuvia menetelmiä LPC-analyysi, Markovin piilomallit, pitch-synchronous overlap-add,...

Puhesignaalinkäsittely on esimerkiksi: koodausta (esim. matkapuhelimet) laadun parantamista: ymmärrettävyys, häiriöiden poisto muokkausta (tehdään äänestä toisenlainen) syntetisointia (tekstistä puheeksi) puhujan tunnistusta (kuka puhuu) kielellisen sisällön tunnistus eli puheentunnistus (puheesta tekstiksi) Name/Title of the presentation to be changed on the master page 5.12.2007

Puheenkoodaus Digitaalisen puheen ‘pakkaaminen’ siirtoa tai tallennusta varten (esim. matkapuhelimissa), kaupallisesti tärkein puheenkäsittelyn sovellus Tavoitteet: Hyvä subjektiivinen laatu Pieni määrä bittejä Pieni viive Nopea laskenta Virhesietoinen Kestää useamman peräkkäisen koodauksen GSM-verkossa käytössä AMR (adaptive multirate)-puhekoodekki Bittinopeudet 4.75...12.2 kbps Käsitellään kurssilla SGN-4050 Puheenkoodaus

Laadun parannus Mitä on puheen laatu? -subjektiivista SNR (Signal to Noise Ratio) on melko huono mittari. Esimerkki: ABE – (Lähde: Juho Kontio, diplomityö, TKK 2004) Name/Title of the presentation to be changed on the master page 5.12.2007

Muokkaus Imitointi voice conversion Name/Title of the presentation to be changed on the master page 5.12.2007

Puhesynteesi Tekstistä puheeksi Tarvitaan tietoa puheesta ja kielestä Stephen Hawkins using TTS Puhesynteesi Tekstistä puheeksi Tarvitaan tietoa puheesta ja kielestä Useita eri lohkoja Tekstianalyysi: syntaktinen analyysi (subjekti, predikaatti yms.), numeroiden ja lyhenteiden laajennus Foneettinen analyysi: tekstistä foneemeiksi (ääntämyksen mukaiseen muotoon) Prosodia: painot, äänteiden kesto, f0:n generointi Synteesi: puhesignaalin generointi edellä olevan avulla Eri synteesimenetelmiä: Sääntöpohjainen synteesi (formanttisynteesi) Konkatenatiivinen synteesi (difonisynteesi, unit selection –synteesi) ’Tilastollinen parametrinen’ synteesi (HMM-pohjainen) Artikulatorinen synteesi

Puhujantunnistus Name/Title of the presentation to be changed on the master page 5.12.2007

Puheentunnistus Puheesta tekstiksi Pitkät perinteet mutta vieläkin osin ratkaisematon ongelma Perustuu todennäköisyyslaskentaan Millä todennäköisyydella = “a”? Myös kieli mallinnetaan tilastollisesti P(”melko todennäköinen lause”)? Nämä todennäköisyydet yhdistetään Käsitellään kursseilla SGN-4106 Speech Recognition ja SGN-4507 Speech Recognition Laboratory

Puheen tuottaminen ja sen mallintaminen Quatieri: Discrete –Time Speech Signal Processing Principles and Practice

Puheen tuottaminen ja sen mallintaminen Quatieri: Discrete –Time Speech Signal Processing Principles and Practice

Ikkunointi Puhetta käsitellään kehyksittäin (frame) eli ikkunoittain Toimii seuraavasti:

Sovellus: puheen perustaajuuden muuttaminen Idea: muutetaan puhujan perustaajuutta Nk. PSOLA-algoritmi (pitch-synchronous overlap-add): Etsitään puheen perustaajuus soinnillisista kohdista (ei helppoa) Otetaan jaksoja hitaammin tai tiheämmin Summataan jaksot

PSOLA

Praat: doing phonetics by computer Boersma, Paul & Weenink, David (2008). Praat: doing phonetics by computer (Version 5.0.42) [Computer program]. Retrieved November 26, 2008, from http://www.praat.org/ Käytetään viikon 02/2009 harkoissa (siis 3. harkoissa) Suomenkielinen Praat-opas: Mietta Lennes, Praat-opas 2004 http://www.helsinki.fi/puhetieteet/atk/praat/

Linkkejä MATLAB-oppaita: Praat: Fonetiikka: http://www.helsinki.fi/~mjlaine/matlab/ (suomenkielinen) http://www.helsinki.fi/~mjlaine/matlab/matlab-primer.html Praat: http://www.praat.org/ (ohjelma) http://www.helsinki.fi/puhetieteet/atk/praat/ (suomenkielinen opas) Fonetiikka: Suomenkilinen fonetiikkasanasto: http://www.opiskelijakirjasto.lib.helsinki.fi/fonterm/ IPA: http://www2.arts.gla.ac.uk/IPA/fullchart.html