120 likes | 246 Views
Syst émy zpracování řeči - S RE Úvod. Honza Černocký. 2008/09. Cíl kursu….
E N D
Systémy zpracování řeči - SREÚvod Honza Černocký 2008/09
Cíl kursu… „Studenti si rozšíří vědomosti získalané v základním kursu o zpracování řečových signálů a zpracování přirozeného jazyka. Získají přehled o metodách v současnosti implementovaných v průmyslových aplikacích (GSM telefony nebo komerčně dostupné rozpoznávače). Seznámí se s perspektivními metodami existujícími ve výzkumné oblasti. Prohloubí své znalosti zpracování přirozeného jazyka a jazykového modelování. Absolvování předmětu umožní posluchači realizovat jednoduché aplikace jako např. hlasové ovládání programu, ale především se zapojit do vývoje komplexních systémů pro zpracování řeči v akademické i průmyslové sféře.“
… a teď doopravdy: • Naučit Vás něco o řeči. • Ujasnit si některé věci sami (teorie, systematizace znalostí). • Vysvětlit si to mezi sebou. • Posílit link mezi speech & NLP. • Ulovit lidi do naší skupiny
Kdo bude učit • Garant: Honza Černocký • NLP-part: Pavel Smrž • … ale to nejzajímavější budou vykládat lidé ze Speech@FIT: • Lukáš Burget • Petr Schwarz • Pavel Matějka • Martin Karafiát • …
Přednášky – I. Bývalo to takto … • Fonetika a fonologie - struktura slabik, fonologické procesy a rozlišující rysy [Černocký] • Statistické rozpoznávání vzorů I. - Bayesovský rámec, Maximum likelihood učení, Gaussian mixture models. Parametry pro GMM modelování [Černocký] • Statistické rozpoznávání vzorů II. - umělé neuronové sítě, Support vector machines. Modelování sekvencí - skryté Markovovy modely HMM. [Schwarz, Černocký, Burget] • Features pro HMM a jejich transformace, trénování a adaptace HMM - MLLR, MAP, diskriminativní trénování [Burget, Karafiát, Grézl]. • Rozpoznávání HMM - výslovnostní slovníky, rozpoznávací sítě, jazykový model, dekódování, lattices [Burget, Karafiát, Glembek]. • Rozpoznávání fonémů. Detekce klíčových slov a vyhledávání - LVCSR, akustické, fonémové lattices. Figure of Merit. Indexace a vyhledávání [Schwarz, Szöke, Fapšo].
Přednášky – II. • Identifikace a verifikace mluvčího - GMM, SVM. Normalizace a adaptace na přenosový kanál - feature mapping, eigen-voices a nuissance attributes projection (NAP). Vyhodnocení ověřování mluvčího - DET křivky, EER, cost function [Matějka, Burget, Schwarz]. • Identifikace jazyka - akustická vs. fonotaktická, vyhodnocení [Matějka, Burget] • Kódování řeči - CELP - adaptivní a stochastická kódová kniha, GSM standardy [Černocký, Motlíček?] • Jazykové modelování I. - n-gramové modely, modely založené na třídách [Smrž] • Jazykové modelování II. - příznaky specifické pro jazyk, factored-language models, Psycholingvistika - model rozpoznávání slov, slovní asociace [Smrž]. • Pravděpodobnostní parsování - algoritmus inside-outside, závislostní parsování [Smrž]. • Presentace projektů [Vy!] … ale stejně to zase předěláme !
Projekty • 2 typy: • Paper reading + presentace – 1 člověk • Něco udělat – 2 lidi • Budou zadány do příštího týdne. • Viz minulý rok … WIS • Vaše nápady a souvislost s diplomovou prací jsou vítány !
Hodnocení • Půlsemestrálka – 15b. • Zkouška – 50b. • Projekt – zpráva + presentace – 35b.
Literatura • Gussenhoven, J. and Jacobs, H.: Understanding Phonology, Oxford University Press, 1998, ISBN: 0-340-69218-9 • Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia, Praha, 1995, ISBN 80-200-0203-0 • Josef Psutka, Jindřich Matoušek, Luděk Muller, Vlasta Radová: Mluvíme s počítačem česky, Academia 2006, ISBN 80-200-1309-1 • Gold, B., Morgan, N.: Speech and audio signal processing, John Wiley & Sons, 2000, ISBN 0-471-35154-7. • Moore, B.C.J.: An introduction to the psychology of hearing, Academic Press, 1989, ISBN 0-12-505627-3. • Jelinek, F.: Statistical Methods for Speech Recognition, MIT Press, 1998, ISBN 0-262-10066-5. • Manning, C. and Schütze, H.: Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May 1999. Web … https://www.fit.vutbr.cz/study/courses/SRE/public/ bude i index.html…
EMLS – I. European Masters in Language and Speech programme (EuroMasters): http://www.cstr.ed.ac.uk/emasters/ Požadavky: • coverage of EuroMasters requirements by courses taken during his/her study and his/her results in these courses • topic and quality of projects done during his/her study. At least one project should have speech or NL processing as its primary topic. • training or stay in a company or at a university abroad or participation at a EuroMasters summer school. Co z toho: • A certificate signed by President of ICSA and European Chapter of ACL: http://www.isca-speech.org/ http://www.eacl.org/
EMLS – II. • Speech Signal Processing (SRE) - Jan Černocký • Natural Language processing (NLP) - Pavel Smrž • Speech processing systems (SRE) - Jan Černocký • Signals and Systems (ISS) - Jan Černocký • Audio and Speech Processing by Humans and Machines (ASD) - Hynek Heřmanský • Artificial Intelligence (UIN) - František Zbořil • Neural Networks (NEU) - František Zbořil • Formal Languages and Compilers (IFJ) - Alexander Meduna • Multimedia (MUM) - Pavel Zemčík • Database Systems (IDS) - Jaroslav Zendulka • Introduction to Software Engineering (IUS) - Jaroslav Zendulka • Introduction to Programming Systems (IZP) - Jitka Kreslíková Summer school 2007 byla v Brně, 2008 v Německu.
Závěr • SRE je tu pro Vás, neváhejte komentovat program kursu (insert, delete, modify). • SRE … je toho tolik, co bychom Vám chtěli říci … a času tak málo …komentujte !