Vyučující
|
-
Majer Radovan, doc. Ing. Ph.D.
|
Obsah předmětu
|
1. Taxonomie úloh strojového zpracování přirozeného jazyka. Typické problémy a aplikace. 2. Tokenizace, stemming, Porterův algoritmus, lematizace, POS značkování, parsing. Slovníky, editační vzdálenost. 3. Vyhledávání informace, booleovský model, indexování. 4. Podobnost dotazu s dokumentem, vektorový model dokumentu, výběr top hitů. 5. Hodnocení vyhledávacího systému, standardní kolekce. 6. XML vyhledávání, vektorový model v XML prostředí, vyhodnocování relevantnosti. 7. Pravděpodobnostní modely pro IR. Maticové dekompozice, latentní sémantické indexování. 8. Klasifikace textů, výběr vlastností, vyhodnocování klasifikace, klasifikace ve vektorovém prostoru. Detekce plagiátů, spamů. 9. Shlukování textů, volba počtu shluků. Systémy shlukování zpravodajských textů. 10.Extrakce informací, extrakce událostí, extrakce relací. 11.Sumarizační metody, generování textu. 12.Vyhledávání názorů. Aplikace na texty sociálních médií. 13.Získávání informací z Webu, analýza obsahu, prohledávače Webu, distribuované indexy, Web jako graf, analýza struktury Webu, PageRank, HITS.
|
Studijní aktivity a metody výuky
|
Přednáška s diskusí, Projektová výuka, Diskuse, Výuka podporovaná multimédii, Prezentace práce studentů, Demonstrace dovedností, Studium metodou řešení problémů, Samostatná práce studentů, Studium textů, Cvičení
- Projekt individuální [40]
- 40 hodin za semestr
- Kontaktní výuka
- 65 hodin za semestr
- Příprava na zkoušku [10-60]
- 55 hodin za semestr
|
Předpoklady |
---|
Odborné znalosti |
---|
orientovat se v možnostech aplikačního programového vybavení s cílem dosáhnout lepší orientaci v narůstajícím množství informací |
popsat principy programování v imperativních a objektových jazycích včetně základních řídicích struktur a způsobů reprezentace dat, vysvětlit základní datové struktury a algoritmy pro práci s nimi |
vysvětlit principy relačních databází, datové integrity a základních SQL příkazů, popsat postupy datového modelování |
Odborné dovednosti |
---|
navrhnout databázový systém či informační systém menšího až středního rozsahu, navrhnout a realizovat jednodušší samostatnou a webovou aplikaci |
ovládat zásady vytváření dobře dokumentovaných a robustních programových kódů, prakticky využít teoretické a praktické poznatky o práci s algoritmy, datovými strukturami a konkrétními vývojovými prostředky |
utřídit, zpracovat a prezentovat získané informace písemnou i ústní formou v anglickém jazyce; vytvořit dokumentaci k realizovanému dílu nebo jeho součásti |
získávat a zpracovávat informace ze zdrojů v anglickém jazyce |
Obecné způsobilosti |
---|
mgr. studium: používají své odborné znalosti, odborné dovednosti a obecné způsobilosti alespoň v jednom cizím jazyce, |
Výsledky učení |
---|
Odborné znalosti |
---|
popsat principy zpracování přirozeného jazyka a vyhledávání v textových datech |
vysvětlit a ilustrovat metody a modely pro reprezentaci a zpracování rozsáhlých nestrukturovaných dat |
Odborné dovednosti |
---|
efektivně použít metody a technologie pro vyhledávání v rozsáhlých nestrukturovaných datech |
realizovat různé metody webového vyhledávání a základní metody zpracování přirozeného jazyka |
Obecné způsobilosti |
---|
Po absolvování je student nejen schopen realizovat různé metody zpracování přirozeného jazyka, ale také získá profesionální znalosti o možnostech jejich využití v oblasti softwarového inženýrství, Business Intelligence, Social Media monitoring, odhalování závadných a společensky nebezpečných textů a názorů, analýzy názorů apod. Získá i schopnost používat formální metody pro konstruování takového softwaru. |
mgr. studium: dle vyvíjejících se souvislostí a dostupných zdrojů vymezí zadání pro odborné činnosti, koordinují je a nesou konečnou odpovědnost za jejich výsledky, |
Vyučovací metody |
---|
Odborné znalosti |
---|
Cvičení (praktické činnosti), |
Přednáška s diskusí, |
Řešení problémů, |
Samostatná práce studentů, |
Samostudium, |
Výuka podporovaná multimédii, |
Odborné dovednosti |
---|
Demonstrace dovedností, |
Obecné způsobilosti |
---|
Přednáška s diskusí, |
Hodnotící metody |
---|
Odborné znalosti |
---|
Individuální prezentace, |
Průběžné hodnocení, |
Test, |
Kombinovaná zkouška, |
Odborné dovednosti |
---|
Výstupní projekt, |
Demonstrace dovedností (praktická činnost), |
Kombinovaná zkouška, |
Obecné způsobilosti |
---|
Kombinovaná zkouška, |
Individuální prezentace, |
Doporučená literatura
|
-
Baeza-Yates, R.; Ribeiro-Neto, Berthier. Modern information retrieval. Harlow : Addison-Wesley, 1999. ISBN 0-201-39829-X.
-
Jurafsky, Daniel; Martin, James H. Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition. 2nd ed. Upper Saddle River : Pearson/Prentice Hall, 2009. ISBN 978-0-13-504196-3.
-
Manning, Christopher D.; Raghavan, Prabhakar; Schütze, Hinrich. Introduction to information retrieval. 1st pub. New York : Cambridge University Press, 2008. ISBN 978-0-521-86571-5.
|