Vyučující
|
-
Mrkvička Miroslav, doc. Ing. Ph.D.
|
Obsah předmětu
|
1. Motivace a program předmětu. Úvod do předmětu. 2. Získávání informací z Webu, prohledávače Webu. 3. Tokenizace, stemming, Porterův algoritmus, lematizace, POS značkování, parsing. Slovníky, editační vzdálenost. 4. Vyhledávání informace, booleovský model, indexování. 5. Podobnost dotazu s dokumentem, vektorový model dokumentu, výběr top hitů. 6. Web jako graf, analýza struktury Webu, PageRank, HITS. 7. Hodnocení vyhledávacího systému, standardní kolekce, vyhodnocování relevance. 8. XML vyhledávání, vektorový model v XML prostředí. 9. Systémy odpovídání otázek. 10. Multimedia Information retrieval. 11. Klasifikace textů, výběr vlastností, vyhodnocování klasifikace, klasifikace ve vektorovém prostoru. Detekce plagiátů, spamů 12. Shlukování textů, volba počtu shluků. Systémy shlukování zpravodajských textů 13. Úvod do analýzy textů - extrakce informací, analýza polarity, sumarizace
|
Studijní aktivity a metody výuky
|
Přednáška s diskusí, Projektová výuka, Diskuse, Výuka podporovaná multimédii, Prezentace práce studentů, Demonstrace dovedností, Studium metodou řešení problémů, Samostatná práce studentů, Studium textů, Cvičení
- Projekt individuální [40]
- 40 hodin za semestr
- Kontaktní výuka
- 65 hodin za semestr
- Příprava na zkoušku [10-60]
- 55 hodin za semestr
|
Předpoklady |
---|
Odborné znalosti |
---|
orientovat se v možnostech aplikačního programového vybavení s cílem dosáhnout lepší orientaci v narůstajícím množství informací |
vysvětlit principy relačních databází, datové integrity a základních SQL příkazů, popsat postupy datového modelování |
popsat principy programování v imperativních a objektových jazycích včetně základních řídicích struktur a způsobů reprezentace dat, vysvětlit základní datové struktury a algoritmy pro práci s nimi |
Odborné dovednosti |
---|
utřídit, zpracovat a prezentovat získané informace písemnou i ústní formou v českém i anglickém jazyce; vytvořit dokumentaci k realizovanému dílu nebo jeho součásti |
získávat a zpracovávat informace ze zdrojů v anglickém jazyce |
navrhnout databázový systém či informační systém menšího až středního rozsahu, navrhnout a realizovat jednodušší samostatnou a webovou aplikaci |
ovládat zásady vytváření dobře dokumentovaných a robustních programových kódů, prakticky využít teoretické a praktické poznatky o práci s algoritmy, datovými strukturami a konkrétními vývojovými prostředky |
Obecné způsobilosti |
---|
mgr. studium: používají své odborné znalosti, odborné dovednosti a obecné způsobilosti alespoň v jednom cizím jazyce, |
Výsledky učení |
---|
Odborné znalosti |
---|
vysvětlit a ilustrovat metody a modely pro reprezentaci a zpracování rozsáhlých nestrukturovaných dat |
popsat principy zpracování přirozeného jazyka a vyhledávání v textových datech |
Odborné dovednosti |
---|
efektivně použít metody a technologie pro vyhledávání v rozsáhlých nestrukturovaných datech |
realizovat různé metody webového vyhledávání a základní metody zpracování přirozeného jazyka |
Obecné způsobilosti |
---|
mgr. studium: používají své odborné znalosti, odborné dovednosti a obecné způsobilosti alespoň v jednom cizím jazyce, |
mgr. studium: dle vyvíjejících se souvislostí a dostupných zdrojů vymezí zadání pro odborné činnosti, koordinují je a nesou konečnou odpovědnost za jejich výsledky, |
používají své odborné znalosti, odborné dovednosti a obecné způsobilosti v anglickém jazyce a v základní míře i v jednom dalším cizím jazyce |
Vyučovací metody |
---|
Odborné znalosti |
---|
Přednáška s diskusí, |
Samostudium, |
Cvičení (praktické činnosti), |
Samostatná práce studentů, |
Řešení problémů, |
Výuka podporovaná multimédii, |
Odborné dovednosti |
---|
Demonstrace dovedností, |
Obecné způsobilosti |
---|
Přednáška s diskusí, |
Hodnotící metody |
---|
Odborné znalosti |
---|
Individuální prezentace, |
Průběžné hodnocení, |
Test, |
Kombinovaná zkouška, |
Odborné dovednosti |
---|
Výstupní projekt, |
Demonstrace dovedností (praktická činnost), |
Kombinovaná zkouška, |
Obecné způsobilosti |
---|
Kombinovaná zkouška, |
Doporučená literatura
|
-
Baeza-Yates, R.; Ribeiro-Neto, Berthier. Modern information retrieval. Harlow : Addison-Wesley, 1999. ISBN 0-201-39829-X.
-
Büttcher, Stefan.; Clarke, Charles L. A.; Cormack, Gordon V. Information Retrieval: Implementing and Evaluating Search Engines. Cambridge: The MIT Press, 2016. ISBN 978-0-262-52887-0.
-
Chakrabarti, Soumen. Mining the web : discovering knowledge from hypertext data. San Francisco : Morgan Kaufmann Publishers, 2003. ISBN 1-55860-754-7.
-
Jurafsky, Daniel; Martin, James H. Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition. 2nd ed. Upper Saddle River : Pearson/Prentice Hall, 2009. ISBN 978-0-13-504196-3.
-
Manning, Christopher D.; Raghavan, Prabhakar; Schütze, Hinrich. Introduction to information retrieval. 1st pub. New York : Cambridge University Press, 2008. ISBN 978-0-521-86571-5.
|