Předmět: Vyhledávání informací

« Zpět
Název předmětu Vyhledávání informací
Kód předmětu KIV/IR
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu Magisterský
Rok studia 2
Semestr Letní
Počet ECTS kreditů 6
Vyučovací jazyk Čeština
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Mrkvička Miroslav, doc. Ing. Ph.D.
Obsah předmětu
1. Motivace a program předmětu. Úvod do předmětu. 2. Získávání informací z Webu, prohledávače Webu. 3. Tokenizace, stemming, Porterův algoritmus, lematizace, POS značkování, parsing. Slovníky, editační vzdálenost. 4. Vyhledávání informace, booleovský model, indexování. 5. Podobnost dotazu s dokumentem, vektorový model dokumentu, výběr top hitů. 6. Web jako graf, analýza struktury Webu, PageRank, HITS. 7. Hodnocení vyhledávacího systému, standardní kolekce, vyhodnocování relevance. 8. XML vyhledávání, vektorový model v XML prostředí. 9. Systémy odpovídání otázek. 10. Multimedia Information retrieval. 11. Klasifikace textů, výběr vlastností, vyhodnocování klasifikace, klasifikace ve vektorovém prostoru. Detekce plagiátů, spamů 12. Shlukování textů, volba počtu shluků. Systémy shlukování zpravodajských textů 13. Úvod do analýzy textů - extrakce informací, analýza polarity, sumarizace

Studijní aktivity a metody výuky
Přednáška s diskusí, Projektová výuka, Diskuse, Výuka podporovaná multimédii, Prezentace práce studentů, Demonstrace dovedností, Studium metodou řešení problémů, Samostatná práce studentů, Studium textů, Cvičení
  • Projekt individuální [40] - 40 hodin za semestr
  • Kontaktní výuka - 65 hodin za semestr
  • Příprava na zkoušku [10-60] - 55 hodin za semestr
Předpoklady
Odborné znalosti
orientovat se v možnostech aplikačního programového vybavení s cílem dosáhnout lepší orientaci v narůstajícím množství informací
vysvětlit principy relačních databází, datové integrity a základních SQL příkazů, popsat postupy datového modelování
popsat principy programování v imperativních a objektových jazycích včetně základních řídicích struktur a způsobů reprezentace dat, vysvětlit základní datové struktury a algoritmy pro práci s nimi
Odborné dovednosti
utřídit, zpracovat a prezentovat získané informace písemnou i ústní formou v českém i anglickém jazyce; vytvořit dokumentaci k realizovanému dílu nebo jeho součásti
získávat a zpracovávat informace ze zdrojů v anglickém jazyce
navrhnout databázový systém či informační systém menšího až středního rozsahu, navrhnout a realizovat jednodušší samostatnou a webovou aplikaci
ovládat zásady vytváření dobře dokumentovaných a robustních programových kódů, prakticky využít teoretické a praktické poznatky o práci s algoritmy, datovými strukturami a konkrétními vývojovými prostředky
Obecné způsobilosti
mgr. studium: používají své odborné znalosti, odborné dovednosti a obecné způsobilosti alespoň v jednom cizím jazyce,
Výsledky učení
Odborné znalosti
vysvětlit a ilustrovat metody a modely pro reprezentaci a zpracování rozsáhlých nestrukturovaných dat
popsat principy zpracování přirozeného jazyka a vyhledávání v textových datech
Odborné dovednosti
efektivně použít metody a technologie pro vyhledávání v rozsáhlých nestrukturovaných datech
realizovat různé metody webového vyhledávání a základní metody zpracování přirozeného jazyka
Obecné způsobilosti
mgr. studium: používají své odborné znalosti, odborné dovednosti a obecné způsobilosti alespoň v jednom cizím jazyce,
mgr. studium: dle vyvíjejících se souvislostí a dostupných zdrojů vymezí zadání pro odborné činnosti, koordinují je a nesou konečnou odpovědnost za jejich výsledky,
používají své odborné znalosti, odborné dovednosti a obecné způsobilosti v anglickém jazyce a v základní míře i v jednom dalším cizím jazyce
Vyučovací metody
Odborné znalosti
Přednáška s diskusí,
Samostudium,
Cvičení (praktické činnosti),
Samostatná práce studentů,
Řešení problémů,
Výuka podporovaná multimédii,
Odborné dovednosti
Demonstrace dovedností,
Obecné způsobilosti
Přednáška s diskusí,
Hodnotící metody
Odborné znalosti
Individuální prezentace,
Průběžné hodnocení,
Test,
Kombinovaná zkouška,
Odborné dovednosti
Výstupní projekt,
Demonstrace dovedností (praktická činnost),
Kombinovaná zkouška,
Obecné způsobilosti
Kombinovaná zkouška,
Doporučená literatura
  • Baeza-Yates, R.; Ribeiro-Neto, Berthier. Modern information retrieval. Harlow : Addison-Wesley, 1999. ISBN 0-201-39829-X.
  • Büttcher, Stefan.; Clarke, Charles L. A.; Cormack, Gordon V. Information Retrieval: Implementing and Evaluating Search Engines. Cambridge: The MIT Press, 2016. ISBN 978-0-262-52887-0.
  • Chakrabarti, Soumen. Mining the web : discovering knowledge from hypertext data. San Francisco : Morgan Kaufmann Publishers, 2003. ISBN 1-55860-754-7.
  • Jurafsky, Daniel; Martin, James H. Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition. 2nd ed. Upper Saddle River : Pearson/Prentice Hall, 2009. ISBN 978-0-13-504196-3.
  • Manning, Christopher D.; Raghavan, Prabhakar; Schütze, Hinrich. Introduction to information retrieval. 1st pub. New York : Cambridge University Press, 2008. ISBN 978-0-521-86571-5.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr