Předmět: Vyhledávání informací

» Seznam fakult » FAV » KIV
Název předmětu Vyhledávání informací
Kód předmětu KIV/IR-E
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu Magisterský
Rok studia nespecifikován
Semestr Letní
Počet ECTS kreditů 6
Vyučovací jazyk Angličtina
Statut předmětu nespecifikováno
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Majer Radovan, doc. Ing. Ph.D.
Obsah předmětu
1. Taxonomie úloh strojového zpracování přirozeného jazyka. Typické problémy a aplikace. 2. Tokenizace, stemming, Porterův algoritmus, lematizace, POS značkování, parsing. Slovníky, editační vzdálenost. 3. Vyhledávání informace, booleovský model, indexování. 4. Podobnost dotazu s dokumentem, vektorový model dokumentu, výběr top hitů. 5. Hodnocení vyhledávacího systému, standardní kolekce. 6. XML vyhledávání, vektorový model v XML prostředí, vyhodnocování relevantnosti. 7. Pravděpodobnostní modely pro IR. Maticové dekompozice, latentní sémantické indexování. 8. Klasifikace textů, výběr vlastností, vyhodnocování klasifikace, klasifikace ve vektorovém prostoru. Detekce plagiátů, spamů. 9. Shlukování textů, volba počtu shluků. Systémy shlukování zpravodajských textů. 10.Extrakce informací, extrakce událostí, extrakce relací. 11.Sumarizační metody, generování textu. 12.Vyhledávání názorů. Aplikace na texty sociálních médií. 13.Získávání informací z Webu, analýza obsahu, prohledávače Webu, distribuované indexy, Web jako graf, analýza struktury Webu, PageRank, HITS.

Studijní aktivity a metody výuky
Přednáška s diskusí, Projektová výuka, Diskuse, Výuka podporovaná multimédii, Prezentace práce studentů, Demonstrace dovedností, Studium metodou řešení problémů, Samostatná práce studentů, Studium textů, Cvičení
  • Projekt individuální [40] - 40 hodin za semestr
  • Kontaktní výuka - 65 hodin za semestr
  • Příprava na zkoušku [10-60] - 55 hodin za semestr
Předpoklady
Odborné znalosti
orientovat se v možnostech aplikačního programového vybavení s cílem dosáhnout lepší orientaci v narůstajícím množství informací
popsat principy programování v imperativních a objektových jazycích včetně základních řídicích struktur a způsobů reprezentace dat, vysvětlit základní datové struktury a algoritmy pro práci s nimi
vysvětlit principy relačních databází, datové integrity a základních SQL příkazů, popsat postupy datového modelování
Odborné dovednosti
navrhnout databázový systém či informační systém menšího až středního rozsahu, navrhnout a realizovat jednodušší samostatnou a webovou aplikaci
ovládat zásady vytváření dobře dokumentovaných a robustních programových kódů, prakticky využít teoretické a praktické poznatky o práci s algoritmy, datovými strukturami a konkrétními vývojovými prostředky
utřídit, zpracovat a prezentovat získané informace písemnou i ústní formou v anglickém jazyce; vytvořit dokumentaci k realizovanému dílu nebo jeho součásti
získávat a zpracovávat informace ze zdrojů v anglickém jazyce
Obecné způsobilosti
mgr. studium: používají své odborné znalosti, odborné dovednosti a obecné způsobilosti alespoň v jednom cizím jazyce,
Výsledky učení
Odborné znalosti
popsat principy zpracování přirozeného jazyka a vyhledávání v textových datech
vysvětlit a ilustrovat metody a modely pro reprezentaci a zpracování rozsáhlých nestrukturovaných dat
Odborné dovednosti
efektivně použít metody a technologie pro vyhledávání v rozsáhlých nestrukturovaných datech
realizovat různé metody webového vyhledávání a základní metody zpracování přirozeného jazyka
Obecné způsobilosti
Po absolvování je student nejen schopen realizovat různé metody zpracování přirozeného jazyka, ale také získá profesionální znalosti o možnostech jejich využití v oblasti softwarového inženýrství, Business Intelligence, Social Media monitoring, odhalování závadných a společensky nebezpečných textů a názorů, analýzy názorů apod. Získá i schopnost používat formální metody pro konstruování takového softwaru.
mgr. studium: dle vyvíjejících se souvislostí a dostupných zdrojů vymezí zadání pro odborné činnosti, koordinují je a nesou konečnou odpovědnost za jejich výsledky,
Vyučovací metody
Odborné znalosti
Cvičení (praktické činnosti),
Přednáška s diskusí,
Řešení problémů,
Samostatná práce studentů,
Samostudium,
Výuka podporovaná multimédii,
Odborné dovednosti
Demonstrace dovedností,
Obecné způsobilosti
Přednáška s diskusí,
Hodnotící metody
Odborné znalosti
Individuální prezentace,
Průběžné hodnocení,
Test,
Kombinovaná zkouška,
Odborné dovednosti
Výstupní projekt,
Demonstrace dovedností (praktická činnost),
Kombinovaná zkouška,
Obecné způsobilosti
Kombinovaná zkouška,
Individuální prezentace,
Doporučená literatura
  • Baeza-Yates, R.; Ribeiro-Neto, Berthier. Modern information retrieval. Harlow : Addison-Wesley, 1999. ISBN 0-201-39829-X.
  • Jurafsky, Daniel; Martin, James H. Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition. 2nd ed. Upper Saddle River : Pearson/Prentice Hall, 2009. ISBN 978-0-13-504196-3.
  • Manning, Christopher D.; Raghavan, Prabhakar; Schütze, Hinrich. Introduction to information retrieval. 1st pub. New York : Cambridge University Press, 2008. ISBN 978-0-521-86571-5.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr