--- title: Yevhenii Medushivskyi published: true taxonomy: category: [bp2026] tag: [ir,lm,nlp] author: Daniel Hladek --- rok začiatku štúdia: 2023 # Bakalárska práca 2026 Téma: Extrakcia informácií z webových stránok Predbežné zadanie: 1. Vypracujte prehľad webových korpusov a metód ich tvorby. 2. Získajte dáta z internetu a vytvorte korpus dát pre viaceré domény. 3. Využite získané dáta na tvorbu doménovo orientovaného jazykového modelu.