Update pages/students/2023/yevhenii_medushivskyi/README.md

This commit is contained in:
dano 2026-01-15 14:47:41 +00:00
parent 0825ff7427
commit 1261d737c0

View File

@ -15,14 +15,14 @@ rok začiatku štúdia: 2023
Téma:
Extrakcia informácií z webových stránok
Získavanie textu z webových stránok
Predbežné zadanie:
Zadanie:
1. Vypracujte prehľad webových korpusov a metód ich tvorby.
2. Vytvorte a nasadte webový crawler pre sledovanie a sťahovanie slovenského internetu.
3. Pomocou crawlera získajte dáta z internetu a vytvorte korpus dát pre viaceré domény.
4. Analyzujte získané dáta, priebeh ich sťahovania a navrhnite zlepšenia získavania textových dát.
1. Vypracujte prehľad webových korpusov a metód ich tvorby.
2. Vytvorte a nasadte webový crawler na sledovanie a sťahovanie slovenského internetu.
3. Pomocou crawlera získajte dáta z internetu a vytvorte korpus dát pre viaceré domény.
4. Analyzujte získané dáta, priebeh ich sťahovania a navrhnite zlepšenia procesu získavania textových dát.
Stretnutie 18.12.2025