diff --git a/pages/students/2023/yevhenii_medushivskyi/README.md b/pages/students/2023/yevhenii_medushivskyi/README.md index daacd6456..66a0cb333 100644 --- a/pages/students/2023/yevhenii_medushivskyi/README.md +++ b/pages/students/2023/yevhenii_medushivskyi/README.md @@ -20,8 +20,10 @@ Extrakcia informácií z webových stránok Predbežné zadanie: 1. Vypracujte prehľad webových korpusov a metód ich tvorby. -2. Získajte dáta z internetu a vytvorte korpus dát pre viaceré domény. -3. Vytvorte a nasadte webový crawler pre sledovanie a sťahovanie slovenského internetu. +2. Vytvorte a nasadte webový crawler pre sledovanie a sťahovanie slovenského internetu. +3. Pomocou crawlera získajte dáta z internetu a vytvorte korpus dát pre viaceré domény. +4. Analyzujte získané dáta, priebeh ich sťahovania a navrhnite zlepšenia získavania textových dát. + Stretnutie 18.12.2025