diff --git a/pages/students/2023/yevhenii_medushivskyi/README.md b/pages/students/2023/yevhenii_medushivskyi/README.md index 66a0cb33..8fea81be 100644 --- a/pages/students/2023/yevhenii_medushivskyi/README.md +++ b/pages/students/2023/yevhenii_medushivskyi/README.md @@ -15,14 +15,14 @@ rok začiatku štúdia: 2023 Téma: -Extrakcia informácií z webových stránok +Získavanie textu z webových stránok -Predbežné zadanie: +Zadanie: -1. Vypracujte prehľad webových korpusov a metód ich tvorby. -2. Vytvorte a nasadte webový crawler pre sledovanie a sťahovanie slovenského internetu. -3. Pomocou crawlera získajte dáta z internetu a vytvorte korpus dát pre viaceré domény. -4. Analyzujte získané dáta, priebeh ich sťahovania a navrhnite zlepšenia získavania textových dát. +1. Vypracujte prehľad webových korpusov a metód ich tvorby. +2. Vytvorte a nasadte webový crawler na sledovanie a sťahovanie slovenského internetu. +3. Pomocou crawlera získajte dáta z internetu a vytvorte korpus dát pre viaceré domény. +4. Analyzujte získané dáta, priebeh ich sťahovania a navrhnite zlepšenia procesu získavania textových dát. Stretnutie 18.12.2025