diff --git a/pages/students/2023/yevhenii_medushivskyi/README.md b/pages/students/2023/yevhenii_medushivskyi/README.md index cd1a3a38..ec1d52e0 100644 --- a/pages/students/2023/yevhenii_medushivskyi/README.md +++ b/pages/students/2023/yevhenii_medushivskyi/README.md @@ -21,7 +21,7 @@ Predbežné zadanie: 1. Vypracujte prehľad webových korpusov a metód ich tvorby. 2. Získajte dáta z internetu a vytvorte korpus dát pre viaceré domény. -3. Využite získané dáta na tvorbu doménovo orientovaného jazykového modelu. +3. Vytvorte a nasadte webový crawler pre sledovanie a sťahovanie slovenského internetu. Stretnutie 9.10.2025 @@ -35,7 +35,6 @@ Stav: - Pozrite sa na HPLT3. - Pozrite sa na https://github.com/lc/gau -- Vytvorte a nasadte webový crawler pre sledovanie a sťahovanie slovenského internetu. - Zistite na čo je súbor robots.txt. - Zistite, ako nasadiť aplikáciu pomocou Docker Compose. - Na tvorbu vyberte vhodné nástroje - Django , Docker, Flask. Work Queue (beanstalkd, Celery, iné...)