From 5146aa1523b14e86556306d69b77ca35a4011db9 Mon Sep 17 00:00:00 2001 From: Daniel Hladek Date: Thu, 9 Oct 2025 10:43:53 +0200 Subject: [PATCH] zz --- pages/students/2023/yevhenii_medushivskyi/README.md | 3 +-- 1 file changed, 1 insertion(+), 2 deletions(-) diff --git a/pages/students/2023/yevhenii_medushivskyi/README.md b/pages/students/2023/yevhenii_medushivskyi/README.md index cd1a3a38..ec1d52e0 100644 --- a/pages/students/2023/yevhenii_medushivskyi/README.md +++ b/pages/students/2023/yevhenii_medushivskyi/README.md @@ -21,7 +21,7 @@ Predbežné zadanie: 1. Vypracujte prehľad webových korpusov a metód ich tvorby. 2. Získajte dáta z internetu a vytvorte korpus dát pre viaceré domény. -3. Využite získané dáta na tvorbu doménovo orientovaného jazykového modelu. +3. Vytvorte a nasadte webový crawler pre sledovanie a sťahovanie slovenského internetu. Stretnutie 9.10.2025 @@ -35,7 +35,6 @@ Stav: - Pozrite sa na HPLT3. - Pozrite sa na https://github.com/lc/gau -- Vytvorte a nasadte webový crawler pre sledovanie a sťahovanie slovenského internetu. - Zistite na čo je súbor robots.txt. - Zistite, ako nasadiť aplikáciu pomocou Docker Compose. - Na tvorbu vyberte vhodné nástroje - Django , Docker, Flask. Work Queue (beanstalkd, Celery, iné...)