Update pages/students/2023/yevhenii_medushivskyi/README.md
This commit is contained in:
parent
10911fd692
commit
0a01d0e869
@ -27,7 +27,22 @@ Stretnutie 7.11.2025
|
||||
|
||||
Stav:
|
||||
|
||||
- Vytvorený crawler na báze Scrapy, využíva redis, Mongo, Trafilatura, Playwright, Celery
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Vytvorte Deploymnet pomocou docker compose na školskom servri.
|
||||
- Vytvorte WebUI pre sledovanie behu Crawlera.
|
||||
- Navrhnite opatrenie proti preťaženiu zdroja dát.
|
||||
- Spustite pokusné sťahovanie a zistite ako sa systém správa. Dávajte pozor na "preťaženie zdroja".
|
||||
- Kódy dávajte na GIT.
|
||||
- Pracujte na texte práce. Prehľad systémov na text mining, prehľad webových korpusov a metód ich tvorby. Opis nášho riešenia.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Navrhnite systém pre vyhodnotenie domény. Aký je predpoklad pre získanie kvalitného textu?
|
||||
- Navrhnite systém pre vyhodnoteie kvality textu.
|
||||
- Spustite "produkčnú" prevádzku. Sledujte činnosť a množstvo získaného textu. Zostavte grafy a tabuľky.
|
||||
|
||||
Stretnutie 9.10.2025
|
||||
|
||||
|
||||
Loading…
Reference in New Issue
Block a user