This commit is contained in:
Daniel Hládek 2025-12-18 10:03:03 +01:00
parent a3194eb1a3
commit e9776f7b36

View File

@ -37,8 +37,7 @@ Stav:
- Kódy dajte na KEMT GIT
- frontend dajte do osobitného adresára, nie do branch.
- Zobrazte dostupné konfigurácie workerov.
- Pridajte možnosť naštartovať a zastaviť workera so zadanou konfiguráciou. Jeden worker by mal fungovať na jednu doménu.
- Pridajte možnosť naštartovať a zastaviť workera. Jeden worker by mal fungovať na jednu doménu.
- Pridajte zoznam možných domén a algoritmus (naplnenie work qeue) pre výber ďalších domén.
- Zobrazte stav pre každú navštívenú doménu. Koľko odkazov bolo navštívených, koľko textu sa získalo, koľko nenavštívených odkazov je načerpaných.
- Zobrazte históriu a plán činnosti pre každého workera - koľko užitočného textu načerpal, koľko odkazov navštívil.
@ -48,6 +47,8 @@ Zásobík úloh:
- Analyzujte získané odkazy pre danú doménu. Odkazy by som rozdelil na tokeny a urobil štatistickú analýzu tokenov.
- Pridajte možnost blacklistu pre domény a tokeny v URL
- Natrénujte prediktor získaného textu na základe URL (tokenov).
- Zobrazte dostupné konfigurácie workerov.
Stretnutie 7.11.2025