diff --git a/pages/students/2020/matej_kobylan/README.md b/pages/students/2020/matej_kobylan/README.md index ea8a2e8a..05b1c91f 100644 --- a/pages/students/2020/matej_kobylan/README.md +++ b/pages/students/2020/matej_kobylan/README.md @@ -48,11 +48,30 @@ Chceme vedieť automaticky zistiť tému článku. Chceme automaticky zistiť sumár článku. -Úlohy: -- Vypracujte prehľad literatúry na tému "Monitorovanie médií". - Vyberte vhodnú databázu. - Postgres, Cassandra. - Navrhnite schému. - Modifikujte agenta pre zber textu. - Implementujte webové rozhranie na prístup k databáze. + + +Stretnutie 30.9.2022 + +Úlohy: + +- Prečítajte si záverečné práce J. Holp, M. Stromko. +- Vypracujte prehľad literatúry na tému "Monitorovanie médií". Otvorte si google scholar, hyhľadajte heslo "news monitoring" , "social media monitoring". Vyberte čláonky ktoré sa Vám zadajú zaujímavé, prečítajte si ch a napíšte na min. jednu stranu poznámky čo ste sa dozvedeli. Uveďte zdroje - názy článkov a autorov. +- Nainštalujte si systém Anaconda. +- Prejdite si Python tutoriál. +- Zistite si, čo je systém Elasticsearch a ako pracuje. Napíšte o tom správu na jednu stranu. +- Pomocou systému Docker si nainštalujte Elasticsdaerch 8.4 +- Prejdite si tutoriál https://elasticsearch-dsl.readthedocs.io/en/latest/index.html + +Zásobník úloh: + +- Zistite ako pracuje agent pre zber textu - web crawler. Vyhľadajte odborné články alebo knihy na túto tému a urobte si poznámky. +- Oboznámte sa s kódom agenta websucker. +- Zistite, ako funguje knižnica BeautifulSoup. +- Urobte si GIT repozitár, kde budeme dávať kódy. +