Update 'pages/students/2020/matej_kobylan/README.md'

This commit is contained in:
dano 2022-09-30 09:44:09 +00:00
parent a4b526f10b
commit 3bfbe0d902

View File

@ -48,11 +48,30 @@ Chceme vedieť automaticky zistiť tému článku.
Chceme automaticky zistiť sumár článku.
Úlohy:
- Vypracujte prehľad literatúry na tému "Monitorovanie médií".
- Vyberte vhodnú databázu.
- Postgres, Cassandra.
- Navrhnite schému.
- Modifikujte agenta pre zber textu.
- Implementujte webové rozhranie na prístup k databáze.
Stretnutie 30.9.2022
Úlohy:
- Prečítajte si záverečné práce J. Holp, M. Stromko.
- Vypracujte prehľad literatúry na tému "Monitorovanie médií". Otvorte si google scholar, hyhľadajte heslo "news monitoring" , "social media monitoring". Vyberte čláonky ktoré sa Vám zadajú zaujímavé, prečítajte si ch a napíšte na min. jednu stranu poznámky čo ste sa dozvedeli. Uveďte zdroje - názy článkov a autorov.
- Nainštalujte si systém Anaconda.
- Prejdite si Python tutoriál.
- Zistite si, čo je systém Elasticsearch a ako pracuje. Napíšte o tom správu na jednu stranu.
- Pomocou systému Docker si nainštalujte Elasticsdaerch 8.4
- Prejdite si tutoriál https://elasticsearch-dsl.readthedocs.io/en/latest/index.html
Zásobník úloh:
- Zistite ako pracuje agent pre zber textu - web crawler. Vyhľadajte odborné články alebo knihy na túto tému a urobte si poznámky.
- Oboznámte sa s kódom agenta websucker.
- Zistite, ako funguje knižnica BeautifulSoup.
- Urobte si GIT repozitár, kde budeme dávať kódy.