diff --git a/pages/students/2020/matej_kobylan/README.md b/pages/students/2020/matej_kobylan/README.md index 05b1c91f..1308c047 100644 --- a/pages/students/2020/matej_kobylan/README.md +++ b/pages/students/2020/matej_kobylan/README.md @@ -38,7 +38,7 @@ Pre článok chceme evidovať: - dátum vydania. - pôvodné html -Ku databáze chceme vytvoriť agenta ktorý by v pravidelnýchh intervaloch dopĺňal nové články. Agenta pre zber textu stačí modifikovať. +Ku databáze chceme vytvoriť agenta ktorý by v pravidelných intervaloch dopĺňal nové články. Agenta pre zber textu stačí modifikovať. Ku databáze chceme vytvoriť webové rozhranie. @@ -48,7 +48,6 @@ Chceme vedieť automaticky zistiť tému článku. Chceme automaticky zistiť sumár článku. - - Vyberte vhodnú databázu. - Postgres, Cassandra. - Navrhnite schému. @@ -56,22 +55,41 @@ Chceme automaticky zistiť sumár článku. - Implementujte webové rozhranie na prístup k databáze. +Stretnutie 24.1.2022 + +Stav: + +- Začiatok štúdia Python. +- Prečítané články: "COVID a kľúčové slová", o Elasticsearch. + +Úlohy: + +- Pokračovať v otvorených úlohách z 30.9. +- Zistite, čo je to systém RASA a ako pracuje. +- Skúste prejsť tutoriál https://rasa.com/blog/category/tutorials/ + +Zásobník úloh: + +- Zvážiť zmenu témy na "RASA" dialógový systém. + + Stretnutie 30.9.2022 Úlohy: - Prečítajte si záverečné práce J. Holp, M. Stromko. -- Vypracujte prehľad literatúry na tému "Monitorovanie médií". Otvorte si google scholar, hyhľadajte heslo "news monitoring" , "social media monitoring". Vyberte čláonky ktoré sa Vám zadajú zaujímavé, prečítajte si ch a napíšte na min. jednu stranu poznámky čo ste sa dozvedeli. Uveďte zdroje - názy článkov a autorov. -- Nainštalujte si systém Anaconda. +- Nainštalujte si systém Anaconda. Naučte sa pracovať s virtuálnymi prostrediami. - Prejdite si Python tutoriál. -- Zistite si, čo je systém Elasticsearch a ako pracuje. Napíšte o tom správu na jednu stranu. -- Pomocou systému Docker si nainštalujte Elasticsdaerch 8.4 -- Prejdite si tutoriál https://elasticsearch-dsl.readthedocs.io/en/latest/index.html +- Zistite ako pracuje agent pre zber textu - web crawler. Vyhľadajte odborné články alebo knihy na túto tému a urobte si poznámky. +- Oboznámte sa s kódom agenta websucker https://git.kemt.fei.tuke.sk/dano/websucker-pip. Zásobník úloh: -- Zistite ako pracuje agent pre zber textu - web crawler. Vyhľadajte odborné články alebo knihy na túto tému a urobte si poznámky. -- Oboznámte sa s kódom agenta websucker. -- Zistite, ako funguje knižnica BeautifulSoup. +- Zistite, ako funguje knižnica BeautifulSoup, vypracujte tutoriál. +- Vypracujte prehľad literatúry na tému "Monitorovanie médií". Otvorte si google scholar, hyhľadajte heslo "news monitoring" , "social media monitoring". Vyberte články ktoré sa Vám zadajú zaujímavé, prečítajte si ch a napíšte na min. jednu stranu poznámky čo ste sa dozvedeli. Uveďte zdroje - názy článkov a autorov. +- Zistite si, čo je systém Elasticsearch a ako pracuje. Napíšte o tom správu na jednu stranu. +- Pomocou systému Docker si nainštalujte Elasticsearch 8.4 +- Prejdite si tutoriál https://elasticsearch-dsl.readthedocs.io/en/latest/index.html + - Urobte si GIT repozitár, kde budeme dávať kódy.