dmytro_ushatenko/pages/students/2020/matej_kobylan/README.md

---
title: Matej Kobyľan
published: true
taxonomy:
    category: [bp2023]
    tag: [ir]
    author: Daniel Hladek
---

rok začiatku štúdia: 2020

# Bakalárska práca 2024

Cieľ: Vytvoriť dialógový systém pre podporu komunikácie občana s mestom Košice


Úlohy:

- Zistite, čo je to Natural Language Understanding. Napíšte o tom správu na 2 strany.
- Prečítajte si BP Samuel Horáni. https://opac.crzp.sk/?fn=detailBiblioForm&sid=A770A18E340C6018B48DE7BDD5C2 Napíšte čo ste sa dozvedeli.
- Prečítajte si článok https://link.springer.com/article/10.1007/s10462-022-10248-8 a napíšte, čo ste sa dozvedeli.
- Vyskúšajte si chatbota z repozitára https://git.kemt.fei.tuke.sk/sh662er/Rasa. 
Nainštalujte si https://pytorch.org/get-started/locally/
Nainštalujte si https://github.com/hladek/spacy-skmodel
- Skúste ho upraviť tak, aby dával informácie o meste Košice.


# Bakalárska práca 2023

Systém pre monitoring médií

Práca súvisí s [DP Michal Stromko](/students/2019/michal_stromko)

Návrh na zadanie:

- Navrhnite a implementuje systém pre extrakciu textu a metainfrmácií z webových stránok alebo sociálnych sietí
- Modifikujte agenta pre získavanie textu tak aby do databázy ukladal sledované webové stránky v pravidelných intervaloch.
- Aplikujte neurónovú sieť na klasifikáciu získaných článkov.

Analýza úlohy:

Chceme vytvoriť databázu novinových článkov. 

Pre článok chceme evidovať:

- zdroj
- autor
- titulok
- text rozdelený na odseky
- odkazy na iné články
- autorská sekcia
- autorské tagy alebo kľúčové slovíčka.
- perex
- dátum vydania.
- pôvodné html

Ku databáze chceme vytvoriť agenta ktorý by v pravidelných intervaloch dopĺňal nové články. Agenta pre zber textu stačí modifikovať. 

Ku databáze chceme vytvoriť webové rozhranie.

V databáze chceme vedieť vyhľadávať. 

Chceme vedieť automaticky zistiť tému článku.

Chceme automaticky zistiť sumár článku.

- Vyberte vhodnú databázu.
    - Postgres, Cassandra.
- Navrhnite schému.
- Modifikujte agenta pre zber textu.
- Implementujte webové rozhranie na prístup k databáze. 


Stretnutie 24.1.2022

Stav:

- Začiatok štúdia Python.
- Prečítané články: "COVID a kľúčové slová", o Elasticsearch.

Úlohy:

- Pokračovať v otvorených úlohách z 30.9.
- Zistite, čo je to systém RASA a ako pracuje.
- Skúste prejsť tutoriál https://rasa.com/blog/category/tutorials/
- Zvážiť zmenu témy na "RASA" dialógový systém.


Stretnutie 30.9.2022

Úlohy:

- [x] Prečítajte si záverečné práce J. Holp, M. Stromko.
- [ ] Nainštalujte si systém Anaconda. Naučte sa pracovať s virtuálnymi prostrediami.
- [x] Prejdite si Python tutoriál.
- [ ] Zistite ako pracuje agent pre zber textu - web crawler. Vyhľadajte odborné články alebo knihy na túto tému a urobte si poznámky.
- [ ] Oboznámte sa s kódom agenta websucker https://git.kemt.fei.tuke.sk/dano/websucker-pip.

Zásobník úloh:

- Pozrieť sa na https://github.com/microsoft/playwright-python
- Zistite, ako funguje knižnica BeautifulSoup, vypracujte tutoriál.
- Vypracujte prehľad literatúry na tému "Monitorovanie médií". Otvorte si google scholar, hyhľadajte heslo "news monitoring" , "social media monitoring". Vyberte články ktoré sa Vám zadajú zaujímavé, prečítajte si ch a napíšte na min. jednu stranu poznámky čo ste sa dozvedeli. Uveďte zdroje - názy článkov a autorov.
- Zistite si, čo je systém Elasticsearch a ako pracuje. Napíšte o tom správu na jednu stranu.
- Pomocou systému Docker si nainštalujte Elasticsearch 8.4
- Prejdite si tutoriál https://elasticsearch-dsl.readthedocs.io/en/latest/index.html
- Urobte si GIT repozitár, kde budeme dávať kódy.
z 2022-09-28 14:22:20 +00:00			`---`
			`title: Matej Kobyľan`
			`published: true`
			`taxonomy:`
			`category: [bp2023]`
zz 2022-09-29 07:34:37 +00:00			`tag: [ir]`
z 2022-09-28 14:22:20 +00:00			`author: Daniel Hladek`
			`---`

			`rok začiatku štúdia: 2020`

Update 'pages/students/2020/matej_kobylan/README.md' 2023-02-17 13:47:48 +00:00			`# Bakalárska práca 2024`

			`Cieľ: Vytvoriť dialógový systém pre podporu komunikácie občana s mestom Košice`


			`Úlohy:`

			`- Zistite, čo je to Natural Language Understanding. Napíšte o tom správu na 2 strany.`
			`- Prečítajte si BP Samuel Horáni. https://opac.crzp.sk/?fn=detailBiblioForm&sid=A770A18E340C6018B48DE7BDD5C2 Napíšte čo ste sa dozvedeli.`
			`- Prečítajte si článok https://link.springer.com/article/10.1007/s10462-022-10248-8 a napíšte, čo ste sa dozvedeli.`
			`- Vyskúšajte si chatbota z repozitára https://git.kemt.fei.tuke.sk/sh662er/Rasa.`
			`Nainštalujte si https://pytorch.org/get-started/locally/`
			`Nainštalujte si https://github.com/hladek/spacy-skmodel`
			`- Skúste ho upraviť tak, aby dával informácie o meste Košice.`



z 2022-09-28 14:22:20 +00:00			`# Bakalárska práca 2023`

			`Systém pre monitoring médií`

zz 2022-09-29 07:34:37 +00:00			`Práca súvisí s [DP Michal Stromko](/students/2019/michal_stromko)`

			`Návrh na zadanie:`
z 2022-09-28 14:22:20 +00:00
			`- Navrhnite a implementuje systém pre extrakciu textu a metainfrmácií z webových stránok alebo sociálnych sietí`
			`- Modifikujte agenta pre získavanie textu tak aby do databázy ukladal sledované webové stránky v pravidelných intervaloch.`
zz 2022-09-29 07:34:37 +00:00			`- Aplikujte neurónovú sieť na klasifikáciu získaných článkov.`

			`Analýza úlohy:`

			`Chceme vytvoriť databázu novinových článkov.`

			`Pre článok chceme evidovať:`

			`- zdroj`
			`- autor`
			`- titulok`
			`- text rozdelený na odseky`
			`- odkazy na iné články`
			`- autorská sekcia`
			`- autorské tagy alebo kľúčové slovíčka.`
			`- perex`
			`- dátum vydania.`
			`- pôvodné html`

Update 'pages/students/2020/matej_kobylan/README.md' 2023-01-24 08:04:06 +00:00			`Ku databáze chceme vytvoriť agenta ktorý by v pravidelných intervaloch dopĺňal nové články. Agenta pre zber textu stačí modifikovať.`
zz 2022-09-29 07:34:37 +00:00
			`Ku databáze chceme vytvoriť webové rozhranie.`

			`V databáze chceme vedieť vyhľadávať.`

			`Chceme vedieť automaticky zistiť tému článku.`

			`Chceme automaticky zistiť sumár článku.`
z 2022-09-28 14:22:20 +00:00
zz 2022-09-29 07:34:37 +00:00			`- Vyberte vhodnú databázu.`
			`- Postgres, Cassandra.`
			`- Navrhnite schému.`
			`- Modifikujte agenta pre zber textu.`
			`- Implementujte webové rozhranie na prístup k databáze.`
Update 'pages/students/2020/matej_kobylan/README.md' 2022-09-30 09:44:09 +00:00

Update 'pages/students/2020/matej_kobylan/README.md' 2023-01-24 08:04:06 +00:00			`Stretnutie 24.1.2022`

			`Stav:`

			`- Začiatok štúdia Python.`
			`- Prečítané články: "COVID a kľúčové slová", o Elasticsearch.`

			`Úlohy:`

			`- Pokračovať v otvorených úlohách z 30.9.`
			`- Zistite, čo je to systém RASA a ako pracuje.`
			`- Skúste prejsť tutoriál https://rasa.com/blog/category/tutorials/`
			`- Zvážiť zmenu témy na "RASA" dialógový systém.`


Update 'pages/students/2020/matej_kobylan/README.md' 2022-09-30 09:44:09 +00:00			`Stretnutie 30.9.2022`

			`Úlohy:`

Update 'pages/students/2020/matej_kobylan/README.md' 2023-01-24 08:07:20 +00:00			`- [x] Prečítajte si záverečné práce J. Holp, M. Stromko.`
			`- [ ] Nainštalujte si systém Anaconda. Naučte sa pracovať s virtuálnymi prostrediami.`
			`- [x] Prejdite si Python tutoriál.`
			`- [ ] Zistite ako pracuje agent pre zber textu - web crawler. Vyhľadajte odborné články alebo knihy na túto tému a urobte si poznámky.`
			`- [ ] Oboznámte sa s kódom agenta websucker https://git.kemt.fei.tuke.sk/dano/websucker-pip.`
Update 'pages/students/2020/matej_kobylan/README.md' 2022-09-30 09:44:09 +00:00
			`Zásobník úloh:`

Update 'pages/students/2020/matej_kobylan/README.md' 2023-01-24 08:07:20 +00:00			`- Pozrieť sa na https://github.com/microsoft/playwright-python`
Update 'pages/students/2020/matej_kobylan/README.md' 2023-01-24 08:04:06 +00:00			`- Zistite, ako funguje knižnica BeautifulSoup, vypracujte tutoriál.`
			`- Vypracujte prehľad literatúry na tému "Monitorovanie médií". Otvorte si google scholar, hyhľadajte heslo "news monitoring" , "social media monitoring". Vyberte články ktoré sa Vám zadajú zaujímavé, prečítajte si ch a napíšte na min. jednu stranu poznámky čo ste sa dozvedeli. Uveďte zdroje - názy článkov a autorov.`
			`- Zistite si, čo je systém Elasticsearch a ako pracuje. Napíšte o tom správu na jednu stranu.`
			`- Pomocou systému Docker si nainštalujte Elasticsearch 8.4`
			`- Prejdite si tutoriál https://elasticsearch-dsl.readthedocs.io/en/latest/index.html`
Update 'pages/students/2020/matej_kobylan/README.md' 2022-09-30 09:44:09 +00:00			`- Urobte si GIT repozitár, kde budeme dávať kódy.`