110 lines
		
	
	
		
			3.7 KiB
		
	
	
	
		
			Markdown
		
	
	
	
	
	
			
		
		
	
	
			110 lines
		
	
	
		
			3.7 KiB
		
	
	
	
		
			Markdown
		
	
	
	
	
	
| ---
 | |
| title: Matej Kobyľan
 | |
| published: true
 | |
| taxonomy:
 | |
|     category: [bp2023]
 | |
|     tag: [ir]
 | |
|     author: Daniel Hladek
 | |
| ---
 | |
| 
 | |
| rok začiatku štúdia: 2020
 | |
| 
 | |
| # Bakalárska práca 2024
 | |
| 
 | |
| Cieľ: Vytvoriť dialógový systém pre podporu komunikácie občana s mestom Košice
 | |
| 
 | |
| 
 | |
| Úlohy:
 | |
| 
 | |
| - Zistite, čo je to Natural Language Understanding. Napíšte o tom správu na 2 strany.
 | |
| - Prečítajte si BP Samuel Horáni. https://opac.crzp.sk/?fn=detailBiblioForm&sid=A770A18E340C6018B48DE7BDD5C2 Napíšte čo ste sa dozvedeli.
 | |
| - Prečítajte si článok https://link.springer.com/article/10.1007/s10462-022-10248-8 a napíšte, čo ste sa dozvedeli.
 | |
| - Vyskúšajte si chatbota z repozitára https://git.kemt.fei.tuke.sk/sh662er/Rasa. 
 | |
| Nainštalujte si https://pytorch.org/get-started/locally/
 | |
| Nainštalujte si https://github.com/hladek/spacy-skmodel
 | |
| - Skúste ho upraviť tak, aby dával informácie o meste Košice.
 | |
| 
 | |
| 
 | |
| 
 | |
| # Bakalárska práca 2023
 | |
| 
 | |
| Systém pre monitoring médií
 | |
| 
 | |
| Práca súvisí s [DP Michal Stromko](/students/2019/michal_stromko)
 | |
| 
 | |
| Návrh na zadanie:
 | |
| 
 | |
| - Navrhnite a implementuje systém pre extrakciu textu a metainfrmácií z webových stránok alebo sociálnych sietí
 | |
| - Modifikujte agenta pre získavanie textu tak aby do databázy ukladal sledované webové stránky v pravidelných intervaloch.
 | |
| - Aplikujte neurónovú sieť na klasifikáciu získaných článkov.
 | |
| 
 | |
| Analýza úlohy:
 | |
| 
 | |
| Chceme vytvoriť databázu novinových článkov. 
 | |
| 
 | |
| Pre článok chceme evidovať:
 | |
| 
 | |
| - zdroj
 | |
| - autor
 | |
| - titulok
 | |
| - text rozdelený na odseky
 | |
| - odkazy na iné články
 | |
| - autorská sekcia
 | |
| - autorské tagy alebo kľúčové slovíčka.
 | |
| - perex
 | |
| - dátum vydania.
 | |
| - pôvodné html
 | |
| 
 | |
| Ku databáze chceme vytvoriť agenta ktorý by v pravidelných intervaloch dopĺňal nové články. Agenta pre zber textu stačí modifikovať. 
 | |
| 
 | |
| Ku databáze chceme vytvoriť webové rozhranie.
 | |
| 
 | |
| V databáze chceme vedieť vyhľadávať. 
 | |
| 
 | |
| Chceme vedieť automaticky zistiť tému článku.
 | |
| 
 | |
| Chceme automaticky zistiť sumár článku.
 | |
| 
 | |
| - Vyberte vhodnú databázu.
 | |
|     - Postgres, Cassandra.
 | |
| - Navrhnite schému.
 | |
| - Modifikujte agenta pre zber textu.
 | |
| - Implementujte webové rozhranie na prístup k databáze. 
 | |
| 
 | |
| 
 | |
| Stretnutie 24.1.2022
 | |
| 
 | |
| Stav:
 | |
| 
 | |
| - Začiatok štúdia Python.
 | |
| - Prečítané články: "COVID a kľúčové slová", o Elasticsearch.
 | |
| 
 | |
| Úlohy:
 | |
| 
 | |
| - Pokračovať v otvorených úlohách z 30.9.
 | |
| - Zistite, čo je to systém RASA a ako pracuje.
 | |
| - Skúste prejsť tutoriál https://rasa.com/blog/category/tutorials/
 | |
| - Zvážiť zmenu témy na "RASA" dialógový systém.
 | |
| 
 | |
| 
 | |
| Stretnutie 30.9.2022
 | |
| 
 | |
| Úlohy:
 | |
| 
 | |
| - [x] Prečítajte si záverečné práce J. Holp, M. Stromko.
 | |
| - [ ] Nainštalujte si systém Anaconda. Naučte sa pracovať s virtuálnymi prostrediami.
 | |
| - [x] Prejdite si Python tutoriál.
 | |
| - [ ] Zistite ako pracuje agent pre zber textu - web crawler. Vyhľadajte odborné články alebo knihy na túto tému a urobte si poznámky.
 | |
| - [ ] Oboznámte sa s kódom agenta websucker https://git.kemt.fei.tuke.sk/dano/websucker-pip.
 | |
| 
 | |
| Zásobník úloh:
 | |
| 
 | |
| - Pozrieť sa na https://github.com/microsoft/playwright-python
 | |
| - Zistite, ako funguje knižnica BeautifulSoup, vypracujte tutoriál.
 | |
| - Vypracujte prehľad literatúry na tému "Monitorovanie médií". Otvorte si google scholar, hyhľadajte heslo "news monitoring" , "social media monitoring". Vyberte články ktoré sa Vám zadajú zaujímavé, prečítajte si ch a napíšte na min. jednu stranu poznámky čo ste sa dozvedeli. Uveďte zdroje - názy článkov a autorov.
 | |
| - Zistite si, čo je systém Elasticsearch a ako pracuje. Napíšte o tom správu na jednu stranu.
 | |
| - Pomocou systému Docker si nainštalujte Elasticsearch 8.4
 | |
| - Prejdite si tutoriál https://elasticsearch-dsl.readthedocs.io/en/latest/index.html
 | |
| - Urobte si GIT repozitár, kde budeme dávať kódy.
 | |
| 
 |