forked from KEMT/zpwiki
		
	| .. | ||
| README.md | ||
| title | published | taxonomy | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Vladimír Ferko | true | 
  | 
rok začiatku štúdia: 2021
študent KPI, pracovník DTSS
Bakalárska práca 2024
Pokyny KPI ku záverečným prácam
Spolupráca: Eduard Matovka
Nadväzuje Martin Jancura
Predbežné zadanie - úlohy na semester:
- Vytvoriť slovenskú databázu diskusií. Databáza by mala byť prezentovateľná na konferencii a použiteľná pre rozpoznávanie nenávistnej reči.
 - zobrazte štatistiky získaných dát.
 - Anotovať sentiment diskusných príspevkov.
 - Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou.
 - Z nazbieraných dát zostavte a vyhodnoťte model
 
Stretnutie 29.6.2023
Stav:
- Je hotový skript pre zber diskusií z Facebooku. Skript je Python, Selenium a BS4.
 
Úlohy:
- Vykonať prieskum literatúry. Aké sú existujúce anglické a slovenské databázy na analýzu sentimentu? Ako sa klasifikuje sentiment pomocou neurónových sietí? Prieskum by mal mať niekoľko strán a mal by obsahovať odkazy na odbornú literatúru a iné zdroje.
 - Skript na stiahnutie s krátkym komentárom dajte na KEMT GIT. Repo nazvite BP2024
 - Vyskúšajte rozpoznávanie sentimentu pre slovenčinu pomocou existujúceho modelu Huggingface Transformers.
 - https://github.com/slovak-nlp/resources Tu pozrite zoznam modelov a datasetov pre sentiment
 - https://huggingface.co/kinit/slovakbert-sentiment-twitter Vyskúšajte tento model
 - V prípade potreby Vám viem prideliť prístup na školský server s GPU.