Update 'pages/students/2021/vladimir_ferko/README.md'
This commit is contained in:
parent
b013eae5ff
commit
1acf509cd5
@ -13,20 +13,30 @@ rok začiatku štúdia: 2021
|
|||||||
|
|
||||||
## Bakalárska práca 2024
|
## Bakalárska práca 2024
|
||||||
|
|
||||||
|
|
||||||
Spolupráca: [Eduard Matovka](/students/2021/eduard_matovka)
|
Spolupráca: [Eduard Matovka](/students/2021/eduard_matovka)
|
||||||
|
|
||||||
Nadväzuje [Martin Jancura](/students/2017/martin_jancura)
|
Nadväzuje [Martin Jancura](/students/2017/martin_jancura)
|
||||||
|
|
||||||
Tvorba slovenského webového korpusu diskusií
|
Predbežné zadanie - úlohy na semester:
|
||||||
|
|
||||||
- Zostavte zoznam kvalitných zdrojov slovenských textov.
|
- Vytvoriť slovenskú databázu diskusií. Databáza by mala byť prezentovateľná na konferencii a použiteľná pre rozpoznávanie nenávistnej reči.
|
||||||
- Nastavte agenta pre zber textu pre zber textu zo slovenského internetu.
|
- zobrazte štatistiky získaných dát.
|
||||||
- Vytvorte webovú aplikáciu pre sledovanie zberu.
|
- Anotovať sentiment diskusných príspevkov.
|
||||||
- Zo zozbieraného textu zostavte korpus a zobrazte štatistiky získaných dát.
|
- Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou.
|
||||||
- Z nazbieraných dát zostavte a vyhodnoťte model
|
- Z nazbieraných dát zostavte a vyhodnoťte model
|
||||||
|
|
||||||
|
|
||||||
|
Stretnutie 29.6.2023
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
|
|
||||||
Má skript pre zber z Facebooku.
|
- Je hotový skript pre zber diskusií z Facebooku. Skript je Python, Selenium a BS4.
|
||||||
|
|
||||||
|
Úlohy:
|
||||||
|
|
||||||
|
- Vykonať prieskum literatúry. Aké sú existujúce databázy na analýzu sentimentu? Ako sa klasifikuje sentiment pomocou neurónových sietí?
|
||||||
|
- Vyskúšajte rozpoznávanie sentimentu pre slovenčinu pomocou existujúceho modelu Huggingface Transformers.
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
Loading…
Reference in New Issue
Block a user