dmytro_ushatenko/pages/students/2021/vladimir_ferko/README.md

48 lines
1.7 KiB
Markdown
Raw Normal View History

2023-06-29 08:42:00 +00:00
---
title: Vladimír Ferko
published: true
taxonomy:
category: [bp2024]
tag: [dialog,nlp]
author: Daniel Hladek
---
rok začiatku štúdia: 2021
študent KPI, pracovník DTSS
## Bakalárska práca 2024
- [Projekt HateSpeech](/topics/hatespeech)
- [Pokyny KPI ku záverečným prácam](https://kpi.fei.tuke.sk/sk/zaverecne-prace)
- Spolupráca: [Eduard Matovka](/students/2021/eduard_matovka)
- Nadväzuje [Martin Jancura](/students/2017/martin_jancura)
2023-06-29 08:42:00 +00:00
Predbežné zadanie - úlohy na semester:
2023-06-29 08:42:00 +00:00
- Vytvoriť slovenskú databázu diskusií. Databáza by mala byť prezentovateľná na konferencii a použiteľná pre rozpoznávanie nenávistnej reči.
- zobrazte štatistiky získaných dát.
- Anotovať sentiment diskusných príspevkov.
- Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou.
2023-06-29 08:42:00 +00:00
- Z nazbieraných dát zostavte a vyhodnoťte model
Stretnutie 29.6.2023
2023-06-29 08:42:00 +00:00
Stav:
- Je hotový skript pre zber diskusií z Facebooku. Skript je Python, Selenium a BS4.
Úlohy:
- Vykonať prieskum literatúry. Aké sú existujúce anglické a slovenské databázy na analýzu sentimentu? Ako sa klasifikuje sentiment pomocou neurónových sietí? Prieskum by mal mať niekoľko strán a mal by obsahovať odkazy na odbornú literatúru a iné zdroje.
- Skript na stiahnutie s krátkym komentárom dajte na KEMT GIT. Repo nazvite BP2024
- Vyskúšajte rozpoznávanie sentimentu pre slovenčinu pomocou existujúceho modelu Huggingface Transformers.
- https://github.com/slovak-nlp/resources Tu pozrite zoznam modelov a datasetov pre sentiment
- https://huggingface.co/kinit/slovakbert-sentiment-twitter Vyskúšajte tento model
- V prípade potreby Vám viem prideliť prístup na školský server s GPU.
2023-06-29 08:42:00 +00:00