forked from KEMT/zpwiki
zz
This commit is contained in:
parent
945f0ec273
commit
3360fc9987
@ -13,8 +13,20 @@ rok začiatku štúdia: 2020
|
|||||||
|
|
||||||
Téma: Systém pre rozpoznávanie nenávistnej reči v online diskusiách
|
Téma: Systém pre rozpoznávanie nenávistnej reči v online diskusiách
|
||||||
|
|
||||||
Úloha:
|
Súvisí s PhD prácou [Manohar Gowdru Shridhara](students/2021/manohar_gowdru_shridharu)
|
||||||
|
|
||||||
|
Návrh na zadanie:
|
||||||
|
|
||||||
|
- Preštudovať teóriu.
|
||||||
- Zopakovať jednoduchý experiment pre rozpoznávanie nenávistnej reči v anglickom jazyku s pomocou frameworku HuggingFace transformers.
|
- Zopakovať jednoduchý experiment pre rozpoznávanie nenávistnej reči v anglickom jazyku s pomocou frameworku HuggingFace transformers.
|
||||||
- Vypracovať webové demo
|
- Vypracovať webové demo.
|
||||||
|
|
||||||
|
Úlohy:
|
||||||
|
|
||||||
|
- Zistiť ako funguje model BERT. Napísať o tom správu na 2 strany. Priložiť odkazy na odborné články.
|
||||||
|
- Nainštalovať si HuggingFace Transformers a vypracovať tutoriál. HF Transformers bude vyžadovať CUDA a Pytorch. Dostupné to je na školskom servri.
|
||||||
|
- Vyskúšať a preštudovať tieto modely
|
||||||
|
- https://huggingface.co/Hate-speech-CNERG/dehatebert-mono-english
|
||||||
|
- https://huggingface.co/Narrativa/byt5-base-tweet-hate-detection
|
||||||
|
- Prečítať a napísať poznámky na jednu stranu.
|
||||||
|
- https://arxiv.org/abs/2004.06465
|
||||||
|
@ -3,7 +3,7 @@ title: Matej Kobyľan
|
|||||||
published: true
|
published: true
|
||||||
taxonomy:
|
taxonomy:
|
||||||
category: [bp2023]
|
category: [bp2023]
|
||||||
tag: []
|
tag: [ir]
|
||||||
author: Daniel Hladek
|
author: Daniel Hladek
|
||||||
---
|
---
|
||||||
|
|
||||||
@ -13,9 +13,46 @@ rok začiatku štúdia: 2020
|
|||||||
|
|
||||||
Systém pre monitoring médií
|
Systém pre monitoring médií
|
||||||
|
|
||||||
|
Práca súvisí s [DP Michal Stromko](/students/2019/michal_stromko)
|
||||||
|
|
||||||
|
Návrh na zadanie:
|
||||||
|
|
||||||
- Navrhnite a implementuje systém pre extrakciu textu a metainfrmácií z webových stránok alebo sociálnych sietí
|
- Navrhnite a implementuje systém pre extrakciu textu a metainfrmácií z webových stránok alebo sociálnych sietí
|
||||||
- Modifikujte agenta pre získavanie textu tak aby do databázy ukladal sledované webové stránky v pravidelných intervaloch.
|
- Modifikujte agenta pre získavanie textu tak aby do databázy ukladal sledované webové stránky v pravidelných intervaloch.
|
||||||
- Aplikujte neurónovú sieť na klasifikáciu získaných článkov.
|
- Aplikujte neurónovú sieť na klasifikáciu získaných článkov.
|
||||||
|
|
||||||
|
Analýza úlohy:
|
||||||
|
|
||||||
|
Chceme vytvoriť databázu novinových článkov.
|
||||||
|
|
||||||
|
Pre článok chceme evidovať:
|
||||||
|
|
||||||
|
- zdroj
|
||||||
|
- autor
|
||||||
|
- titulok
|
||||||
|
- text rozdelený na odseky
|
||||||
|
- odkazy na iné články
|
||||||
|
- autorská sekcia
|
||||||
|
- autorské tagy alebo kľúčové slovíčka.
|
||||||
|
- perex
|
||||||
|
- dátum vydania.
|
||||||
|
- pôvodné html
|
||||||
|
|
||||||
|
Ku databáze chceme vytvoriť agenta ktorý by v pravidelnýchh intervaloch dopĺňal nové články. Agenta pre zber textu stačí modifikovať.
|
||||||
|
|
||||||
|
Ku databáze chceme vytvoriť webové rozhranie.
|
||||||
|
|
||||||
|
V databáze chceme vedieť vyhľadávať.
|
||||||
|
|
||||||
|
Chceme vedieť automaticky zistiť tému článku.
|
||||||
|
|
||||||
|
Chceme automaticky zistiť sumár článku.
|
||||||
|
|
||||||
|
Úlohy:
|
||||||
|
|
||||||
|
- Vypracujte prehľad literatúry na tému "Monitorovanie médií".
|
||||||
|
- Vyberte vhodnú databázu.
|
||||||
|
- Postgres, Cassandra.
|
||||||
|
- Navrhnite schému.
|
||||||
|
- Modifikujte agenta pre zber textu.
|
||||||
|
- Implementujte webové rozhranie na prístup k databáze.
|
||||||
|
@ -13,15 +13,19 @@ rok začiatku štúdia: 2020
|
|||||||
|
|
||||||
Téma: Vyhľadávanie na slovenskej Wikipédii
|
Téma: Vyhľadávanie na slovenskej Wikipédii
|
||||||
|
|
||||||
|
|
||||||
Úloha: Implementovať jednoduchý systém na indexovanie článkov na slovenskej wikipédii a ich vyhľadávanie.
|
Úloha: Implementovať jednoduchý systém na indexovanie článkov na slovenskej wikipédii a ich vyhľadávanie.
|
||||||
|
|
||||||
|
Práca súvisí s:
|
||||||
|
|
||||||
|
- [DP Michal Stromko](/students/2019/michal_stromko)
|
||||||
|
- [BP Matej Kobyľan](/students/2020/matej_kobylan)
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
# Vedecký projekt 2022
|
# Vedecký projekt 2022
|
||||||
|
|
||||||
Extrakcia informácií z webových stránok
|
Extrakcia informácií z webových stránok
|
||||||
|
|
||||||
|
|
||||||
Finálny cieľ:
|
Finálny cieľ:
|
||||||
|
|
||||||
- Vytvoriť skript ktorý spracuje HTML kód a identifikuje zaujímavé časti z webstránky, napr. noviny alebo diskusie (modrý koník)
|
- Vytvoriť skript ktorý spracuje HTML kód a identifikuje zaujímavé časti z webstránky, napr. noviny alebo diskusie (modrý koník)
|
||||||
|
Loading…
Reference in New Issue
Block a user