zz
This commit is contained in:
parent
40d1fb9075
commit
f9104754e6
@ -1,11 +1,44 @@
|
||||
# Jakub Maruniak
|
||||
|
||||
*Rok začiatku štúdia*: 2016
|
||||
|
||||
## Diplomový projekt 1 2020
|
||||
|
||||
Úlohy na semester:
|
||||
|
||||
- Rozbehať anotačnú schému pre vyznačovanie slovenských pomenovaných entít
|
||||
- Vybrať a pripraviť vhodné dáta na anotáciu
|
||||
- Anotovať sadu dát
|
||||
- Natrénovať a vyhodnotiť model
|
||||
|
||||
|
||||
Stretnutie 9.3.2020:
|
||||
|
||||
Vyvorený prístup do repozitára https://git.kemt.fei.tuke.sk/dano/annotation
|
||||
|
||||
Úlohy na ďalšie stretnutie:
|
||||
|
||||
- Oboznámte sa s so [systémom Docker](https://student.kemt.fei.tuke.sk/predmety/zct)
|
||||
- Rozbehajte si anotáciu z repozitára
|
||||
- Skúste upraviť proces tak aby bol vhodný na anotáciu slovenských pomenovaných entít
|
||||
|
||||
Návrh možných entít na anotáciu:
|
||||
|
||||
- OSOBA
|
||||
- MIESTO alebo politická geografická entita
|
||||
- ORGANIZACIA
|
||||
- PRODUKT
|
||||
- INE
|
||||
|
||||
|
||||
|
||||
|
||||
## Tímový projekt 2019
|
||||
|
||||
#### Anotácia textových dát
|
||||
|
||||
*Úlohy tímového projektu*:
|
||||
|
||||
- Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing"
|
||||
- citujte min. 10 najvýznamnejších bibliografických zdrojov
|
||||
|
||||
@ -19,9 +52,11 @@
|
||||
4. Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.
|
||||
|
||||
*Návrh na názov DP*:
|
||||
|
||||
Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu
|
||||
|
||||
*Spolupráca s projektom*:
|
||||
|
||||
- [Podpora slovenčiny v Spacy](/topics/spacy)
|
||||
- [Anotácia textových dát](/topics/prodigy)
|
||||
- [Rozpoznávanie pomenovaných entít](/topics/named-entity)
|
||||
|
@ -1,7 +1,34 @@
|
||||
|
||||
# Lukáš Pokrývka
|
||||
|
||||
*Rok začiatku štúdia:* 2016
|
||||
|
||||
## Diplomový projekt 1 2020
|
||||
|
||||
Ulohy na semester:
|
||||
|
||||
- podrobne si naštudovať vybranú metódu trénovania neurónových sietí
|
||||
- identifikujte možný spôsob paralelizácie
|
||||
- natrénujte zvolený model metódou paralelizácie
|
||||
|
||||
|
||||
Stretnutie 9.3.2020
|
||||
|
||||
Úlohy na ďalšie stretnutie:
|
||||
|
||||
- Skúste natrénovať slovenský word2vec model podľa tutoriálu: http://spark.apache.org/docs/latest/ml-features.html#word2vec (podľa dát z emailu)
|
||||
- Pozrite si niečo o metóde BERT
|
||||
|
||||
- https://medium.com/huggingface/introducing-fastbert-a-simple-deep-learning-library-for-bert-models-89ff763ad384
|
||||
- https://github.com/huggingface/transformers
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
## Tímový projekt 2019
|
||||
|
||||
*Úlohy tímového projektu:*
|
||||
@ -12,6 +39,7 @@
|
||||
*Písomná práca:* [Paralelné spracovanie prirodzeného jazyka](./timovy_projekt)
|
||||
|
||||
## Diplomová práca 2021
|
||||
|
||||
### Paralelné trénovanie neurónových sietí
|
||||
|
||||
*Meno vedúceho:* Ing. Daniel Hládek, PhD.
|
||||
|
Loading…
Reference in New Issue
Block a user