Compare commits
No commits in common. "90843ce241a7a036bbacbb1af91a8dcc909cc313" and "19ce4140e44d25b1b78f32081d25ed09d1983f63" have entirely different histories.
90843ce241
...
19ce4140e4
@ -1,11 +1,3 @@
|
|||||||
---
|
|
||||||
title: Dárius Lindvai
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [dp2021,bp2019]
|
|
||||||
tag: [nn,interpunction,nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Dárius Lindvai
|
# Dárius Lindvai
|
||||||
Rok začiatku štúdia: 2016
|
Rok začiatku štúdia: 2016
|
||||||
|
|
||||||
|
@ -1,11 +1,3 @@
|
|||||||
---
|
|
||||||
title: Dominik Nagy
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [dp2021,bp2019]
|
|
||||||
tag: [translation,nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Dominik Nagy
|
# Dominik Nagy
|
||||||
|
|
||||||
*Rok začiatku štúdia*: 2016
|
*Rok začiatku štúdia*: 2016
|
||||||
|
@ -1,14 +1,7 @@
|
|||||||
---
|
|
||||||
title: Jakub Maruniak
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [dp2021,bp2019]
|
|
||||||
tag: [spacy,ner,nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Jakub Maruniak
|
# Jakub Maruniak
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
*Rok začiatku štúdia*: 2016
|
*Rok začiatku štúdia*: 2016
|
||||||
|
|
||||||
## Diplomový projekt 2
|
## Diplomový projekt 2
|
||||||
|
@ -1,11 +1,3 @@
|
|||||||
---
|
|
||||||
title: Ján Holp
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [dp2021,bp2019]
|
|
||||||
tag: [ir,nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Ján Holp
|
# Ján Holp
|
||||||
|
|
||||||
*Rok začiatku štúdia*: 2016
|
*Rok začiatku štúdia*: 2016
|
||||||
|
@ -1,11 +1,4 @@
|
|||||||
---
|
|
||||||
title: Lukáš Pokrývka
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [dp2021,bp2019]
|
|
||||||
tag: [gpu,cloud]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Lukáš Pokrývka
|
# Lukáš Pokrývka
|
||||||
|
|
||||||
*Rok začiatku štúdia:* 2016
|
*Rok začiatku štúdia:* 2016
|
||||||
@ -132,4 +125,4 @@ Keďže som mal problém skript s plným korpusom spustiť na školskom serveri,
|
|||||||
|
|
||||||
*2. Natrénovanie slovenského modelu pomocou knižnice fasttext*
|
*2. Natrénovanie slovenského modelu pomocou knižnice fasttext*
|
||||||
|
|
||||||
Ako druhú možnosť na natrénovanie slovenského modelu som využil fasttext, knižnicu od Facebook-u. Prostredie a všetky dependencies som si vytvoril pomocou Anacondy. Následne som si naklonoval projekt z gitu (https://github.com/facebookresearch/fastText.git). Fasstext poskytuje jednoduchý nástroj na vyčistenie dát, ktorý všetky slová pretransformuje na lowercase a oddelí ich od čiarok, bodiek, atď... Následne je potrebné správne nastaviť spúšťacie parametre a zvoliť si metódu CBOW alebo skip-gram. V mojom prípade som zvolil 2-gram, dimenzionalitu vektorov 200, a nastavil som počet epochov na 10, pomocou ktorých sa vhybovosť výrazne znížila. Taktiež je možné nastaviť, koľko jadier procesora sa má využívať pre multi-threading. Na dátach o veľkosti približne 13GB trvalo trénovanie takmer 24 hodín. Výstupom su 2 súbory *.bin a *.vec. Prvý súbor obsahuje celý natrénovaný model a môže byť ďalej používaný a načítavaný podľa potreby, druhý súbor obsahuje vektory slov, jeden riadok pre každé slovo.
|
Ako druhú možnosť na natrénovanie slovenského modelu som využil fasttext, knižnicu od Facebook-u. Prostredie a všetky dependencies som si vytvoril pomocou Anacondy. Následne som si naklonoval projekt z gitu (https://github.com/facebookresearch/fastText.git). Fasstext poskytuje jednoduchý nástroj na vyčistenie dát, ktorý všetky slová pretransformuje na lowercase a oddelí ich od čiarok, bodiek, atď... Následne je potrebné správne nastaviť spúšťacie parametre a zvoliť si metódu CBOW alebo skip-gram. V mojom prípade som zvolil 2-gram, dimenzionalitu vektorov 200, a nastavil som počet epochov na 10, pomocou ktorých sa vhybovosť výrazne znížila. Taktiež je možné nastaviť, koľko jadier procesora sa má využívať pre multi-threading. Na dátach o veľkosti približne 13GB trvalo trénovanie takmer 24 hodín. Výstupom su 2 súbory *.bin a *.vec. Prvý súbor obsahuje celý natrénovaný model a môže byť ďalej používaný a načítavaný podľa potreby, druhý súbor obsahuje vektory slov, jeden riadok pre každé slovo.
|
@ -1,11 +1,3 @@
|
|||||||
---
|
|
||||||
title: Maroš Harahus
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [dp2021,bp2019]
|
|
||||||
tag: [spacy,nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Maroš Harahus
|
# Maroš Harahus
|
||||||
|
|
||||||
## Diplomový projekt 2 2020
|
## Diplomový projekt 2 2020
|
||||||
@ -13,7 +5,7 @@ taxonomy:
|
|||||||
Stretnutie 25.9.2020
|
Stretnutie 25.9.2020
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
- chyba pri použití príkazu pretrain, ktorá sa objavila s novou verziou Spacy
|
- chyba pri použití príkazu pretrain, kotrá sa objavila s novou verziou Spacy
|
||||||
|
|
||||||
Úlohy do ďalšieho stretnutia:
|
Úlohy do ďalšieho stretnutia:
|
||||||
- pokračovať so starou verziou Spacy (2.2)
|
- pokračovať so starou verziou Spacy (2.2)
|
||||||
|
@ -1,11 +1,3 @@
|
|||||||
---
|
|
||||||
title: Patrik Pavlišin
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [dp2021,bp2019]
|
|
||||||
tag: [translation,nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Patrik Pavlišin
|
# Patrik Pavlišin
|
||||||
|
|
||||||
## Bakalárksa práca 2019
|
## Bakalárksa práca 2019
|
||||||
|
@ -1,11 +1,3 @@
|
|||||||
---
|
|
||||||
title: Tomáš Kuchárik
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [dp2021]
|
|
||||||
tag: [annotation,question_answer,nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Tomáš Kuchárik
|
# Tomáš Kuchárik
|
||||||
(študent KPI)
|
(študent KPI)
|
||||||
|
|
||||||
|
@ -1,11 +1,3 @@
|
|||||||
---
|
|
||||||
title: Dmytro Ushatenko
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [bp2020]
|
|
||||||
tag: [chatobot,demo,nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Dmytro Ushatenko
|
# Dmytro Ushatenko
|
||||||
|
|
||||||
## Bakalárska práca 2020
|
## Bakalárska práca 2020
|
||||||
@ -45,4 +37,4 @@ Pomôcka pre začínajúcich študentov:
|
|||||||
V druom semestri:
|
V druom semestri:
|
||||||
|
|
||||||
- pripravíte si celé demo
|
- pripravíte si celé demo
|
||||||
- dookončíte prácu
|
- dookončíte prácu
|
@ -1,11 +1,3 @@
|
|||||||
---
|
|
||||||
title: Ediz Morochovič
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [bp2019]
|
|
||||||
tag: [ner,nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Ediz Morochovič
|
# Ediz Morochovič
|
||||||
|
|
||||||
Rok začiatku štúdia: 2016
|
Rok začiatku štúdia: 2016
|
@ -1,8 +1,8 @@
|
|||||||
---
|
---
|
||||||
title: Martin Jancura
|
title: Than Trung Thanh
|
||||||
published: true
|
published: true
|
||||||
taxonomy:
|
taxonomy:
|
||||||
category: [bp2021]
|
category: [2017,bp2021]
|
||||||
tag: [demo,nlp]
|
tag: [demo,nlp]
|
||||||
author: Daniel Hladek
|
author: Daniel Hladek
|
||||||
---
|
---
|
||||||
|
1
pages/students/2017/peter_malar/README.md
Normal file
1
pages/students/2017/peter_malar/README.md
Normal file
@ -0,0 +1 @@
|
|||||||
|
# Peter Maľar
|
@ -1,11 +1,3 @@
|
|||||||
---
|
|
||||||
title: Stanislav Matsunych
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [bp2020]
|
|
||||||
tag: [nn,lm,nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Stanislav Matsunych
|
# Stanislav Matsunych
|
||||||
|
|
||||||
## Bakalárska práca 2019
|
## Bakalárska práca 2019
|
||||||
|
@ -2,7 +2,7 @@
|
|||||||
title: Than Trung Thanh
|
title: Than Trung Thanh
|
||||||
published: true
|
published: true
|
||||||
taxonomy:
|
taxonomy:
|
||||||
category: [bp2021]
|
category: [2017,bp2021]
|
||||||
tag: [demo,nlp]
|
tag: [demo,nlp]
|
||||||
author: Daniel Hladek
|
author: Daniel Hladek
|
||||||
---
|
---
|
||||||
|
37
pages/students/2017/vzorny_student/README.md
Normal file
37
pages/students/2017/vzorny_student/README.md
Normal file
@ -0,0 +1,37 @@
|
|||||||
|
---
|
||||||
|
title: Vzorový študent 2017
|
||||||
|
taxonomy:
|
||||||
|
type: student
|
||||||
|
start_year: 2017
|
||||||
|
teacher: hladek
|
||||||
|
---
|
||||||
|
|
||||||
|
# Vzorový študent
|
||||||
|
|
||||||
|
Šablónu skopírujte do Vášho osobného profilu. Do hlavného nadpisu dajte Vaše meno. Nahraďte obyčajný text podľa inštrukcií, zvýraznený text a nadpisy nechajte ako sú.
|
||||||
|
|
||||||
|
*Rok začiatku štúdia*: uveďte rok začiatku štúdia.
|
||||||
|
|
||||||
|
Môžte pridať odkaz na Vašu osobnú stránku, fotografiu alebo zoznam Vašich osodných alebo odborných záujmov.
|
||||||
|
|
||||||
|
## Bakalárska práca 2019
|
||||||
|
|
||||||
|
*Názov bakalárskej práce*: Napíšte názov bakalárskej práce
|
||||||
|
|
||||||
|
*Meno vedúceho*: meno vedúceho
|
||||||
|
|
||||||
|
*Zadanie bakalárskej práce*: Tu napíšte zadanie Vašej bakalárskej práce
|
||||||
|
|
||||||
|
## Bakalársky projekt 2019
|
||||||
|
|
||||||
|
*Písomná práca* : [Názov písomnej práce](./bakalarsky_projekt) tu doplnte odkaz na Váš vypracovaný text.
|
||||||
|
|
||||||
|
*Výstupy bakalárskeho projektu*:
|
||||||
|
|
||||||
|
- odkaz na zdrojové kódy, ak sú nejaké
|
||||||
|
|
||||||
|
*Poznámky*:
|
||||||
|
|
||||||
|
- poznámky k vypracovaniu projektu (od vedúceho alebo Vaše), môžte ich dať aj ako podnadpis.
|
||||||
|
- užitočné odkazy, literatúra, nástroje
|
||||||
|
|
@ -0,0 +1,16 @@
|
|||||||
|
# Vzorový článok z Bakalárskeho projektu
|
||||||
|
|
||||||
|
Vysvetlite:
|
||||||
|
|
||||||
|
- na akej téme pracujete
|
||||||
|
- aký problém riešite
|
||||||
|
- aké prostriedky na riešenie sú k dispozícii
|
||||||
|
- aké prostriedky ste si zvolili na riešenie
|
||||||
|
- aké dáta ste spracovávali
|
||||||
|
- ako riešite zadaný problém
|
||||||
|
- aké výsledky ste dosiahli
|
||||||
|
|
||||||
|
Uveďte zoznam relevantnej odbornej literatúry
|
||||||
|
|
||||||
|
Uveďte aj odkaz na zdrojové kódy ktoré ste vytvorili
|
||||||
|
|
@ -1,9 +1 @@
|
|||||||
---
|
|
||||||
title: Ondrej Megela
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [2018,bp2021]
|
|
||||||
tag: [nlp]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
# Ondrej Megela
|
# Ondrej Megela
|
||||||
|
Loading…
Reference in New Issue
Block a user