forked from KEMT/zpwiki
Update 'pages/students/2019/michal_stromko/README.md'
This commit is contained in:
parent
bf16cd8874
commit
75f985b727
@ -26,6 +26,22 @@ Ciele DP:
|
||||
- Dotrénovať slovenský ST model.
|
||||
- Porovnať viacero metód na vyhľadávanie v slovenskom texte - BM25, TF IDF, WordEmbedding, SentenceTransformers, Alebo iné embeddingy.
|
||||
|
||||
# Diplomovy projekt 1
|
||||
|
||||
|
||||
Ciele na semester (spoliu s K. Sopkovicom)
|
||||
|
||||
- Chceme rozbehat demoo vyhladavanie. Existuje streamlit verzia.
|
||||
- Chceme natrénovať a vyhodbnotiť model pre sémantické vyhľadávanie. Existuje prvá verzia sentence transformera (Cross Encoder, Dual Encoder natrénovaná na SK QUAD. Porovnať s STS SlovakBERT.
|
||||
- Chceme využiť aj QA model - využiť ho v deme.
|
||||
- Chcemem vyhodnotiť výkonnosť celého systému - všetky komponenty naraz. Aké sú možné metriky.
|
||||
- Vypracovať prehľad metód na vyhodnotenie IR systémov a kompletných systémov QA.
|
||||
- Preskúmať možnosti zlepšenia - Sentence Transformer skripty pre doménovú adaptáciu a multilinguálne modely.
|
||||
- Vypracovať prehľad článkov, ktoré riešia kompletné sémantické vyhľadávanie.
|
||||
- Podrobne opísať proces fungovania a trénovanie sentence transformera. Princíp dual-encoder, cross-encoder.
|
||||
- Pripraviť multi-lingual experiment na vyhľadávanie, napr. Angličtina, Slovenčina, Nemčina.
|
||||
|
||||
|
||||
|
||||
# Vedecky projekt 2022/23
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user