forked from KEMT/zpwiki
Update pages/students/2020/david_kostilnik/README.md
This commit is contained in:
parent
10c5517013
commit
fae1be974e
@ -18,14 +18,14 @@ Téma:
|
|||||||
Sémantické vyhľadávanie pomocou veľkých modelov
|
Sémantické vyhľadávanie pomocou veľkých modelov
|
||||||
|
|
||||||
- Tvorba datasetu prekladom, využitie existujúcich datasetov
|
- Tvorba datasetu prekladom, využitie existujúcich datasetov
|
||||||
- Dotrénovanie existujúceho modelu pomocou preloženého MS MARCO.
|
- Dotrénovanie existujúceho modelu typu BERT pomocou preloženého MS MARCO.
|
||||||
|
|
||||||
Ciele:
|
Ciele:
|
||||||
|
|
||||||
- Zlepšiť RAG.
|
- Zlepšiť RAG.
|
||||||
|
|
||||||
|
|
||||||
Stretnutie 29.1.2024
|
Stretnutie 29.10.2024
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
|
|
||||||
@ -34,12 +34,14 @@ Stav:
|
|||||||
Úlohy:
|
Úlohy:
|
||||||
|
|
||||||
|
|
||||||
- Podrobne si naštudujte a vyskúšajte framework Sentence Transformers. Využite Google Colab.
|
- Podrobne si naštudujte a vyskúšajte framework Sentence Transformers https://sbert.net/index.html. Využite Google Colab na príklady.
|
||||||
- Podrobne si naštudujte databázu MS MARCO. Zistite a vyskúšajte dotrénovanie anglického modelu na databáze MS Marco.
|
- Podrobne si naštudujte databázu MS MARCO. Zistite a vyskúšajte dotrénovanie anglického modelu typu BERT (bert, roberta, xlm, deberta ...) na databáze MS Marco.
|
||||||
|
- Píšte si poznámky o tom čo ste zistili o SBERT. Použite odkazy na vedecké články. Vedecké článkuý nájdete na Google Scholar.
|
||||||
|
|
||||||
Zásobník úloh:
|
Zásobník úloh:
|
||||||
|
|
||||||
- pracujte na servri quadro a prostredí Anaconda.
|
- pracujte na servri quadro a prostredí Anaconda.
|
||||||
|
- Natrénujte slovenský BERT model na preloženej databáze MS MARCO (WIP K. Sopkovič).
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
Loading…
Reference in New Issue
Block a user