forked from KEMT/zpwiki
Update 'pages/students/2019/michal_stromko/README.md'
This commit is contained in:
parent
b6de5e9024
commit
23565f6494
@ -29,7 +29,7 @@ Ciele DP:
|
|||||||
# Diplomovy projekt 1
|
# Diplomovy projekt 1
|
||||||
|
|
||||||
|
|
||||||
Ciele na semester (spolu s K. Sopkovicom)
|
Nápady na semester (spolu s K. Sopkovicom)
|
||||||
|
|
||||||
- Chceme rozbehat demo vyhľadávanie. Existuje streamlit verzia.
|
- Chceme rozbehat demo vyhľadávanie. Existuje streamlit verzia.
|
||||||
- Chceme natrénovať a vyhodbnotiť model pre sémantické vyhľadávanie. Existuje prvá verzia sentence transformera (Cross Encoder, Dual Encoder natrénovaná na SK QUAD. Porovnať s STS SlovakBERT.
|
- Chceme natrénovať a vyhodbnotiť model pre sémantické vyhľadávanie. Existuje prvá verzia sentence transformera (Cross Encoder, Dual Encoder natrénovaná na SK QUAD. Porovnať s STS SlovakBERT.
|
||||||
@ -41,9 +41,24 @@ Ciele na semester (spolu s K. Sopkovicom)
|
|||||||
- Vypracovať prehľad článkov, ktoré riešia kompletné sémantické vyhľadávanie.
|
- Vypracovať prehľad článkov, ktoré riešia kompletné sémantické vyhľadávanie.
|
||||||
- Podrobne opísať proces fungovania a trénovanie sentence transformera. Princíp dual-encoder, cross-encoder.
|
- Podrobne opísať proces fungovania a trénovanie sentence transformera. Princíp dual-encoder, cross-encoder.
|
||||||
- Pripraviť multi-lingual experiment na vyhľadávanie, napr. Angličtina, Slovenčina, Nemčina.
|
- Pripraviť multi-lingual experiment na vyhľadávanie, napr. Angličtina, Slovenčina, Nemčina.
|
||||||
|
- Vyskúšať vyhľadávanie v inej doméne (noviny, mestské dokumenty).
|
||||||
|
|
||||||
|
Stretnutie 20.2.2023
|
||||||
|
|
||||||
|
Úlohy:
|
||||||
|
|
||||||
|
- Spravte QA demo pomocou streamlit. Najprv vytvorte faiss index, do pamäte nahrajte všetky paragrafy.
|
||||||
|
- Dotaz transformuje na vektor. Nájdite 5 najlepších odsekov. Vykonajte QA na všety odseky. Zobrazte odseky. Zobrazte najlepšiu odpoveď a názov dokumentu kde sa nachádza.
|
||||||
|
- Modely sa nachádzajú na HF TUKE-DeutscheTelekom.
|
||||||
|
|
||||||
|
Zásobník:
|
||||||
|
|
||||||
|
- Na uloženie odsekov a vektorov vyberte a použite vhodnú databázu (faiss, sqlite, qdrtant, jina ....).
|
||||||
|
- Implementujte stránkovanie (ak bude potrebné), zlepšite výzor.
|
||||||
|
|
||||||
|
|
||||||
Stretnutie 17.2.2022
|
|
||||||
|
Stretnutie 17.2.2023
|
||||||
|
|
||||||
Úlohy:
|
Úlohy:
|
||||||
|
|
||||||
|
Loading…
Reference in New Issue
Block a user