forked from KEMT/zpwiki
Update 'pages/students/2019/michal_stromko/README.md'
This commit is contained in:
parent
75d6563d88
commit
4eaf719563
@ -43,13 +43,28 @@ Nápady na semester (spolu s K. Sopkovicom)
|
||||
- Pripraviť multi-lingual experiment na vyhľadávanie, napr. Angličtina, Slovenčina, Nemčina.
|
||||
- Vyskúšať vyhľadávanie v inej doméne (noviny, mestské dokumenty).
|
||||
|
||||
Stretnutie 27.3.2023
|
||||
|
||||
Stav:
|
||||
|
||||
- Jednoduché demo stremalit fuguje - vektorové vyhľadávanie pomocou transformers utils.semantic_search.
|
||||
- Cieľ: ku každému paragrafu vypočítať embedding pomocou mnlr. Poznačiť si dokument id. V prvom kroku ku otázke vyhľadať paragrafy. V druhom kroku ku otázke vyhľadať odpovede v paragrafoch. V treťom kroku zobraziť odpoveď na otázku aj najrelevantnejšie dokumenty.
|
||||
- Pokračovať v písomnej časti.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- util_semanticsearch vymentiť za qdrant alebo faiss alebo iné.
|
||||
- Určiť prah, na základe ktorého sa zistí, že odpoveď nie je v databáze.
|
||||
- Neskôr dorobiť "fallback" na "fuzzy" vyhľadávanie relevatných dokumentov.
|
||||
|
||||
|
||||
Stretnutie 20.2.2023
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Spravte QA demo pomocou streamlit. Najprv vytvorte faiss index, do pamäte nahrajte všetky paragrafy.
|
||||
- Dotaz transformuje na vektor. Nájdite 5 najlepších odsekov. Vykonajte QA na všety odseky. Zobrazte odseky. Zobrazte najlepšiu odpoveď a názov dokumentu kde sa nachádza.
|
||||
- Modely sa nachádzajú na HF TUKE-DeutscheTelekom.
|
||||
- [-] Spravte QA demo pomocou streamlit. Najprv vytvorte faiss index, do pamäte nahrajte všetky paragrafy.
|
||||
- [ ] Dotaz transformuje na vektor. Nájdite 5 najlepších odsekov. Vykonajte QA na všety odseky. Zobrazte odseky. Zobrazte najlepšiu odpoveď a názov dokumentu kde sa nachádza.
|
||||
- [ ] Modely sa nachádzajú na HF TUKE-DeutscheTelekom.
|
||||
|
||||
Zásobník:
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user