diff --git a/pages/students/2019/michal_stromko/vp2023/articles/DensePassageRetrieval.md b/pages/students/2019/michal_stromko/vp2023/articles/DensePassageRetrieval.md index 20a49ffb2..d7d90fd85 100644 --- a/pages/students/2019/michal_stromko/vp2023/articles/DensePassageRetrieval.md +++ b/pages/students/2019/michal_stromko/vp2023/articles/DensePassageRetrieval.md @@ -2,3 +2,11 @@ ## Clanok č.1 ### Dense Passage Retriever (DPR) +- výskum tejto práce je zameraný na zlepšenie vyhľadávania v QA. +- pre používanie DPR je dôležité používať správny Encoder, ktorý mapuje text na dimenzionálne vektory skutočnej hodnoty a vytvára index __M__, ktorý sa používa pre vyhľadávanie +- pri behu DPR sa aplikuje iný Enkóder, ktorý mapuje vstupnú otázku na d-rozmerný vektor, a vyhľadáva podľa toho ktorý vektor je najbližšie k vektoru otázky. Podobnosť medzi otázkou a pasážou definujeme pomocou bodového súčinu ich vektorov. +- doležitou súčasťou takéhoto vyhľadávania je správne vypočítanie kosínusovej vzdialenosti. +- trénovanie Encodera sa vykonáva z dôvodu lepšieho vypočítania metrických údajov. +- cieľ trénovania je vytvorenie dvoch vektorov, tak aby tieto dve relevantné dvojice otázok a odpovedí mali najmenšiu vzdialenosť medzi sebou. +__Pozitívne a negatívne pasáže__ +- pri vyhľadávaní sa často stretávame s pozitívnymi výsledkami ktoré sú k dispozícii explicitne, zatiaľ čo negatívne výsledky je potrebné vybrať z veľkého súboru.