From caffd2ffd004958751e3554e52a1aab5512db09c Mon Sep 17 00:00:00 2001 From: Michal Stromko Date: Wed, 12 Oct 2022 08:00:48 +0000 Subject: [PATCH] Update 'pages/students/2019/michal_stromko/vp2023/articles/DensePassageRetrieval.md' --- .../vp2023/articles/DensePassageRetrieval.md | 8 ++++++++ 1 file changed, 8 insertions(+) diff --git a/pages/students/2019/michal_stromko/vp2023/articles/DensePassageRetrieval.md b/pages/students/2019/michal_stromko/vp2023/articles/DensePassageRetrieval.md index 20a49ffb26..d7d90fd851 100644 --- a/pages/students/2019/michal_stromko/vp2023/articles/DensePassageRetrieval.md +++ b/pages/students/2019/michal_stromko/vp2023/articles/DensePassageRetrieval.md @@ -2,3 +2,11 @@ ## Clanok č.1 ### Dense Passage Retriever (DPR) +- výskum tejto práce je zameraný na zlepšenie vyhľadávania v QA. +- pre používanie DPR je dôležité používať správny Encoder, ktorý mapuje text na dimenzionálne vektory skutočnej hodnoty a vytvára index __M__, ktorý sa používa pre vyhľadávanie +- pri behu DPR sa aplikuje iný Enkóder, ktorý mapuje vstupnú otázku na d-rozmerný vektor, a vyhľadáva podľa toho ktorý vektor je najbližšie k vektoru otázky. Podobnosť medzi otázkou a pasážou definujeme pomocou bodového súčinu ich vektorov. +- doležitou súčasťou takéhoto vyhľadávania je správne vypočítanie kosínusovej vzdialenosti. +- trénovanie Encodera sa vykonáva z dôvodu lepšieho vypočítania metrických údajov. +- cieľ trénovania je vytvorenie dvoch vektorov, tak aby tieto dve relevantné dvojice otázok a odpovedí mali najmenšiu vzdialenosť medzi sebou. +__Pozitívne a negatívne pasáže__ +- pri vyhľadávaní sa často stretávame s pozitívnymi výsledkami ktoré sú k dispozícii explicitne, zatiaľ čo negatívne výsledky je potrebné vybrať z veľkého súboru.