zpwiki/pages/students/2019/michal_stromko/vp2023/articles/DensePassageRetrieval.md

1.2 KiB

Dense Passage Retrieval for Open-Domain Question Answering

Clanok č.1

Dense Passage Retriever (DPR)

  • výskum tejto práce je zameraný na zlepšenie vyhľadávania v QA.
  • pre používanie DPR je dôležité používať správny Encoder, ktorý mapuje text na dimenzionálne vektory skutočnej hodnoty a vytvára index M, ktorý sa používa pre vyhľadávanie
  • pri behu DPR sa aplikuje iný Enkóder, ktorý mapuje vstupnú otázku na d-rozmerný vektor, a vyhľadáva podľa toho ktorý vektor je najbližšie k vektoru otázky. Podobnosť medzi otázkou a pasážou definujeme pomocou bodového súčinu ich vektorov.
  • doležitou súčasťou takéhoto vyhľadávania je správne vypočítanie kosínusovej vzdialenosti.
  • trénovanie Encodera sa vykonáva z dôvodu lepšieho vypočítania metrických údajov.
  • cieľ trénovania je vytvorenie dvoch vektorov, tak aby tieto dve relevantné dvojice otázok a odpovedí mali najmenšiu vzdialenosť medzi sebou. Pozitívne a negatívne pasáže
  • pri vyhľadávaní sa často stretávame s pozitívnymi výsledkami ktoré sú k dispozícii explicitne, zatiaľ čo negatívne výsledky je potrebné vybrať z veľkého súboru.