Update pages/students/2021/martin_sarissky/README.md
This commit is contained in:
parent
ff1a5042d3
commit
def0f4940a
@ -20,6 +20,15 @@ Ciele:
|
||||
- Vytvoriť sadu vzorových úloh pre vyhodnotenie takéhoto systému.
|
||||
- Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov.
|
||||
|
||||
Stretnutie 5.12.2025
|
||||
|
||||
- Zlepšenie parsovania a promptingu.
|
||||
- Funguje LangGraph pipeline - "router" vyberie index (API, FAISS alebo internet), podľa toho sa získajú dokumenty (40 nabližších). Tie sa filtrujú pomocou LM (na cca 5). Potom sa generuje sa odpoveď. Niekedy sa odfiltruje relevantný dokument (chunk) a model potom halucinuje.
|
||||
- Prerábal som chunkovanie html pre parsovanie dat. Chunk mal 512 tokenov. Prerábané kvoli vysvetlovaniu z akeho zakona, cisla, bodu… zakon je. Následne bolo potrebne preindexovanie. Model me5-large. Veľkosť indexu 26Gi. Avšak len html, prilohy neindexovane.
|
||||
- Nastavovanie promptu pre sumarizaciu čo použit(API, web search, faiss)
|
||||
- Úprava tresholdu a poctu dokumentov pre faiss retriever aby naslo spravne dokumenty a spravne odpovedl na otazku. Kazda odpoved ina a dobra v niecom, zla v niecom preto zistujem ako to upravit spravne. Vytvorenie pomocnych funkcii nieco ako router na filtrovanie zakonov, ktore sa vobec dostanu dalej na tvorbu odpovede
|
||||
- mozno bude treba iny model takze rechunk, reindex, rerank aby tam boli aj pdfka(to je dost podstatne). Povedat ze grafika 1 je obmedzena. skusit sa opytat na ine graficke karty lepsie. 1 - 30 hodin. 2,3,4 - 5 hodin cca
|
||||
|
||||
Stretnutie 27.11.2025
|
||||
|
||||
Stav:
|
||||
|
||||
Loading…
Reference in New Issue
Block a user