forked from KEMT/zpwiki
		
	Update 'pages/students/2019/michal_stromko/README.md'
This commit is contained in:
		
							parent
							
								
									bf16cd8874
								
							
						
					
					
						commit
						75f985b727
					
				| @ -26,6 +26,22 @@ Ciele DP: | ||||
| - Dotrénovať slovenský ST model. | ||||
| - Porovnať viacero metód na vyhľadávanie v slovenskom texte - BM25, TF IDF, WordEmbedding, SentenceTransformers, Alebo iné embeddingy. | ||||
| 
 | ||||
| # Diplomovy projekt 1 | ||||
| 
 | ||||
| 
 | ||||
| Ciele na semester (spoliu s K. Sopkovicom) | ||||
| 
 | ||||
| - Chceme rozbehat demoo vyhladavanie. Existuje streamlit verzia. | ||||
| - Chceme natrénovať a vyhodbnotiť model pre sémantické vyhľadávanie. Existuje prvá verzia sentence transformera (Cross Encoder, Dual Encoder natrénovaná na SK QUAD. Porovnať s STS SlovakBERT. | ||||
| - Chceme využiť aj QA model - využiť ho v deme. | ||||
| - Chcemem vyhodnotiť výkonnosť celého systému - všetky komponenty naraz. Aké sú možné metriky. | ||||
| - Vypracovať prehľad metód na vyhodnotenie IR systémov a kompletných systémov QA. | ||||
| - Preskúmať možnosti zlepšenia - Sentence Transformer skripty pre doménovú adaptáciu a multilinguálne modely. | ||||
| - Vypracovať prehľad článkov, ktoré riešia kompletné sémantické vyhľadávanie. | ||||
| - Podrobne opísať proces fungovania a trénovanie sentence transformera. Princíp dual-encoder, cross-encoder. | ||||
| - Pripraviť multi-lingual experiment na vyhľadávanie, napr. Angličtina, Slovenčina, Nemčina. | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| # Vedecky projekt 2022/23 | ||||
| 
 | ||||
|  | ||||
		Loading…
	
		Reference in New Issue
	
	Block a user