forked from KEMT/zpwiki
		
	Update pages/students/2022/oleh_poiasnik/README.md
This commit is contained in:
		
							parent
							
								
									9e4799fc1d
								
							
						
					
					
						commit
						48f8d348b5
					
				| @ -12,6 +12,13 @@ rok začiatku štúdia: 2022 | |||||||
| 
 | 
 | ||||||
| # Bakalárska práca 2025 | # Bakalárska práca 2025 | ||||||
| 
 | 
 | ||||||
|  | Nové zadanie: | ||||||
|  | 
 | ||||||
|  | Chceme vytvoriť asistenta pre farmaceuta alebo zákazníka lekárne pre vyhľadávanie v príbalových letákoch. | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | Staré zadanie: | ||||||
|  | 
 | ||||||
| Vyhľadávanie právnych informácií pomocou neurónových sietí | Vyhľadávanie právnych informácií pomocou neurónových sietí | ||||||
| 
 | 
 | ||||||
| -    Oboznámte sa s existujúcimi modelmi pre vyhľadávanie v texte. | -    Oboznámte sa s existujúcimi modelmi pre vyhľadávanie v texte. | ||||||
| @ -30,6 +37,20 @@ Stav: | |||||||
| - ElasticSearch Python API | - ElasticSearch Python API | ||||||
| - vlastný skript na indexovanie pomocou SBERT | - vlastný skript na indexovanie pomocou SBERT | ||||||
| 
 | 
 | ||||||
|  | Úlohy: | ||||||
|  | 
 | ||||||
|  | - vhodné modely pre slovenský jazyk: me5-base pre vektorové vyhľadávanie. Ale ako použijete ES, tak nie je potrebný. Pre generovanie: je možné použiť OpenAI API alebo HuggingfaceAPI, má obmedzenie.  Otvorené modely: LLama3, RWKV, Sovenský Mistral 7B TBA. | ||||||
|  | - Na začiatok skúste rozbehať postup s PrivateGPT, OpenAI API a vyhľadávaním (pomocou ES alebo me5-base alebo OpenAI API - ADA embedding). | ||||||
|  | - Dáta dodá Kristián Sopkovič - cez Teams sa spojte. | ||||||
|  | - Pokračujte v štúdiu Python, Transformers.  Oboznámte sa s LangChain. | ||||||
|  | - Prečítajte si tento článok https://arxiv.org/abs/1908.10084 a urobte si poznámky. | ||||||
|  | 
 | ||||||
|  | Zásobník úloh: | ||||||
|  | 
 | ||||||
|  | - Urobte množinu na vhodnotenie. Vytvoríte množinu vzorových otázok a odpovedí. Vyhodnotte celý proces. | ||||||
|  | - Modely by mali bežať na našej infraštruktúre. Treba pripravť vhodný inferenčný server na našom HW, vybrať a dotrénovať vhodný model. | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
| Stretnutie 26.4.2024 | Stretnutie 26.4.2024 | ||||||
| 
 | 
 | ||||||
| Úlohy: | Úlohy: | ||||||
|  | |||||||
		Loading…
	
		Reference in New Issue
	
	Block a user