forked from KEMT/zpwiki
Update 'pages/students/2019/filip_tomas/README.md'
This commit is contained in:
parent
d57316ea1c
commit
b06eb9c21c
@ -12,7 +12,7 @@ rok začiatku štúdia: 2019
|
||||
|
||||
DP sa prekladá na rok 2025
|
||||
|
||||
# Diplomová práca 2024
|
||||
# Diplomová práca 2024 - 2025
|
||||
|
||||
Zadanie:
|
||||
|
||||
@ -28,7 +28,32 @@ Ciel:
|
||||
|
||||
Spolupráca Michal Stromko, Kristián Sopkovič.
|
||||
|
||||
Stretnutie 3.5.2023
|
||||
Stretnutie 23.7.2024
|
||||
|
||||
Stav:
|
||||
|
||||
- Vytvorený jednoduchý index pomocou Milvus, indexovanie pomocou slovakbert-mnlr.
|
||||
- Zatiaľ slovakbert-mnlr vyzerá lepšie, ale treba to ešte vyskúšať.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Pokračujte pri vytváraní indexu pomocou Milvus- slovakbert-mnlr. Snažte sa zindexovať celú wikipédiu. Indexujte na úrovni odstavcov. Na uloženie textu môžete použiť súborový systém (urobte si funkciu ktorá namapuje ID na meno súboru). Alebo na uloženie použite databázu. Napríklad minio alebo sqlite.
|
||||
- Skripty dávajte na GIT.
|
||||
- Oboznámte sa s knižnicou LangChain, začnite tu https://python.langchain.com/v0.2/docs/tutorials/retrievers/
|
||||
- robte si písomné poznámky. študujte vedecké články (napr. z Arxiv). Odkaz na článok si poznačte a zapíšte si čo sa v článku píše.
|
||||
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- vyhľadávací systém môžete urobiť pomocou langchain alebo inej knižnice.
|
||||
- Pripravte deployment navrhnutého systému na k8s klaster.
|
||||
- skúste spustiť vyhľadávací systém na raspberry pi klastri.
|
||||
- zaindexujte slovenský internet.
|
||||
- Pripravte benchmark rýchlosti indexovania.
|
||||
- Pripravte webové rozhranie pre vyhľadávanie.
|
||||
|
||||
|
||||
Stretnutie 3.5.2024
|
||||
|
||||
Stav:
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user