diff --git a/pages/students/2019/david_stromp/README.md b/pages/students/2019/david_stromp/README.md index fd6db439..c17da1ec 100644 --- a/pages/students/2019/david_stromp/README.md +++ b/pages/students/2019/david_stromp/README.md @@ -1,8 +1,22 @@ -# Dávid Stromp - +--- +title: Dávid Stromp +published: true +taxonomy: + category: [bp2022] + tag: [ir,cassandra,nlp,cluster] + author: Daniel Hladek +--- Rok začiatku štúdia: 2019 -## Bakalársky projekt 2021 +# Bakalárska práca 2022 + +Návrh na zadanie: + +1. Vypracujte prehľad distribuovaných databáz alebo súborových systémov vhodných pre uloženie veľkého množstva textu. +2. Vyberte vhodný spôsob uloženia veľkého množstva webových stránok. +3. Nasaďte vybrané distribuované úložisko na testovací klaster pomocou systému Kubernetes. +4. Vykonajte sadu testov pre overenia priepustnosti operácií zápisov a čítania. +5. Identifikujte slabé miesta distribuovaného úložiska a navrhnite zlepšenia. Cieľ práce: @@ -10,6 +24,30 @@ Cieľ práce: - Implementovať algoritmus paralelného spracovania dokumentov v databáze Cassandra. - Implementovať algoritmus Page Rank alebo algoritmus jazykového modelu dokumentu. +## Bakalársky projekt 2021 + +Ciele: + +- Vytvoriť nasadenie distribuovanej databázy na testovaci K8S klaster. +- Implementovať algoritmus pre zoradenie (ranking) dokumentov v takejto databáze. + +Stretnutie 24.9. + +Úlohy: + +- Napíšte osnovu bakalárskej práce a pridajte do nej relevantné text čo máte. +- Pripravte Casasndra operator - na začiatok na Vašom počítači. (napr. microk8s, minikube). +- Dohodntite sa s Ing. Harahusom a získajte prístup ku RaspberryPi klastru. +- Naučte sa vkladať dáta do Cassandry a písať dotazy. + +Zásobník úloh: + +- Rozbehať crawler Websucker s Cassandrou. +- Implementovať PageRank. +- Napísať skript na indexovanie pomocou ElasticSearch. + + + Stretnutie 10.9. Úlohy: @@ -20,7 +58,3 @@ Stretnutie 10.9. - Naštudujte si článok http://ilpubs.stanford.edu:8090/422/ (Brin and Page). Zistite ako súvisí implementácia algorimtu PageRank s Cassandrou. Napíšte to do záznamu. - - - -