diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index 55b879ee..003ebfad 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -38,9 +38,25 @@ Zásobník úloh: Stretnutie 4.6. -- DOhodli sme sa na vytvorenyhľadávacieho systému za použitia crawlera, indexu a webového rozhrania. +- Dohodli sme sa na vytvorení vyhľadávacieho systému za použitia crawlera, indexu a webového rozhrania. - Vytvorený prístup na websucker-pip git, - Vytvorený prístup na idoc +- Pre vedúceho : vytvoriť prístup na cassandra, dorobiť deployment elasticsearch. + +Úlohy: + +- Zoznámiť sa so zdrojovými kódmi crawlera +- Prečítať si knihu "Learning to Rank for Information Retrieval and Natural Language Processing: Second Edition" +- Nainštalujte si u seba cassandru a vyskúšajte crawler, zistite ako pracuje Cassandra. +- Porozmmýšľajte, ako vytvoriť vyhľadávací index pre text uložený v cassandre. Index môže byť vytvorený pomocou elasticsearch alebo podobného systému. + +Do budúcnosti: + +- Zaindexovať texty +- Vytvoriť webové rozhranie pre vyhľadávací index. + + + Stretnutie 7.5.