From 6f057f16e2e5746dd79f8a8ff3a3f58630fa71bb Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 4 Jun 2021 08:47:05 +0000 Subject: [PATCH] Update 'pages/students/2019/michal_stromko/README.md' --- pages/students/2019/michal_stromko/README.md | 18 +++++++++++++++++- 1 file changed, 17 insertions(+), 1 deletion(-) diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index 55b879ee..003ebfad 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -38,9 +38,25 @@ Zásobník úloh: Stretnutie 4.6. -- DOhodli sme sa na vytvorenyhľadávacieho systému za použitia crawlera, indexu a webového rozhrania. +- Dohodli sme sa na vytvorení vyhľadávacieho systému za použitia crawlera, indexu a webového rozhrania. - Vytvorený prístup na websucker-pip git, - Vytvorený prístup na idoc +- Pre vedúceho : vytvoriť prístup na cassandra, dorobiť deployment elasticsearch. + +Úlohy: + +- Zoznámiť sa so zdrojovými kódmi crawlera +- Prečítať si knihu "Learning to Rank for Information Retrieval and Natural Language Processing: Second Edition" +- Nainštalujte si u seba cassandru a vyskúšajte crawler, zistite ako pracuje Cassandra. +- Porozmmýšľajte, ako vytvoriť vyhľadávací index pre text uložený v cassandre. Index môže byť vytvorený pomocou elasticsearch alebo podobného systému. + +Do budúcnosti: + +- Zaindexovať texty +- Vytvoriť webové rozhranie pre vyhľadávací index. + + + Stretnutie 7.5.