Update 'pages/students/2019/michal_stromko/README.md'

This commit is contained in:
dano 2021-06-04 08:47:05 +00:00
parent b01f76aa23
commit 6f057f16e2

View File

@ -38,9 +38,25 @@ Zásobník úloh:
Stretnutie 4.6. Stretnutie 4.6.
- DOhodli sme sa na vytvorenyhľadávacieho systému za použitia crawlera, indexu a webového rozhrania. - Dohodli sme sa na vytvorení vyhľadávacieho systému za použitia crawlera, indexu a webového rozhrania.
- Vytvorený prístup na websucker-pip git, - Vytvorený prístup na websucker-pip git,
- Vytvorený prístup na idoc - Vytvorený prístup na idoc
- Pre vedúceho : vytvoriť prístup na cassandra, dorobiť deployment elasticsearch.
Úlohy:
- Zoznámiť sa so zdrojovými kódmi crawlera
- Prečítať si knihu "Learning to Rank for Information Retrieval and Natural Language Processing: Second Edition"
- Nainštalujte si u seba cassandru a vyskúšajte crawler, zistite ako pracuje Cassandra.
- Porozmmýšľajte, ako vytvoriť vyhľadávací index pre text uložený v cassandre. Index môže byť vytvorený pomocou elasticsearch alebo podobného systému.
Do budúcnosti:
- Zaindexovať texty
- Vytvoriť webové rozhranie pre vyhľadávací index.
Stretnutie 7.5. Stretnutie 7.5.