Update 'pages/students/2016/jan_holp/dp2021/README.md'

2020-04-08 15:44:25 +00:00 · 2020-04-08 15:44:25 +00:00 · 1fcfed2822
commit 1fcfed2822
parent 38313d4412
1 changed files with 46 additions and 2 deletions
--- a/pages/students/2016/jan_holp/dp2021/README.md
+++ b/pages/students/2016/jan_holp/dp2021/README.md
@ -17,8 +17,52 @@ rozbaliť ho. Po rozbalení obsahu je potrebné otvoriť adresár kde máme nain
 ES. Konkrétne v adresári config vytvoríme nový adresár s názvom hunspell, v ňom
 ďalej vytvoríme adresár sk_SK. Do tohto adresára nakopírujeme súbory, ktoré sme
 získali rozbalením Hunspellu. Výsledná súborová štruktúru si môžeme pozrieť na
-obrázku 5-1 :
+obrázku :
+
+![Súborová štruktúra Hunspell](suborova_struktura.PNG)
+
+Pre správne fungovanie už potrebujeme len nastaviť analyzér správne. Dôležité
+je poradie v akom sa filtre budú aplikovať na text. Na obrázku si môžeme pozrieť
+kompletné nastavenie analyzéru(pozn. ES musí byť spustený). Ak je všetko správne
+ES nám odpovie hláškou "true". Ako definovať analyzér si môžeme pozrieť na obrázku :
+
+![Definícia analýzeru](def_analyzeru.PNG)
+
+### Mapping
+
+Po nastavení analyzéra potrebujeme ešte pred samotným indexovaním dát nastaviť mapping. Je dôležité nastaviť to na začiatku, kedže mapping už potom nie je
+možné upraviť. Bolo by potrebné zmazať celý index a nastaviť mapping znova. Pri
+mappingu potrebujeme vedieť, že každý článok bude obsahovať svoje jedinečné ID,
+názov(title) a telo(body) článku. Týmto poliam musíme definovať štruktúru, čiže ID
+bude typu integer, polia title a body budú typu text.
+
+### Indexovanie dát
+
+Na indexovanie použijeme pripravený zdrojový kód s názvom elasticsearch.js. Na
+spustenie javascript kód potrebujeme mať nainštalovaný program Nodejs, najlepšie
+v čo najnovšej verzii. Kód spustíme pomocou príkazového riadka zadaním príkazu:
+nodejs elasticsearch.js.
+Zdrojový kód načítava súbor, v ktorom sú všetky novinové články vo formáte
+JSON, kde jeden riadok je jeden JSON, čiže jeden novinový článok. Načítavanie
+prebieha po riadkoch, kde každému riadku je priradený index postupne v rozsahu 1
+až 4781. každý článok obsahuje jedinečné ID, názov a telo.
+Po spustení kódu sa nám zobrazí hláška, ktorá nás informuje o počte indexovaných článkov a vytvorí index s názvom "skweb", kde sa indexuje 4781 novinových
+článkov, ktorým budú priradené ID. Po úspešnom indexovaní môžeme začať dáta
+vyhľadávať. Ukážka správneho indexovania je na obrázku :
+
+![Ukážka indexovania](ukazka_indexovania.PNG)
+
+### Vyhľadávanie
+
+Po úspešnom indexovaní môžeme začať s vyhľadávaním. Musíme si pripraviť dotaz
+pre ES. Obrázok 5-4 znázorňuje komunikáciu s ES a vyhľadávanie pomocou neho.
+Odpoveď ES si môžeme pozrieť na obrázku. Sú tam zobrazené informácie
+o trvaní vyhľadávania v ms, počte nájdených dokumentov, indexe, v ktorom sa
+nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokumentu.
+
+![Vyhľadávanie](vyhladavanie.PNG)
+
+![Odpoveď]( odpoved.PNG)

-![](http://)