zpwiki

History

dano 6f057f16e2 Update 'pages/students/2019/michal_stromko/README.md'		2021-06-04 08:47:05 +00:00
..
vp2021	Nahrát soubory do „pages/students/2019/michal_stromko/vp2021/dokumentacia“	2021-05-02 11:51:05 +00:00
README.md	Update 'pages/students/2019/michal_stromko/README.md'	2021-06-04 08:47:05 +00:00

title

published

taxonomy

Michal Stromko

true

Vedecký projekt 2021

Návrh na zadanie bakalárskej práce:

Vypracujte teoretickú úvod do problematiky získavania informácií.
Navrhnite spôsob vytvorenia indexu vybranej databázy a implementujte vyhľadávanie.
Vykonajte niekoľko experimentov a identifikujte mesto pre zlepšenie vyhľadávania.

Podobná práca Ján Holp

Klaudové služby pre získavanie informácií

Cieľom projektu je zistiť ako fungujú klaudové služby pre umelú inteligenciu a ako fungujú webové vyhľadávače.

Úlohy:

Zistite čo je to získavanie informácií.
Oboznámte sa s Azure Cognitive Search a získajte prístup k službe. Pre prihlásenie môžete použiť Váše študentské prihlasovacie údaje.
Vypracujte minimálne jeden tutoriál pre prácu s Azure Cognitive Search.
Vypracujte krátky report na 2 strany kde napíšete čo ste robili a čo ste sa dozvedeli.

Zásobník úloh:

Stretnutie 4.6.

Dohodli sme sa na vytvorení vyhľadávacieho systému za použitia crawlera, indexu a webového rozhrania.
Vytvorený prístup na websucker-pip git,
Vytvorený prístup na idoc
Pre vedúceho : vytvoriť prístup na cassandra, dorobiť deployment elasticsearch.

Úlohy:

Zoznámiť sa so zdrojovými kódmi crawlera
Prečítať si knihu "Learning to Rank for Information Retrieval and Natural Language Processing: Second Edition"
Nainštalujte si u seba cassandru a vyskúšajte crawler, zistite ako pracuje Cassandra.
Porozmmýšľajte, ako vytvoriť vyhľadávací index pre text uložený v cassandre. Index môže byť vytvorený pomocou elasticsearch alebo podobného systému.

Do budúcnosti:

Stretnutie 7.5.

Stav:

Vytvorená SQL databáza pomocou az príkazov (SQL Database).
Nainštalované Azure Data Studio, vytvorená databáza študentov.
Vytvorený nový ACS index a naindexovaná databáza.
Azure Blob funguje iba cez Portál kvôli Location. Azure Data Storage. Všetky README sa dali do jedného súboru a to sa zaindexxovalo pomocou ACS.
Dokumetácia je rozsiahla, podmienky na zápočet sú splnené.

Stretnutie 23.4.

Stav:

vytvorené ACS pre vyhľadávanie vo vzorovej databáze hotelov.
vytvorený prázdny index pre vyhľadávanie na Wiki.
vytvorená databáza SQL Database - zatiaľ nefunguje. Chýba prístup na shell pre vytvorenie.
vytvorený Azure BLOB - zatiaľ nefunguje. Vytvorená tabuľka so základnými informáciami -id, meno,... Nefunguje indexovanie blobu - problém s názvami blobu.
zpwiki viem pridať do kontajnera - statický WEB blob kontajner.
Vyzerá to tak, že ACS priamo nepracuje s PostgreSQL ani s Mariadb

Možnosti:

Úlohy:

Zapracovať na indexovaní pomocou Azure SQL.
Porozmýšľať ako ďalej - chceme použiť hotové riešenie alebo niečo vymyslieť. Napríklad Elasticsearch - vyžaduje si Python, Javascript.

Stretnutie 9.4:

Stav:

Vytvorená sada tutoriálov o Azure a Azure Cognitive Search. Dobré na ZKT. Tutorály sú na GIthube.
Zistili sme, že ACS indexuje iba z Azure Storage.

Úlohy:

Vytvoriť pokusný Azure Storage zdroj. Môže to byť Azure Blob alebo Azure Table alebo Azure SQL.
Použiť indexer na indexovanie obsahu zdroja.
Zapísať postup do súboru MD.

Stretnutie 19.3

Stav:

Úlohy: