forked from KEMT/zpwiki
105 lines
3.2 KiB
Markdown
105 lines
3.2 KiB
Markdown
---
|
|
title: Michal Stromko
|
|
published: true
|
|
taxonomy:
|
|
category: [vp2021]
|
|
tag: [ir,cloud,demo,nlp]
|
|
author: Daniel Hladek
|
|
---
|
|
|
|
rok začiatku štúdia: 2019
|
|
|
|
## Vedecký projekt 2021
|
|
|
|
Návrh na zadanie bakalárskej práce:
|
|
|
|
1. Vypracujte teoretickú úvod do problematiky získavania informácií.
|
|
2. Navrhnite spôsob vytvorenia indexu vybranej databázy a implementujte vyhľadávanie.
|
|
3. Vykonajte niekoľko experimentov a identifikujte mesto pre zlepšenie vyhľadávania.
|
|
|
|
Podobná práca [Ján Holp](/students/2016/jan_holp)
|
|
|
|
|
|
Klaudové služby pre získavanie informácií
|
|
|
|
Cieľom projektu je zistiť ako fungujú klaudové služby pre umelú inteligenciu a ako fungujú webové vyhľadávače.
|
|
|
|
Úlohy:
|
|
|
|
- Zistite čo je to získavanie informácií.
|
|
- Oboznámte sa s Azure Cognitive Search a získajte prístup k službe. Pre prihlásenie môžete použiť Váše študentské prihlasovacie údaje.
|
|
- Vypracujte minimálne jeden tutoriál pre prácu s Azure Cognitive Search.
|
|
- Vypracujte krátky report na 2 strany kde napíšete čo ste robili a čo ste sa dozvedeli.
|
|
|
|
Zásobník úloh:
|
|
|
|
- Vytvorte index a vyhľadávanie na ZP Wiki.
|
|
- Napíšte tutoriál o tom ako ste to dokázali.
|
|
|
|
Stretnutie 4.6.
|
|
|
|
- DOhodli sme sa na vytvorenyhľadávacieho systému za použitia crawlera, indexu a webového rozhrania.
|
|
- Vytvorený prístup na websucker-pip git,
|
|
- Vytvorený prístup na idoc
|
|
|
|
|
|
Stretnutie 7.5.
|
|
|
|
Stav:
|
|
|
|
- Vytvorená SQL databáza pomocou az príkazov (SQL Database).
|
|
- Nainštalované Azure Data Studio, vytvorená databáza študentov.
|
|
- Vytvorený nový ACS index a naindexovaná databáza.
|
|
- Azure Blob funguje iba cez Portál kvôli Location. Azure Data Storage. Všetky README sa dali do jedného súboru a to sa zaindexxovalo pomocou ACS.
|
|
- [Dokumetácia](vp2021) je rozsiahla, podmienky na zápočet sú splnené.
|
|
|
|
Stretnutie 23.4.
|
|
|
|
Stav:
|
|
|
|
- vytvorené ACS pre vyhľadávanie vo vzorovej databáze hotelov.
|
|
- vytvorený prázdny index pre vyhľadávanie na Wiki.
|
|
- vytvorená databáza SQL Database - zatiaľ nefunguje. Chýba prístup na shell pre vytvorenie.
|
|
- vytvorený Azure BLOB - zatiaľ nefunguje. Vytvorená tabuľka so základnými informáciami -id, meno,... Nefunguje indexovanie blobu - problém s názvami blobu.
|
|
- zpwiki viem pridať do kontajnera - statický WEB blob kontajner.
|
|
- Vyzerá to tak, že ACS priamo nepracuje s PostgreSQL ani s Mariadb
|
|
|
|
Možnosti:
|
|
|
|
- Pokračovať v ceste pomocou ACS.
|
|
- Využiť Grav Plugin TNT Search.
|
|
- Vymyslieť niečo celkom iné.
|
|
|
|
Úlohy:
|
|
|
|
- Zapracovať na indexovaní pomocou Azure SQL.
|
|
- Porozmýšľať ako ďalej - chceme použiť hotové riešenie alebo niečo vymyslieť. Napríklad Elasticsearch - vyžaduje si Python, Javascript.
|
|
|
|
|
|
|
|
Stretnutie 9.4:
|
|
|
|
Stav:
|
|
- Vytvorená sada tutoriálov o Azure a Azure Cognitive Search. Dobré na ZKT. Tutorály sú na [GIthube](https://github.com/michal552703/Vedecky-projekt).
|
|
- Zistili sme, že ACS indexuje iba z Azure Storage.
|
|
|
|
Úlohy:
|
|
|
|
- Vytvoriť pokusný Azure Storage zdroj. Môže to byť Azure Blob alebo Azure Table alebo Azure SQL.
|
|
- Použiť indexer na indexovanie obsahu zdroja.
|
|
- Zapísať postup do súboru MD.
|
|
|
|
Stretnutie 19.3
|
|
|
|
Stav:
|
|
|
|
- Vytvorený prístup na Azure Portal
|
|
|
|
Úlohy:
|
|
|
|
- Vypracujte minimálne jeden tutoriál pre prácu s Azure Cognitive Search.
|
|
|
|
|
|
|
|
|