dp-zp-agent/data/documents.json

[
  {
    "path": "pages/interns/bogdan_paul_chis/README.md",
    "title": "Bogdan Paul Chiș",
    "categories": [
      "erasmus"
    ],
    "tags": [
      "nlp",
      "ie",
      "rag",
      "medical"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "erasmus"
      ],
      "tag": [
        "nlp",
        "ie",
        "rag",
        "medical"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Bogdan Paul Chiș",
      "published": true,
      "taxonomy": {
        "category": [
          "erasmus"
        ],
        "tag": [
          "nlp",
          "ie",
          "rag",
          "medical"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "ERASMUS Intern Spring 2026, 20 March - 21 May (62 days)\n\nTopic:\n\n(multilingual) Triplet extraction from medical data\n\nGoal:\n\n- Construct a knowledge graph from medical package inserts in multiple languages\n- Utilize the graph in an intelligent agent that recommends medication.\n\nTasks:\n\n- Learn intelligent agents and generative models - OpenAI API, Agent frameworks, RAG systems.\n- Learn about knowledge graphs and GraphRAG. Read several research papers.\n- Find several existing drug knowledge datab",
    "content_length": 1063
  },
  {
    "path": "pages/interns/cesar_gutierrez/README.md",
    "title": "Cesar Abascal Gutierrez",
    "categories": [
      "iaeste"
    ],
    "tags": [
      "ner",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "iaeste"
      ],
      "tag": [
        "ner",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Cesar Abascal Gutierrez",
      "published": true,
      "taxonomy": {
        "category": [
          "iaeste"
        ],
        "tag": [
          "ner",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "## Named entity annotations\n\nIntern, probably summer 2019\n\nCesar Abascal Gutierrez <cesarbielva1994@gmail.com>\n\n## Goals\n\n  - Be able to recognize unknown named entities\n  - Create a manually annotated training set from speech transcripts\n  - Propose an annotation schema\n\n\n## Plan\n\n  - Convert speech transcripts into a training set\n  - Train and evaluate classifier\n  - Establish manual annotation \n  - Select unannotated data \n\n### Data preparation\n\nInput: Transcriber transcripts with inconsisten",
    "content_length": 946
  },
  {
    "path": "pages/interns/oliver_pejic/README.md",
    "title": "Oliver Pejic",
    "categories": [
      "iaeste"
    ],
    "tags": [
      "hatespeech",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "iaeste"
      ],
      "tag": [
        "hatespeech",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Oliver Pejic",
      "published": true,
      "taxonomy": {
        "category": [
          "iaeste"
        ],
        "tag": [
          "hatespeech",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "Oliver Pejic\n\nIAESTE Intern Summer 2024, 12 weeks in August, September and October.\n\nGoal:\n \n- Help with the [Hate Speech Project](/topics/hatespeech)\n- Help with evaluation of sentence transformer models using toolkit [MTEB](https://github.com/embeddings-benchmark/mteb) \n\nFinal Tasks:\n\n- Prepare an MTEB evaluation task for [Slovak HATE speech](https://huggingface.co/datasets/TUKE-KEMT/hate_speech_slovak).\n- Prepare an MTEB evaluation task for [Slovak question answering](https://huggingface.co/d",
    "content_length": 2138
  },
  {
    "path": "pages/interns/sevval_bulburu/README.md",
    "title": "Sevval Bulburu",
    "categories": [
      "iaeste"
    ],
    "tags": [
      "hatespeech",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "iaeste"
      ],
      "tag": [
        "hatespeech",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Sevval Bulburu",
      "published": true,
      "taxonomy": {
        "category": [
          "iaeste"
        ],
        "tag": [
          "hatespeech",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "Sevval Bulburu\n\n\nIAESTE Intern Summer 2023, two months\n\nGoal: Help with the [Hate Speech Project](/topics/hatespeech)\n\nMeeting 12.10.2023\n\n[Github Repo with results](https://github.com/sevvalbulburu/Hate_Speech_Detection_Slovak)\n\nState:\n\n- Proposed and tried extra layers above BERT model to make a classifier in seriees of experiments. There is a  single sigmoid neuron on the output.\n- Manually adjusted the slovak HS dataset. Slovak dataset is not balanced. Tried some methods for \"balancing\" the ",
    "content_length": 4046
  },
  {
    "path": "pages/interns/yussef_ressaissi/README.md",
    "title": "Youssef Ressaissi",
    "categories": [
      "iaeste"
    ],
    "tags": [
      "summarization",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "iaeste"
      ],
      "tag": [
        "summarization",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Youssef Ressaissi",
      "published": true,
      "taxonomy": {
        "category": [
          "iaeste"
        ],
        "tag": [
          "summarization",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "IAESTE Intern Summer 2025, 1.7. - 31.8.2025\n\nGoal: Evaluate and improve language models for summarization in Slovak medical or legal domain.\n\nResults:\n\n- [Report](https://git.kemt.fei.tuke.sk/yr804he/summarization25/src/branch/main/)Evaluating%20and%20Improving%20Language%20Models%20for%20Summarization%20in%20the%20Slovak%20Medical%20Domain.pdf\n- [Repo, Počítanie objektívnych metrík](https://git.kemt.fei.tuke.sk/yr804he/summarization25)\n- Dotrénovanie Gemma, Slovak Mistral 7b na sumarizáciu: htt",
    "content_length": 5531
  },
  {
    "path": "pages/students/2016/darius_lindvai/README.md",
    "title": "Dárius Lindvai",
    "categories": [
      "dp2021",
      "bp2019"
    ],
    "tags": [
      "nn",
      "interpunction",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2021",
        "bp2019"
      ],
      "tag": [
        "nn",
        "interpunction",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Dárius Lindvai",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2021",
          "bp2019"
        ],
        "tag": [
          "nn",
          "interpunction",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Dárius Lindvai\nRok začiatku štúdia: 2016\n\nRepozitár so [zdrojovými kódmi](https://git.kemt.fei.tuke.sk/dl874wn/dp2021)\n\nNázov: Obnovenie interpunkcie pomocou hlbokých neurónových sietí\n\n1. Vypracujte prehľad metód na obnovenie interpunkcie pomocou neurónových sietí.\n2. Vyberte vhodnú metódu obnovenia interpunkcie pomocou neurónových sietí.\n3. Pripravte množinu dát na trénovanie neurónovej siete, navrhnite a vykonajte sadu experimentov s rôznymi parametrami.\n4. Vyhodnoťte experimenty a navrhnit",
    "content_length": 4690
  },
  {
    "path": "pages/students/2016/darius_lindvai/dp2021/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "## Update 05.06.2020\n- pridaný čas začiatku a čas ukončenia trénovania, aby bolo možné určit, ako dlho trénovanie trvalo\n- upravený skript na úpravu textu do vhodnej podoby (skombinoval som môj vlastný skript s jedným voľne dostupným na internete, aby bola úprava textu presnejšia)\n- pridaný tag na identifikáciu čísel v texte (\"N\"), čo by teoreticky mohlo zvýšiť presnosť modelu\n- vyriešený výpočet precision, recall a f-score (problém som vyriešil tak, že som najprv zo skutočných hodnôt urobil ten",
    "content_length": 1561
  },
  {
    "path": "pages/students/2016/darius_lindvai/timovy_projekt/resers/README.md",
    "title": "Novinky v oblasti “Punctuation Restoration”",
    "categories": [
      "tp2020"
    ],
    "tags": [
      "interpunction",
      "nlp"
    ],
    "published": true,
    "author": "Dárius Lindvai",
    "taxonomy": {
      "category": [
        "tp2020"
      ],
      "tag": [
        "interpunction",
        "nlp"
      ],
      "author": "Dárius Lindvai"
    },
    "metadata": {
      "title": "Novinky v oblasti “Punctuation Restoration”",
      "published": true,
      "taxonomy": {
        "category": [
          "tp2020"
        ],
        "tag": [
          "interpunction",
          "nlp"
        ],
        "author": "Dárius Lindvai"
      }
    },
    "content_preview": "# Novinky v oblasti “Punctuation Restoration”\n\nKeďže interpunkcia a veľké písmená v slovách nemajú vplyv na výslovnosť slov, sú z výstupu **ASR** (*automatic speech recognition = automatické rozpoznávanie reči*) odstraňované, výsledkom čoho sú iba sekvencie slov alebo písmen. Systémy vykonávajúce doplňovanie **interpunkčných znamienok** a veľkých písmen sú potrebné najmä preto, lebo tieto výstupy bez interpunkcie a veľkých písmen väčšinou pre ľudí nie sú zrozumiteľné (v textovej forme). Interpun",
    "content_length": 6437
  },
  {
    "path": "pages/students/2016/darius_lindvai/timovy_projekt/tutorial/README.md",
    "title": "PYTORCH - LSTM TUTORIÁL",
    "categories": [
      "tp2020"
    ],
    "tags": [
      "python",
      "lstm",
      "nn",
      "nlp",
      "pytorch",
      "anaconda"
    ],
    "published": true,
    "author": "Dárius Lindvai",
    "taxonomy": {
      "category": [
        "tp2020"
      ],
      "tag": [
        "python",
        "lstm",
        "nn",
        "nlp",
        "pytorch",
        "anaconda"
      ],
      "author": "Dárius Lindvai"
    },
    "metadata": {
      "title": "PYTORCH - LSTM TUTORIÁL",
      "published": true,
      "taxonomy": {
        "category": [
          "tp2020"
        ],
        "tag": [
          "python",
          "lstm",
          "nn",
          "nlp",
          "pytorch",
          "anaconda"
        ],
        "author": "Dárius Lindvai"
      }
    },
    "content_preview": "# PYTORCH - LSTM TUTORIÁL\n\n### Čo je to Pytorch?\n\n[Pytorch](https://pytorch.org/) je open-source knižnica založená na knižnici Torch a určená primárne na účely strojového učenia (*machine learning*) a hĺbkového učenia (*deep learning*). Táto knižnica sa najčastejšie používa v kombinácii s jazykom **Python**, avšak je možné ju použiť aj s jazykom C++. Jej najväčšie využitie je v oblasti Spracovania prirodzeného jazyka (NLP). Je vyvíjaná hlavne výskumným tímom Facebooku pre umelú inteligenciu (FAI",
    "content_length": 9167
  },
  {
    "path": "pages/students/2016/dominik_nagy/README.md",
    "title": "Dominik Nagy",
    "categories": [
      "dp2022",
      "bp2019"
    ],
    "tags": [
      "translation",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2022",
        "bp2019"
      ],
      "tag": [
        "translation",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Dominik Nagy",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2022",
          "bp2019"
        ],
        "tag": [
          "translation",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Dominik Nagy\n\n*Rok začiatku štúdia*: 2016\n\n## Diplomová práca 2022\n\n[GIT repozitár](https://git.kemt.fei.tuke.sk/dn161mb/dp2022)\n\n*Názov diplomovej práce*: Neurónový strojový preklad pomocou knižnice Fairseq\n\n*Meno vedúceho*: Ing. Daniel Hládek, PhD.\n\n*Zadanie diplomovej práce*: \n\n1. Vypracujte teoretický prehľad metód neurónového strojového prekladu.\n2. Podrobne opíšte vybranú metódu neurónového strojového prekladu. \n3. Natrénujte viacero modelov pre strojový preklad pomocou nástroja Fairseq ",
    "content_length": 6053
  },
  {
    "path": "pages/students/2016/dominik_nagy/timovy_projekt/README.md",
    "title": "Sequence-to-sequence",
    "categories": [
      "tp2020"
    ],
    "tags": [
      "nn",
      "seq2seq",
      "translation",
      "nlp"
    ],
    "published": true,
    "author": "Dominik Nagy",
    "taxonomy": {
      "category": [
        "tp2020"
      ],
      "tag": [
        "nn",
        "seq2seq",
        "translation",
        "nlp"
      ],
      "author": "Dominik Nagy"
    },
    "metadata": {
      "title": "Sequence-to-sequence",
      "published": true,
      "taxonomy": {
        "category": [
          "tp2020"
        ],
        "tag": [
          "nn",
          "seq2seq",
          "translation",
          "nlp"
        ],
        "author": "Dominik Nagy"
      }
    },
    "content_preview": "# Sequence-to-sequence\n\nHlboké neurónové siete (Deep Neural Networks – DNN) sú veľmi výkonné modely strojového\nučenia, ktoré sú určené na riešenie zložitých problémov, ako je rozpoznávanie reči či vizuálnych objekov.\nHlboké neurónové siete môžu vykonávať ľubobovoľný paralelný výpočet na malý počet krokov. Veľké\nDNN môžu byť trénované pokiaľ máme dostupné obrovské množstvo dát. Napriek svojej flexibilite a sile,\nhlboké neurónové siete sa dajú aplikovať iba na problémy, ktorých vstupy môžu byť roz",
    "content_length": 6275
  },
  {
    "path": "pages/students/2016/ediz_morochovic/README.md",
    "title": "Ediz Morochovič",
    "categories": [
      "bp2019"
    ],
    "tags": [
      "ner",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2019"
      ],
      "tag": [
        "ner",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Ediz Morochovič",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2019"
        ],
        "tag": [
          "ner",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Ediz Morochovič\n\nRok začiatku štúdia: 2016\n\n# Bakalárska práca 2019\n\nNázov bakalárskej práce: Štatistické rozpoznávanie pomenovaných entít\n\nMeno vedúceho: Ing. Daniel Hládek, PhD.\n\nZadanie bakalárskej práce: \n1. Vypracujte prehľad štatistických metód identifikácie pomenovaných entít v texte.\n2. Podrobne opíšte zvolenú metódu identifikácie pomenovaných entít v texte\n3. Zvoľte si vhodnú metodiku vyhodnotenia a na vhodnej testovacej množine navrhnite a vykonajte sadu experimentov.\n4. Na základe v",
    "content_length": 1236
  },
  {
    "path": "pages/students/2016/jakub_maruniak/README.md",
    "title": "Jakub Maruniak",
    "categories": [
      "dp2021",
      "bp2019"
    ],
    "tags": [
      "spacy",
      "ner",
      "annotation",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2021",
        "bp2019"
      ],
      "tag": [
        "spacy",
        "ner",
        "annotation",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Jakub Maruniak",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2021",
          "bp2019"
        ],
        "tag": [
          "spacy",
          "ner",
          "annotation",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Jakub Maruniak\n\n*Rok začiatku štúdia*: 2016\n\n*Návrh na názov DP*:\n\nAnotácia a rozpoznávanie pomenovaných entít v slovenskom jazyku.\n\n[CRZP](https://opac.crzp.sk/?fn=detailBiblioForm&sid=ECC3D3F0B3159C4F3217EC027BE4)\n\n1. Vypracujte teoretický úvod, kde vysvetlíte čo je to rozpoznávanie pomenovaných entít a akými najnovšími metódami sa robí. Vysvetlite, ako pracuje klasifikátor pre rozpoznávanie pomenovaných entít v knižnici Spacy. \n2. Pripravte postup na anotáciu textového korpusu pre systém Pr",
    "content_length": 8383
  },
  {
    "path": "pages/students/2016/jakub_maruniak/dp2021/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "## Diplomový projekt 2 2020\nStav:\n- aktualizácia anotačnej schémy (jedná sa o testovaciu schému s vlastnými dátami)\n- vykonaných niekoľko anotácii, trénovanie v Prodigy - nízka presnosť = malé množstvo anotovaných dát. Trénovanie v spacy zatiaľ nefunguje.\n- Štatistiky o množstve prijatých a odmietnutých anotácii získame z Prodigy: prodigy stats wikiart. Zatiaľ 156 anotácii (151 accept, 5 reject). Na získanie prehľadu o množstve anotácii jednotlivých entít potrebujeme vytvoriť skript.\n- Prehľad l",
    "content_length": 2188
  },
  {
    "path": "pages/students/2016/jakub_maruniak/dp2021/annotation/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "## Diplomový projekt 2 2020\n\n- vytvorenie a spustenie docker kontajneru\n\n\n```\n./build-docker.sh\nwinpty docker run --name prodigy -it -p 8080:8080 -v C://Users/jakub/Desktop/annotation-master/annotation/work prodigy bash\n```\n\n\n\n\n### Spustenie anotačnej schémy\n- `dataminer.csv` články stiahnuté z wiki\n- `cd ner`\n- `./01_text_to_sent.sh` spustenie skriptu *text_to_sent.py*, ktorý rozdelí články na jednotlivé vety\n- `./02_ner_manual.sh` spustenie manuálneho anotačného procesu pre NER  \n- `./03_expor",
    "content_length": 2413
  },
  {
    "path": "pages/students/2016/jakub_maruniak/dp2021/train_experiments/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "# Trénovacie experimenty\n\nDo tohto súboru sa budú postupne zapisovať štatistiky a poznámky ku vykonaným trénovacím experimentom.\n\nV rámci experimentu pracujeme s dvomi databázami:\n - Wikiart - vlastná anotovaná databáza článkov. Každý článok = 1 veta.\n - Skner - anotovaná databáza z https://skner.tukekemt.xyz/ . Počet viet v jednotlivých článkoch je rôzny.\n### Trénovanie Wikiart\n1. Experiment - trénovanie modelu pomocou databázy Wikiart\n\n![1.Wikiart](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/raw/",
    "content_length": 3261
  },
  {
    "path": "pages/students/2016/jakub_maruniak/timovy_projekt/README.md",
    "title": "Crowdsourcing",
    "categories": [
      "tp2020"
    ],
    "tags": [
      "annotation",
      "nlp"
    ],
    "published": true,
    "author": "Jakub Maruniak",
    "taxonomy": {
      "category": [
        "tp2020"
      ],
      "tag": [
        "annotation",
        "nlp"
      ],
      "author": "Jakub Maruniak"
    },
    "metadata": {
      "title": "Crowdsourcing",
      "published": true,
      "taxonomy": {
        "category": [
          "tp2020"
        ],
        "tag": [
          "annotation",
          "nlp"
        ],
        "author": "Jakub Maruniak"
      }
    },
    "content_preview": "**Crowdsourcing**\n\nČo je to crowdsourcing? Výraz _crowdsourcing_ bol prvý krát použitý v júni 2006, kedy editor magazínu Wired, Jeff Howe, vydal článok „The Rise of Crowdsourcing&quot; [1]. V tomto článku a v ďalších príspevkoch na svojom blogu popisuje novú organizačnú formu, koncept, pri ktorom je problém zadaný neznámej skupine riešiteľov. Zákazníci, alebo žiadatelia môžu uverejniť požadované úlohy na crowdsourcingovú platformu, kde dodávatelia – skupina, alebo jednotlivci vykonajú tieto úloh",
    "content_length": 15153
  },
  {
    "path": "pages/students/2016/jan_holp/README.md",
    "title": "Ján Holp",
    "categories": [
      "dp2021",
      "bp2019"
    ],
    "tags": [
      "ir",
      "nlp",
      "pagerank"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2021",
        "bp2019"
      ],
      "tag": [
        "ir",
        "nlp",
        "pagerank"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Ján Holp",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2021",
          "bp2019"
        ],
        "tag": [
          "ir",
          "nlp",
          "pagerank"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Ján Holp\n\n*Rok začiatku štúdia*: 2016\n\n## Diplomová práca 2021\n\n*Názov diplomovej práce*: Systém získavania informácií v slovenskom jazyku.\n\n*Meno vedúceho*:  Ing. Daniel Hládek, PhD.\n\n*Zadanie diplomovej práce*:\n\n1. Vypracujte prehľad metód ohodnotenia dokumentov v systémoch získavania informácií.\n2. Implementujte jednoduchý systém pre získavanie informácií v slovenskom jazyku, v ktorom využijete ohodnotenie dokumentov.\n3. Navrhnite a vypracujte experimenty, v ktorých vyhodnotíte vybrané metó",
    "content_length": 6713
  },
  {
    "path": "pages/students/2016/jan_holp/dp2021/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "#  Diplomový projekt 2020",
    "content_length": 25
  },
  {
    "path": "pages/students/2016/jan_holp/dp2021/zdrojove_subory/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "",
    "content_length": 0
  },
  {
    "path": "pages/students/2016/jan_holp/timovy_projekt/README.md",
    "title": "Získavanie informácií",
    "categories": [
      "tp2020"
    ],
    "tags": [
      "ir",
      "nlp"
    ],
    "published": true,
    "author": "Ján Holp",
    "taxonomy": {
      "category": [
        "tp2020"
      ],
      "tag": [
        "ir",
        "nlp"
      ],
      "author": "Ján Holp"
    },
    "metadata": {
      "title": "Získavanie informácií",
      "published": true,
      "taxonomy": {
        "category": [
          "tp2020"
        ],
        "tag": [
          "ir",
          "nlp"
        ],
        "author": "Ján Holp"
      }
    },
    "content_preview": "# Tímový projekt\n\n# Learning to Rank for Information Retrieval and Natural Language Processing \n\nAutor, Hang Li , v knihe  ukazuje rôzne problémy s hodnotením pri získavaní informácií a spracovaní v prirodzenom jazyku. Autor podáva podrobné vysvetlenia o učení sa pri tvorbe rebríčka a agregácií rebríčka, vrátane školení a testovania, hodnotenia, tvorby prvkov a hlavných prístupov. Na vytvorenie rebríčka bolo navrhnutých veľa metód. \n\n## Získavanie informácií \nZískavanie informácií (ang. Informat",
    "content_length": 7645
  },
  {
    "path": "pages/students/2016/lukas_pokryvka/README.md",
    "title": "Lukáš Pokrývka",
    "categories": [
      "dp2021",
      "bp2019"
    ],
    "tags": [
      "gpu",
      "cloud"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2021",
        "bp2019"
      ],
      "tag": [
        "gpu",
        "cloud"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Lukáš Pokrývka",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2021",
          "bp2019"
        ],
        "tag": [
          "gpu",
          "cloud"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Lukáš Pokrývka\n\n*Rok začiatku štúdia:* 2016\n\n\nNázov: Paralelné trénovanie neurónových sietí\n\n*Meno vedúceho:* Ing. Daniel Hládek, PhD.\n\n## Diplomová práca 2021\n\n1. Vypracujte prehľad literatúry na tému \"Paralelné trénovanie neurónových sietí\".\n2. Vyberte vhodnú metódu paralelného trénovania.\n3. Pripravte dáta a vykonajte sadu experimentov pre overenie funkčnosti a výkonu paralelného trénovania.\n4. Navrhnite možné zlepšenia paralelného trénovania neurónových sietí.\n\n\n\nStretnutie: 5.3.2021\n\nStav",
    "content_length": 9701
  },
  {
    "path": "pages/students/2016/lukas_pokryvka/dp2021/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "## Všetky skripty, súbory a konfigurácie\n\nhttps://github.com/pytorch/examples/tree/master/imagenet\n- malo by fungovat pre DDP, nedostupny imagenet subor z oficialnej stranky",
    "content_length": 173
  },
  {
    "path": "pages/students/2016/lukas_pokryvka/timovy_projekt/README.md",
    "title": "Paralelné spracovanie",
    "categories": [
      "tp2020"
    ],
    "tags": [
      "gpu",
      "nlp"
    ],
    "published": true,
    "author": "Lukáš Pokrývka",
    "taxonomy": {
      "category": [
        "tp2020"
      ],
      "tag": [
        "gpu",
        "nlp"
      ],
      "author": "Lukáš Pokrývka"
    },
    "metadata": {
      "title": "Paralelné spracovanie",
      "published": true,
      "taxonomy": {
        "category": [
          "tp2020"
        ],
        "tag": [
          "gpu",
          "nlp"
        ],
        "author": "Lukáš Pokrývka"
      }
    },
    "content_preview": "**Paralelné spracovanie**\n\nSystémy na spracovanie prirodzeného jazyka (_z angl. Natural Language Processing_ – ďalej už len NLP), boli ešte v nedávnej minulosti založené na sériových algoritmoch, ktoré simulovali spôsob, ktorým ľudia čítajú text – slovo za slovom, riadok po riadku [1]. Keďže týmto štýlom boli prezentované všetky gramatické teórie, programátori ich týmto štýlom aj implementovali.\n\nŽijeme v dobe, kedy jedno-jadrový výkon v dostupnom hardwari nemusí stačiť. Táto technológia má viac",
    "content_length": 11410
  },
  {
    "path": "pages/students/2016/mark_feher/README.md",
    "title": "Márk Fehér",
    "categories": [
      "dp2022"
    ],
    "tags": [
      "scikit",
      "nlp",
      "klasifikácia"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2022"
      ],
      "tag": [
        "scikit",
        "nlp",
        "klasifikácia"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Márk Fehér",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2022"
        ],
        "tag": [
          "scikit",
          "nlp",
          "klasifikácia"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Diplomová práca 2022\n\nNázov diplomovej práce: Klasifikácia textu metódami strojového učenia\n\n- [GIT repozitár](https://git.kemt.fei.tuke.sk/mf425hk/dp2022)\n\n## Návrh na zadanie DP\n\n1. Vypracujte prehľad metód klasifikácie textu metódami strojového učenia.\n2. Pripravte slovenské  trénovacie dáta vo vhodnom formáte a natrénujte viacero modelov pre klasifikáciu textu do viacerých kategórií\n3. Navrhnite, vykonajte a vyhodnoťte experimenty pre porovnanie presnosti klasifikácie textu. \n4. Navrhnite ",
    "content_length": 3445
  },
  {
    "path": "pages/students/2016/maros_harahus/README.md",
    "title": "Maroš Harahus",
    "categories": [
      "dp2021",
      "bp2019"
    ],
    "tags": [
      "spelling",
      "spacy",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2021",
        "bp2019"
      ],
      "tag": [
        "spelling",
        "spacy",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Maroš Harahus",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2021",
          "bp2019"
        ],
        "tag": [
          "spelling",
          "spacy",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Maroš Harahus\n\n- [Git repozitár ai4steel](https://git.kemt.fei.tuke.sk/ai4steel/ai4steel) (pre členov skupiny)\n- [GIT repozitár s poznámkami](https://git.kemt.fei.tuke.sk/mh496vd/Doktorandske) (súkromný)\n\n\n## Dizertačná práca\n\nv roku 2023/24\n\nAutomatické opravy textu a spracovanie prirodzeného jazyka\n\nCiele:\n\n- Zverejniť a obhájiť minimovku\n- Napísať dizertačnú prácu\n- Publikovať 2 články triedy Q2-Q3\n\nSúvisiaca BP [Vladyslav Krupko](/students/2020/vladyslav_krupko)\n\n\n## Druhý rok doktorandské",
    "content_length": 22377
  },
  {
    "path": "pages/students/2016/maros_harahus/timovy_projekt/README.md",
    "title": "Spracovanie prirodzeného jazyka",
    "categories": [
      "tp2020"
    ],
    "tags": [
      "spacy",
      "nlp"
    ],
    "published": true,
    "author": "Maroš Harahus",
    "taxonomy": {
      "category": [
        "tp2020"
      ],
      "tag": [
        "spacy",
        "nlp"
      ],
      "author": "Maroš Harahus"
    },
    "metadata": {
      "title": "Spracovanie prirodzeného jazyka",
      "published": true,
      "taxonomy": {
        "category": [
          "tp2020"
        ],
        "tag": [
          "spacy",
          "nlp"
        ],
        "author": "Maroš Harahus"
      }
    },
    "content_preview": "# NLP\n\nJe založený na umelej inteligencii, ktorá sa zaoberá interakciami medzi počítačom a jazykmi. NLP uľahčuje proces analýzy a\nporozumenia ľudského jazyka pre počítače a umelú inteligenciu. Pomáha extrahovať informácie z textu. V dnešnej dobe sa textové údaje vytvárajú vo veľkom množstve a je ich dôležité spravovať a odovzdať informácie z neštruktúrovaných údajov. Preto musíme údaje reprezentovať vo formáte v ktorom počítače rozumejú a v tomto prípade nám pomáha NLP. Má niekoľko prípadov použ",
    "content_length": 11694
  },
  {
    "path": "pages/students/2016/patrik_pavlisin/README.md",
    "title": "Patrik Pavlišin",
    "categories": [
      "dp2022",
      "bp2020",
      "tp2021"
    ],
    "tags": [
      "nmt",
      "translation",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2022",
        "bp2020",
        "tp2021"
      ],
      "tag": [
        "nmt",
        "translation",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Patrik Pavlišin",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2022",
          "bp2020",
          "tp2021"
        ],
        "tag": [
          "nmt",
          "translation",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Patrik Pavlišin\n\n# Diplomová práca 2022\n\n\nPredbežný názov: Neurónový strojový preklad\n\nNávrh na nástroje pre strojový preklad:\n\n- OpenNMT-py\n- Fairseq\n- Hugging Face Transformers\n\n\n## Návrh na zadanie diplomovej práce\n\n1. Pripraviť prehľad aktuálnych metód strojového  prekladu pomocou neurónových sietí. \n2. Vybrať konkrétnu metódu  strojového prekladu pomocou neurónových sietí a podrobne ju opísať.\n3. Pripraviť vybraný paralelný korpus do vhodnej podoby a pomocou vybranej metódy natrénovať mod",
    "content_length": 9132
  },
  {
    "path": "pages/students/2016/patrik_pavlisin/dp21/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "## Úvod\n\nNeurónový strojový preklad (NMT) je prístup k strojovému prekladu, ktorý využíva umelú neurónovú sieť na predpovedanie pravdepodobnosti postupnosti slov, typicky modelovaním celých viet v jednom integrovanom modeli. NMT nie je drastickým krokom nad rámec toho, čo sa tradične robí v štatistickom strojovom preklade (SMT). Štruktúra modelov je jednoduchšia ako frázové modely. Neexistuje žiadny samostatný jazykový model, prekladový model a model zmeny poradia, ale iba jeden sekvenčný model,",
    "content_length": 18073
  },
  {
    "path": "pages/students/2016/patrik_pavlisin/dp22/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "## Attention, The Transformer\n\n**Úvod**\n\nTransformer je modelová architektúra, ktorá sa vyhýba opakovaniu a namiesto toho sa úplne spolieha na mechanizmus pozornosti na kreslenie globálnych závislostí medzi vstupom a výstupom. Je to prvý transdukčný model, ktorý sa spolieha úplne na vlastnú pozornosť pri výpočte reprezentácii vstupu a výstupu bez použitia RNN (Recurrent Neural Network) alebo CNN (Convolution Neural Network). Používa sa predovšetkým v oblasti NLP (Natural Language Processing) a C",
    "content_length": 16734
  },
  {
    "path": "pages/students/2016/patrik_pavlisin/tp20/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "# Strojový preklad\n\n## Štatistický strojový preklad\n\nStrojový preklad je automatický preklad jednej, alebo skupiny viacerých viet jedného jazyka do druhého pomocou počítačov. Jedná sa o dôležitú aplikáciu v oblasti spracovania prirodzeného jazyka a záujem o toto odvetvie je takmer taký starý ako elektronický počítač. Štatistický strojový preklad zaznamenal za necelé dve desaťročia obrovský pokrok a v súčasnosti práve on dominuje v tejto oblasti výskumu. SMT využíva veľké množstvo paralelných kor",
    "content_length": 18821
  },
  {
    "path": "pages/students/2016/tomas_kucharik/README.md",
    "title": "Tomáš Kuchárik",
    "categories": [
      "dp2021",
      "dp2022"
    ],
    "tags": [
      "nmt",
      "translation",
      "question-answer",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2021",
        "dp2022"
      ],
      "tag": [
        "nmt",
        "translation",
        "question-answer",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Tomáš Kuchárik",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2021",
          "dp2022"
        ],
        "tag": [
          "nmt",
          "translation",
          "question-answer",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Tomáš Kuchárik\n(študent KPI)\n\nSúvisiace práce:\n\n- [Martin Jancura](/students/2017/martin_jancura)\n- [Patrik Pavlišin](/students/2016/patrik_pavlisin)\n- [Projekt SK QUAD](/topics/question)\n\n\n## Diplomová práca 2022\n\n[Repozitár s výsledkami](https://git.kemt.fei.tuke.sk/tk634rv/dp2022)\n\nNázov: Tvorba korpusu otázok a odpovedí v slovenskom jazyku pomocou strojového prekladu\n\nZadanie:\n\n1. Vypracujte prehľad jazykových mutácii overovacej množiny SQUAD a opíšte spôsob ich tvorby. \n2. Vypracujte preh",
    "content_length": 10464
  },
  {
    "path": "pages/students/2017/dmytro_ushatenko/README.md",
    "title": "Dmytro Ushatenko",
    "categories": [
      "bp2020"
    ],
    "tags": [
      "chatobot",
      "demo",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2020"
      ],
      "tag": [
        "chatobot",
        "demo",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Dmytro Ushatenko",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2020"
        ],
        "tag": [
          "chatobot",
          "demo",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Dmytro Ushatenko\n\n## Bakalárska práca 2020\n\n- [Repozitár](https://git.kemt.fei.tuke.sk/du707zr/BAKALRSKA_PRACA)\n- Názov: Jednoduchý chatbot v jazyku Python,\n\nZadanie bakalárskej práce:\n\n1. Vypracujte prehľad metód vytvárania dialógových systémov\n2. Na základe zvolenej metódy implementujte jednoduchý dialógový systém ktorý bude informovať o možnostiach štúdia na katedre.\n3. Identifikujte miesta možného zlepšenia navrhnutého  dialógového systému.\n\nCieľ: \n\nVytvorenie jednoduchého chatbota s použi",
    "content_length": 1208
  },
  {
    "path": "pages/students/2017/martin_jancura/README.md",
    "title": "Martin Jancura",
    "categories": [
      "bp2021",
      "dp2023"
    ],
    "tags": [
      "opennmt",
      "translation",
      "demo",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2021",
        "dp2023"
      ],
      "tag": [
        "opennmt",
        "translation",
        "demo",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Martin Jancura",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2021",
          "dp2023"
        ],
        "tag": [
          "opennmt",
          "translation",
          "demo",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Martin Jancura\n\n*Rok začiatku štúdia*:  2017\n\n## Diplomový projekt\n\n- [GIT repozitár](https://git.kemt.fei.tuke.sk/mj130zg/DP2023)\n- [DP Práca](https://opac.crzp.sk/?fn=detailBiblioForm&sid=E4E659F3575B0C5BCF0C726CCD36)\n\nNázov diplomovej práce: \n\nRozpoznávanie emócií v texte\n\nZadanie diplomovej práce:\n\n1. Vypracujte prehľad metód rozpoznávania sentimentu z textu.\n2. Vytvorte slovenskú overovaciu množinu pre rozpoznávanie sentimentu.\n3. Vyberte vhodný model pre rozpoznávanie sentimentu v sloven",
    "content_length": 12546
  },
  {
    "path": "pages/students/2017/stanislav_matsunych/README.md",
    "title": "Stanislav Matsunych",
    "categories": [
      "bp2020"
    ],
    "tags": [
      "nn",
      "lm",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2020"
      ],
      "tag": [
        "nn",
        "lm",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Stanislav Matsunych",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2020"
        ],
        "tag": [
          "nn",
          "lm",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Stanislav Matsunych\n\n## Bakalárska práca 2019\n\nGenerovanie a modelovanie prirodzeného jazyka pomocou rekurentných neurónových sietí\n\n- [Zdrojové texty BP](https://git.kemt.fei.tuke.sk/sm892rt/BC_Matsunych_2020_Final)\n- [CRZP](https://opac.crzp.sk/?fn=detailBiblioForm&sid=60B4917E3BAC23F10C7DAB27651C&seo=CRZP-detail-kniha)\n\n### Návrh na zadanie\n\n1. Vypracovať prehľad metód generovania prirodzeného jazyka pomocou rekurentných neurónových sietí\n2. Vyberte si vhodnú metódu na zostavenie modelu pri",
    "content_length": 2311
  },
  {
    "path": "pages/students/2017/than_trung_thanh/README.md",
    "title": "Than Trung Thanh",
    "categories": [
      "bp2021"
    ],
    "tags": [
      "demo",
      "nlp",
      "named entity",
      "ne",
      "spacy",
      "prodigy",
      "anotation"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2021"
      ],
      "tag": [
        "demo",
        "nlp",
        "named entity",
        "ne",
        "spacy",
        "prodigy",
        "anotation"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Than Trung Thanh",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2021"
        ],
        "tag": [
          "demo",
          "nlp",
          "named entity",
          "ne",
          "spacy",
          "prodigy",
          "anotation"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Than Trung Thanh \n\n## Bakalársky projekt 2020\n\nRozpoznávanie pomenovaných entít v slovenskom jazyku pomocou nástrojov Spacy a Prodigy\n\n- Tvorba korpusu a modelu pomocou nástrojov Spacy a Prodigy\n- Práca na internom projekte [rozpoznávanie pomenovaných entít](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/src/branch/master/pages/topics/named-entity).\n- Využite [existujúci model](https://git.kemt.fei.tuke.sk/dano/spacy-skmodel).\n\nPodobná práca:\n\n- [Jakub Maruniak](/students/2016/jakub_maruniak)\n\nCiel ",
    "content_length": 3799
  },
  {
    "path": "pages/students/2018/NaN1name_buday/README.md",
    "title": "Martin NaN1",
    "categories": [
      "bp2021"
    ],
    "tags": [
      "demo",
      "nlp",
      "nemo",
      "bert",
      "gpt"
    ],
    "published": true,
    "author": "Anton Buday",
    "taxonomy": {
      "category": [
        "bp2021"
      ],
      "tag": [
        "demo",
        "nlp",
        "nemo",
        "bert",
        "gpt"
      ],
      "author": "Anton Buday"
    },
    "metadata": {
      "title": "Martin NaN1",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2021"
        ],
        "tag": [
          "demo",
          "nlp",
          "nemo",
          "bert",
          "gpt"
        ],
        "author": "Anton Buday"
      }
    },
    "content_preview": "# Nan1_name \n\nRok začiatku štúdia: 2018\n\nPodmienkou pre získanie zápočtu je účasť na konzultácii min. raz za 2 týždne. Menej ako 6 konzultácií za semester je dôvod pre zníženie hodnotenia alebo neudelenie zápočtu.\nKomunikácia je možná aj cez MS Teams, Cisco Webex...\nKonzultačné hodiny sú podľa dohody, preferujem chat na MS Teams.\n\n\n## Bakalársky projekt 2020\n\nNázov: Využitie najnovších nástrojov v rámci prirodzeného spracovania reči\n\nCieľ:\n- Pokúsiť sa použiť slovenské dáta na spracovanie prirod",
    "content_length": 1939
  },
  {
    "path": "pages/students/2018/adrian_remias/README.md",
    "title": "Adrián Remiáš",
    "categories": [
      "dp2024"
    ],
    "tags": [
      "nlp",
      "transformers",
      "interpuction"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2024"
      ],
      "tag": [
        "nlp",
        "transformers",
        "interpuction"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Adrián Remiáš",
      "published": true,
      "date": "01-02-2014",
      "taxonomy": {
        "category": [
          "dp2024"
        ],
        "tag": [
          "nlp",
          "transformers",
          "interpuction"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Adrián Remiáš\n\nRok začiatku štúdia: 2018\n\n\n# Diplomová práca 2024\n\nNávrh na zadamie:\n\n1. Vypracujte prehľad metód obnovy interpunkcie v slovenskom jazyku.\n2. Vypracujte prehľad metód jazykového modelovania pomocou neurónovej siete typu Transformer.\n3. Pripravte dátovú množinu pre trénovanie a vyhodnotenie  neurónovej siete na úlohu dopĺňania a opravy interpunkcie.\n4. Vyberte viacero neurónových modelov, natrénujte ich na úlohu dopĺňania a opravy interpunkcie.\n5. Vyhodnoťte experimenty a vybert",
    "content_length": 6724
  },
  {
    "path": "pages/students/2018/david_ilas/README.md",
    "title": "Dávid Iľaš",
    "categories": [
      "dp2023"
    ],
    "tags": [
      "nlp",
      "emotion"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2023"
      ],
      "tag": [
        "nlp",
        "emotion"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Dávid Iľaš",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2023"
        ],
        "tag": [
          "nlp",
          "emotion"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "Rok začiatku štúdia: 2018\n\nUž neštuduje tento študijný program.\n\n## Diplomová práca 2023\n\nTéma: Rozpoznávanie emócií z textu.\n\nTODO: Návrh na zadanie diplomovej práce.\n\nCiele:\n\n- Vedieť klasifikovať emocionálny náboj v texte pomocou neurónovej siete.\n\nCiele na semester:\n\n- Získať prehľad v problematike rozpoznávania emócií z textu\n- Vybrať dátovú množinu, vybrať vhodný klasifikátor, natrénovať model a vyhodnotiť výsledky.\n\nInformácie:\n\n- [Hate speech Project](/topics/hatespeech)\n- https://www.sc",
    "content_length": 1101
  },
  {
    "path": "pages/students/2018/david_omasta/README.md",
    "title": "Dávid Omasta",
    "categories": [
      "dp2023",
      "dp2024"
    ],
    "tags": [
      "lm"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2023",
        "dp2024"
      ],
      "tag": [
        "lm"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Dávid Omasta",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2023",
          "dp2024"
        ],
        "tag": [
          "lm"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "Začiatok štúdia: 2018\n\nSúvisiace stránky:\n\n- [Question Answering](/topics/question) - interný projekt\n- Jozef Olekšák\n- Matej Čarňanský (BERT)\n- Ondrej Megela\n\n# Diplomová práca 2024\n\nVedúci: Daniel Hládek\n\nNávrh na názov:\n\nGeneratívne modely pre automatické odpovede na otázky v slovenskom jazyku\n\nNávrh na zadanie DP:\n\n- Vypracujte prehľad najnovších generatívnych neurónových jazykových modelov.\n- Vypracujte prehľad slovenských a multilinguálnych generatívnych jazykových modelov.\n- Navrhnite exp",
    "content_length": 6843
  },
  {
    "path": "pages/students/2018/martin_wencel/README.md",
    "title": "Martin Wencel",
    "categories": [
      "bp2021"
    ],
    "tags": [
      "demo",
      "nlp",
      "spacy"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2021"
      ],
      "tag": [
        "demo",
        "nlp",
        "spacy"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Martin Wencel",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2021"
        ],
        "tag": [
          "demo",
          "nlp",
          "spacy"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Martin Wencel \n\nRok začiatku štúdia: 2018\n\nPodmienkou pre získanie zápočtu je účasť na konzultácii min. raz za 2 týždne. Menej ako 6 konzultácií za semester je dôvod pre zníženie hodnotenia alebo neudelenie zápočtu.\nKomunikácia je možná aj cez [MS Teams](https://teams.microsoft.com/l/team/19%3aa8596a401a3842e5b91ac918a2a0afb1%40thread.tacv2/conversations?groupId=4fc0c627-d424-4587-b73a-2e47509862e9&tenantId=1c9f27ef-fee6-45f4-9a64-255a8c8e25a5).\nKonzultačné hodiny sú v piatok 9:20-14:00.\n\n## B",
    "content_length": 6446
  },
  {
    "path": "pages/students/2018/oleh_bilykh/README.md",
    "title": "Oleh Bilykh",
    "categories": [
      "bp2021"
    ],
    "tags": [
      "question-answer",
      "drqa",
      "qa",
      "demo",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2021"
      ],
      "tag": [
        "question-answer",
        "drqa",
        "qa",
        "demo",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Oleh Bilykh",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2021"
        ],
        "tag": [
          "question-answer",
          "drqa",
          "qa",
          "demo",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Oleh Bilykh\n\n*Začiatok štúdia: 2018*\n\nSúvisiace stránky:\n\n- [Ongrej Megela](/students/2018/bilykh) - RoBERTa\n- [Lukáš Pokrývka](/students/2016/pokryvka) - paralelné trénovanie\n- [Question Answering](/topics/question) - interný projekt\n- Matej Čarňanský (BERT)\n\n## Bakalárska práca 2021\n\nTéma:\n\nAutomatické generovanie odpovedí na otázky v prirodzenom jazyku pomocou neurónových sietí.\n\nNávrh na zadanie BP:\n\n- Vypracujte teoretický prehľad metód automatického generovania odpovede na otázky v priro",
    "content_length": 3887
  },
  {
    "path": "pages/students/2018/ondrej_megela/README.md",
    "title": "Ondrej Megela",
    "categories": [
      "bp2021",
      "dp2023"
    ],
    "tags": [
      "nlp",
      "fairseq",
      "lm",
      "bert",
      "question-answer",
      "qa"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2021",
        "dp2023"
      ],
      "tag": [
        "nlp",
        "fairseq",
        "lm",
        "bert",
        "question-answer",
        "qa"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Ondrej Megela",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2021",
          "dp2023"
        ],
        "tag": [
          "nlp",
          "fairseq",
          "lm",
          "bert",
          "question-answer",
          "qa"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Ondrej Megela \n\nZačiatok štúdia: 2018\n\nSúvisiace stránky:\n\n- [Oleh Bilykh](/students/2018/bilykh) - question answering\n- [Lukáš Pokrývka](/students/2016/pokryvka) - paralelné trénovanie\n- [Question Answering](/topics/question) - interný projekt\n- Matej Čarňanský (BERT)\n\n\nPozrieť toto: \n\nhttps://paperswithcode.com/task/text-generation?page=3\n\n# Diplomová práca 2023\n\n\nhttps://opac.crzp.sk/?fn=detailBiblioForm&sid=E4E659F3575B0C5BCF0F726CCD36\n\nNazov:\n\nAutomatické generovanie otázok v slovenskom j",
    "content_length": 16198
  },
  {
    "path": "pages/students/2018/samuel_sirotnik/README.md",
    "title": "Samuel Širotník",
    "categories": [
      "bp2021"
    ],
    "tags": [
      "raspberrypi",
      "cloud"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2021"
      ],
      "tag": [
        "raspberrypi",
        "cloud"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Samuel Širotník",
      "published": true,
      "date": "01-02-2014",
      "taxonomy": {
        "category": [
          "bp2021"
        ],
        "tag": [
          "raspberrypi",
          "cloud"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Samuel Širotník\n\nRok začiatku štúdia: 2018\n\n\n## Bakalárska práca 2020\n\n[Bakalárska práca na CRZP](https://opac.crzp.sk/?fn=detailBiblioForm&sid=CF9E62B1F4156FE3B62A0984D7C8)\n\nPráca úspešne obhájená. Odovzdaný klaster mal zle nakrimpované káble.\n\n\nPokusný Kubernetes klaster použitím  Raspberry Pi pre výuku klaudových technológií\n\n1. Vypracujte teoretický úvod do technológie Kubernetes.\n2. Vytvorte pokusný klaster pomocou viacerých modulov Raspberry Pi a nainštalujte na neho Kubernetes.\n3. Vypra",
    "content_length": 6040
  },
  {
    "path": "pages/students/2019/alina_vitko/README.md",
    "title": "Alina Vitko",
    "categories": [
      "bp2022"
    ],
    "tags": [
      "ir",
      "qa",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2022"
      ],
      "tag": [
        "ir",
        "qa",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Alina Vitko",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2022"
        ],
        "tag": [
          "ir",
          "qa",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2019\n\n# Bakalárska práca 2022\n\nSystémy pre generovanie odpovede na otázku v prirodzenom jazyku\n\n\n1. Vypracujte prehľad aktuálnych metód pre generovanie odpovede na otázku v prirodzenom jazyku.\n2. Vyberte a podrobne opíšte  existujúci systém pre generovanie odpovede na otázku v prirodzenom slovenskom jazyku.\n3. Vytvorte demonštračnú webovú aplikáciu pre vybraný systém.\n4. Navrhnite zlepšenia systému pre generovanie odpovede.\n\nStretnutie 8.4.\n\nProgres zatiaľ nenastal.\n\nÚlohy p",
    "content_length": 5503
  },
  {
    "path": "pages/students/2019/artem_yatsenko/README.md",
    "title": "Artem Yatsenko",
    "categories": [
      "bp2022"
    ],
    "tags": [
      "ner",
      "spacy",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2022"
      ],
      "tag": [
        "ner",
        "spacy",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Artem Yatsenko",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2022"
        ],
        "tag": [
          "ner",
          "spacy",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "Začiatok štúdia 2019\n\n# Bakalárska práca 2022\n\nNázov: Rozpoznávanie pomenovaných entít v slovenskom jazyku\n\nPomenované entity sú väčšinou vlastné podstatné mená v texte. Ich rozpoznanie nám pomôže určiť o čom text je. To sa často využíva v chatbotoch alebo vo vyhľadávaní v texte.\n\nNávrh na zadanie:\n\n1. Vypracujte prehľad metód pre rozpoznávanie pomenovaných entít v texte.\n2. Vyberte vhodnú metódu a natrénujte model pre rozpoznávanie pomenovaných entít.\n3. Vykonajte viacero experimentov a zistite",
    "content_length": 1450
  },
  {
    "path": "pages/students/2019/david_stromp/README.md",
    "title": "Dávid Stromp",
    "categories": [
      "bp2022"
    ],
    "tags": [
      "ir",
      "cassandra",
      "nlp",
      "cluster"
    ],
    "published": true,
    "author": "Maroš Harahus",
    "taxonomy": {
      "category": [
        "bp2022"
      ],
      "tag": [
        "ir",
        "cassandra",
        "nlp",
        "cluster"
      ],
      "author": "Maroš Harahus"
    },
    "metadata": {
      "title": "Dávid Stromp",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2022"
        ],
        "tag": [
          "ir",
          "cassandra",
          "nlp",
          "cluster"
        ],
        "author": "Maroš Harahus"
      }
    },
    "content_preview": "Rok začiatku štúdia: 2019\n\n# Bakalárska práca 2022\n\nNávrh na zadanie:\n\n1. Vypracujte prehľad distribuovaných databáz alebo súborových systémov vhodných pre uloženie veľkého množstva textu.\n2. Vyberte vhodný spôsob uloženia veľkého množstva webových stránok.\n3. Nasaďte vybrané distribuované úložisko na testovací klaster pomocou systému Kubernetes.\n4. Vykonajte sadu testov pre overenia priepustnosti operácií zápisov a čítania.\n5. Identifikujte slabé miesta distribuovaného úložiska a navrhnite zlep",
    "content_length": 5356
  },
  {
    "path": "pages/students/2019/dmytro_mural/README.md",
    "title": "Dmytro Mural",
    "categories": [
      "bp2022"
    ],
    "tags": [],
    "published": true,
    "author": "Maroš Harahus",
    "taxonomy": {
      "category": [
        "bp2022"
      ],
      "tag": [],
      "author": "Maroš Harahus"
    },
    "metadata": {
      "title": "Dmytro Mural",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2022"
        ],
        "tag": [],
        "author": "Maroš Harahus"
      }
    },
    "content_preview": "Rok začiatku štúdia: 2019\n\n# Bakalárska práca 2022\n\nGrafové neurónové siete pre vyhľadávanie na internete.\n\nhttps://arxiv.org/abs/1810.05997\n\n\nNávrh na zadanie:\n\n1. Vysvetlite čo je to grafová neurónová sieť\n2. Vypracujte prehľad najnovších druhov grafových neurónovýsh sietí.\n3. Vyberte jednu metódu grafových neurónových sietí a navrhnite spôsob experimentálneho ohodnotenia sady prepojených článkov pomocou grafovej neurónovej siete.  \n4. Vyhodnnoťte experimenty a navrhnite zlepšenia Vášho prístu",
    "content_length": 753
  },
  {
    "path": "pages/students/2019/filip_tomas/README.md",
    "title": "Filip Tomáš",
    "categories": [
      "bp2022",
      "dp2024",
      "dp2025"
    ],
    "tags": [
      "testovanie",
      "javascript",
      "typescript"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2022",
        "dp2024",
        "dp2025"
      ],
      "tag": [
        "testovanie",
        "javascript",
        "typescript"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Filip Tomáš",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2022",
          "dp2024",
          "dp2025"
        ],
        "tag": [
          "testovanie",
          "javascript",
          "typescript"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2019\n\n\nDP sa prekladá na rok 2025\n\n# Diplomová práca 2024 - 2025\n\n\nVektorové vyhľadávanie dokumentov v prostredí Kubernetes\n\nZadanie:\n\n1. Napíšte prehľad metód vektorovej reprezentácie dokumentov pomocou neurónových sietí.  \n2. Napíšte prehľad vektorových databáz a ich metód vyhľadávania.\n3. Nasaďte vybranú vektorovú databázu do testovacieho distribuovaného prostredia. \n4. Vytvorte index väčšieho množstva textových dokumentov vo vybranej vektorovej databáze. \n5. Vytvorte web",
    "content_length": 11335
  },
  {
    "path": "pages/students/2019/kristian_sopkovic/README.md",
    "title": "Kristián Sopkovič",
    "categories": [
      "bp2022",
      "dp2024"
    ],
    "tags": [
      "spacy",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2022",
        "dp2024"
      ],
      "tag": [
        "spacy",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Kristián Sopkovič",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2022",
          "dp2024"
        ],
        "tag": [
          "spacy",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2019\n\n# Dizertačná práca 2028\n\nCieľ:\n\n- Vylepšiť RAG-QA v slovenskom jazyku.\n\nStretnutie 6.11.2024\n\nKritériá na rok 24-25:\n\n- Získať min. 40 bodov za publikácie podľa [tabuľky](https://www.fei.tuke.sk/uploads/1d/fa/1dfad875721c7e707dbe9c1f93f327b3/2022_Zasady_PhD_studia_TUKE_uplne_znenie_po_D1_web.pdf) dole.\n\nPlán na publikácie - povinná jazda:\n\n- SCYR 8B\n- [RADIOELEKTRONIKA 2025 15](https://radioelektronika.uniza.sk/home.php?id_conference=28)\n- RADIOELEKTRONIKA 2025 15 (Eva",
    "content_length": 15096
  },
  {
    "path": "pages/students/2019/michal_stromko/README.md",
    "title": "Michal Stromko",
    "categories": [
      "vp2021",
      "bp2022",
      "dp2024"
    ],
    "tags": [
      "ir",
      "cloud",
      "demo",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "vp2021",
        "bp2022",
        "dp2024"
      ],
      "tag": [
        "ir",
        "cloud",
        "demo",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Michal Stromko",
      "published": true,
      "taxonomy": {
        "category": [
          "vp2021",
          "bp2022",
          "dp2024"
        ],
        "tag": [
          "ir",
          "cloud",
          "demo",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2019\n\n# Diplomová práca 2023/24\n\nSémantické vyhľadávanie  v slovenskom texte\n\n\nZadanie práce:\n\n1. Vypracujte prehľad najnovších metód sémantického vyhľadávania pomocou neurónových sietí.\n2. Implementujte sémantické vyhľadávanie na slovenskej wikipédii pomocou existujúcich modelov. \n2. Vyberte dátovú množinu otázok a odpovedí a ručne anotujte výsledky sémantického vyhľadávania. \n3. Pripravte, vykonajte a opíšte experimenty na vyhodnotenie vyhľadávania pomocou Vami ručne vytvo",
    "content_length": 21569
  },
  {
    "path": "pages/students/2019/michal_stromko/vp2021/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "# Správa o vedeckom projekte\n\nV tomto vedeckom projekte som sa pokúsil o zaindexovanie stránky [ZP WIKI](https://zp.kemt.fei.tuke.sk/taxonomy?name=category&val=project) pomocou nástroja Azure Cognitive Search. Zároveň popri zisťovaní a vytváraní indexu som spravil pre ostatných študentov krátke tutoriály. \n\nTutoriáloch, ktoré som vytvoril nájdete:\n- aktivácia Azure konta  [Activation](tutorials/create_acount_on_azure.md)\n- Pridanie aplikácie Azure Cognitive Search na portál [Create ACS](tutorial",
    "content_length": 747
  },
  {
    "path": "pages/students/2019/michal_stromko/vp2021/tutorials/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "#### V tomto adresáry sú uložené všetky tutoriály",
    "content_length": 49
  },
  {
    "path": "pages/students/2019/michal_stromko/vp2021/tutorials/img/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "#### V tomto adresáry sú uložené všetky fotky ku tutoriálom.",
    "content_length": 60
  },
  {
    "path": "pages/students/2019/patrik_pokrivcak/README.md",
    "title": "Patrik Pokrivčák",
    "categories": [
      "dp2025"
    ],
    "tags": [
      "nlp",
      "hate"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2025"
      ],
      "tag": [
        "nlp",
        "hate"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Patrik Pokrivčák",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2025"
        ],
        "tag": [
          "nlp",
          "hate"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2019\n\n# Diplomová práca\n\n\nTéma:\n\nRozpoznávanie nenávistnej reči pomocou veľkých jazykových modelov\n\nZadanie:\n\n1. Vypracujte prehľad veľkých jazykových modelov s podporou slovenčiny.\n2. Vypracujte prehľad metód rozpoznávania nenávistnej reči pomocou veľkých jazykových modelov.\n3. Vyberte vhodnú dátovú množinu pre rozpoznávanie nenávistnej reči  a pomocou nej vhodnou metrikou porovnajte viacero jazykových modelov pre úlohu rozpoznávania nenávistnej reči.\n4. Vyhodnoťte experime",
    "content_length": 3406
  },
  {
    "path": "pages/students/2019/samuel_horani/README.md",
    "title": "Samuel Horáni",
    "categories": [
      "vp2021",
      "bp2022"
    ],
    "tags": [
      "chatbot",
      "rasa",
      "dialog",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "vp2021",
        "bp2022"
      ],
      "tag": [
        "chatbot",
        "rasa",
        "dialog",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Samuel Horáni",
      "published": true,
      "taxonomy": {
        "category": [
          "vp2021",
          "bp2022"
        ],
        "tag": [
          "chatbot",
          "rasa",
          "dialog",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2019\n\nNávrh na zadanie BP:\n\n1. Vypracujte teroretický úvod do modelovania dialógu a povedzte ake metódy sa aktuálne používajú.\n2. Navrhnite a vytvorte dialógový systém komunikujúci v slovenskom jazyku pre úlohu objednania jedla z donáškovej služby.\n3. Vykonajte sadu experimentov a dialógovým systémom a identifikujte miesta pre zlepšenie.\n\n\nNápady na balakársku prácu:\n\n- chatbot pre objednanie jedla.\n- chatbot s informáciami pre cestovateľov.\n- Urobenie web rozhrania.\n- dá sa",
    "content_length": 6489
  },
  {
    "path": "pages/students/2020/david_kostilnik/README.md",
    "title": "Dávid Kostilník",
    "categories": [
      "dp2025"
    ],
    "tags": [
      "ir"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2025"
      ],
      "tag": [
        "ir"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Dávid Kostilník",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2025"
        ],
        "tag": [
          "ir"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2020\n\n# Diplomová práca 2025\n\nTéma:\n\nSémantické vyhľadávanie pomocou veľkých modelov\n\n- Tvorba datasetu prekladom, využitie existujúcich datasetov\n- Dotrénovanie existujúceho modelu typu BERT pomocou preloženého MS MARCO.\n\nCiele: \n\n- Zlepšiť RAG.\n\nZadanie:\n\n1. Vypracujte prehľad metód a modelov sémantického vyhľadávania pomocou neurónových sietí.\n2. Vyberte vhodnú dátovú množinu a dotrénujte jazykový model pre úlohu sémantického vyhľadávania v slovenčine. \n3. Navrhnite a vyk",
    "content_length": 2638
  },
  {
    "path": "pages/students/2020/jakub_kristian_lukas/README.md",
    "title": "Jakub Kristián Lukas",
    "categories": [
      "bp2023"
    ],
    "tags": [
      "hatespeech"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2023"
      ],
      "tag": [
        "hatespeech"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Jakub Kristián Lukas",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2023"
        ],
        "tag": [
          "hatespeech"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2020\n\n# Bakalárska práca 2023\n\nTéma: Systém pre rozpoznávanie nenávistnej reči v online diskusiách\n\nSúvisí s PhD prácou [Manohar Gowdru Shridhara](students/2021/manohar_gowdru_shridharu)\n\nNávrh na zadanie: \n\n- Preštudovať teóriu.\n- Zopakovať jednoduchý experiment pre rozpoznávanie nenávistnej reči v anglickom jazyku s pomocou frameworku HuggingFace transformers. \n- Vypracovať webové demo.\n\nStretnutie 3.111.\n\nStav:\n\n- štúdium Python. \n- Vyskúšané niektoré HF HS modely.\n\nÚlohy",
    "content_length": 1870
  },
  {
    "path": "pages/students/2020/kamil_tomcufcik/README.md",
    "title": "Kamil Tomčufčík",
    "categories": [
      "dp2025"
    ],
    "tags": [
      "lm"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2025"
      ],
      "tag": [
        "lm"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Kamil Tomčufčík",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2025"
        ],
        "tag": [
          "lm"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2020\n\n# Diplomová práca 2025\n\nCiel:\n\nOveriť a zlepšiť možnosti generovania jednotkových testov\n\nZadanie:\n\n1. Vypracujte prehľad veľkých jazykových modelov s podporou generovania programového kódu.\n2. Vyberte vhodnú dátovú množinu a metriku na vyhodnotenie generovania kódu.\n3. Navrhnite a vyhodnoťte experimenty s generovaním kódu s pomocou veľkého jazykového modelu. \n4. Identifikujte slabé miesta a navrhnite zlepšenia.\n\nStretnutie 12.12.2024\n\nStav:\n\n- Metrika Pass@K sa použív",
    "content_length": 3184
  },
  {
    "path": "pages/students/2020/matej_kobylan/README.md",
    "title": "Matej Kobyľan",
    "categories": [
      "bp2023"
    ],
    "tags": [
      "ir"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2023"
      ],
      "tag": [
        "ir"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Matej Kobyľan",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2023"
        ],
        "tag": [
          "ir"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2020\n\n# Bakalárska práca 2024\n\nCieľ: Vytvoriť dialógový systém pre podporu komunikácie občana s mestom Košice\n\n\nÚlohy:\n\n- Zistite, čo je to Natural Language Understanding. Napíšte o tom správu na 2 strany.\n- Prečítajte si BP Samuel Horáni. https://opac.crzp.sk/?fn=detailBiblioForm&sid=A770A18E340C6018B48DE7BDD5C2 Napíšte čo ste sa dozvedeli.\n- Prečítajte si článok https://link.springer.com/article/10.1007/s10462-022-10248-8 a napíšte, čo ste sa dozvedeli.\n- Vyskúšajte si cha",
    "content_length": 3446
  },
  {
    "path": "pages/students/2020/matus_suchanic/README.md",
    "title": "Matúš Suchanič",
    "categories": [
      "vp2022",
      "bp2023"
    ],
    "tags": [
      "ir"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "vp2022",
        "bp2023"
      ],
      "tag": [
        "ir"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Matúš Suchanič",
      "published": true,
      "taxonomy": {
        "category": [
          "vp2022",
          "bp2023"
        ],
        "tag": [
          "ir"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2020\n\n# Bakalárska práca 2023\n\nTéma: Vyhľadávanie na slovenskej Wikipédii\n\nÚloha: \n\n- Implementujte systém na kategorizáciu slovenských novinových článkov. Systém by mal kategorizovať ľubovoľný článok do wiki kategórií.\n- Vytvorte dátovú množinu pre vyhodnotenie kategorizácie na základe wiki kategórií. \n\nNázov: \n\nAutomatická kategorizácia slovenského textu\n\n1. Vypracujte prehľad najnovších metód kategorizácie textu pomocou neurónových sietí aj pomocou štatistických metód.\n2.",
    "content_length": 5265
  },
  {
    "path": "pages/students/2020/pavol_hudak/README.md",
    "title": "Pavol Hudák",
    "categories": [
      "dp2025"
    ],
    "tags": [
      "nlp",
      "qa"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2025"
      ],
      "tag": [
        "nlp",
        "qa"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Pavol Hudák",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2025"
        ],
        "tag": [
          "nlp",
          "qa"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2020\n\n# Diplomová práca 2025\n\nDotrénovanie veľkého jazykového modelu na odpovede v slovenčine\n\nZadanie:\n\n1. Vypracujte prehľad veľkých jazykových modelov v slovenčine.\n2. Vypracujte prehľad metód dotrénovania veľkých jazykových modelov.\n3. Vyberte vhodnú dátovú množinu v slovenčine a dotrénujte veľký jazykový model.\n4. Vyhodnoťte experimenty a navrhnite zlepšenia. \n\n\n\nCiel:\n\n- Dotrénovanie LLM pre zlepšenie jeho schopnosti odpovedať na otázku v slovenskom jazyku.\n- Dotrénova",
    "content_length": 4542
  },
  {
    "path": "pages/students/2020/vladyslav_krupko/README.md",
    "title": "Vladyslav Krupko",
    "categories": [
      "bp2024"
    ],
    "tags": [
      "spelling"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2024"
      ],
      "tag": [
        "spelling"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Vladyslav Krupko",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2024"
        ],
        "tag": [
          "spelling"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2020\n\n# Bakalárska práca 2024\n\n\n1. Napíšte prehľad  existujúcich jazykových modelov  pre generovanie slovenského jazyka.\n2. Získajte a pripravte korpus dát pre úlohu generovania odpovedí v slovenskom jazyku. Vyberte vhodný zdroj a pripravte ho do podoby vhodnej na trénovanie neurónových sietí.  Sumarizujte získané dáta v tabuľke. \n3. Natrénujte neurónovú sieť pre úlohu generovania odpovede  a vyhodnoťte výsledky. \n4. Vyhodnoťte experimenty, identifikujte slabé miesta a navrh",
    "content_length": 7000
  },
  {
    "path": "pages/students/2021/artur_hyrenko/README.md",
    "title": "Artur Hyrenko",
    "categories": [
      "dp2026"
    ],
    "tags": [
      "chatbot",
      "rasa",
      "dialog",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2026"
      ],
      "tag": [
        "chatbot",
        "rasa",
        "dialog",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Artur Hyrenko",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2026"
        ],
        "tag": [
          "chatbot",
          "rasa",
          "dialog",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2021\n\n# Diplomová práca 2026\n\nZvýšenie bezpečnosti veľkých jazykových modelov\n\nZadanie:\n\n1. Vypracujte prehľad súčasného stavu výskumu v oblasti zvyšovania bezpečnosti veľkých jazykových modelov, vrátane identifikácie známych bezpečnostných problémov a spôsobov ich vyhodnotenia.  \n2. Vyberte vhodnú trénovaciu sadu a zarovnajte vybraný jazykový model s cieľom zvýšiť jeho bezpečnosť.  \n3. Vyberte vhodnú testovaciu sadu a vyhodnoťte bezpečnosť viacerých modelov, vrátane zarovna",
    "content_length": 8275
  },
  {
    "path": "pages/students/2021/eduard_matovka/README.md",
    "title": "Eduard Matovka",
    "categories": [
      "bp2024"
    ],
    "tags": [
      "dialog",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2024"
      ],
      "tag": [
        "dialog",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Eduard Matovka",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2024"
        ],
        "tag": [
          "dialog",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2021\n\n# Bakalárska práca 2024\n\nSpolupráca [Vladimír Ferko](/students/2021/vladimir_ferko)\n\nNadväzuje [Martin Jancura](/students/2017/martin_jancura)\n\nNázov: Slovenská konverzačná umelá inteligencia\n\nPredbežný cieľ:\n\nNatrénovať jazykový model pre jednoduchú slovenskú konverzáciu. \n\nZadanie BP:\n\n1. Vypracujte prehľad modelov a dátových množín pre generovanie slovenského jazyka.\n2. Opíšte metódy dotrénovania generatívnych jazykových modelov. \n3. Vyberte vhodnú dátovú množinu a ",
    "content_length": 7624
  },
  {
    "path": "pages/students/2021/manohar_gowdru_shridharu/README.md",
    "title": "Manohar Gowdru Shridhara",
    "categories": [
      "phd2024"
    ],
    "tags": [
      "lm",
      "nlp",
      "hatespeech"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "phd2024"
      ],
      "tag": [
        "lm",
        "nlp",
        "hatespeech"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Manohar Gowdru Shridhara",
      "published": true,
      "taxonomy": {
        "category": [
          "phd2024"
        ],
        "tag": [
          "lm",
          "nlp",
          "hatespeech"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Manohar Gowdru Shridhara\n\nBeginning of the study: 2021\n\nrepository: https://git.kemt.fei.tuke.sk/mg240ia\n\n## Disertation Thesis\n\nin 2023/24\n\nHate Speech Detection\n\nGoals:\n\n- Publish and defend a minimal thesis \n- Write a dissertaion thesis\n- Publish 2 A-class journal papers\n\n## Second year of PhD study\n\nGoals:\n\n- Publish and defend a minimal thesis. Minimal thesis should contain PhD thesis statements - scientific contributions.\n    - Provide state-of-the-art overview.\n    - Formulate dissertat",
    "content_length": 15079
  },
  {
    "path": "pages/students/2021/martin_sarissky/README.md",
    "title": "Martin Šarišský",
    "categories": [
      "vp2023",
      "bp2024",
      "dp2026"
    ],
    "tags": [
      "chatbot",
      "rasa",
      "dialog",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "vp2023",
        "bp2024",
        "dp2026"
      ],
      "tag": [
        "chatbot",
        "rasa",
        "dialog",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Martin Šarišský",
      "published": true,
      "taxonomy": {
        "category": [
          "vp2023",
          "bp2024",
          "dp2026"
        ],
        "tag": [
          "chatbot",
          "rasa",
          "dialog",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2021\n\n# Diplomová práca 2026\n\nhttps://git.kemt.fei.tuke.sk/ms058bd/Diplomovka\n\nNázov práce:\n\nAgentové systémy pomocou veľkého jazykového modelu\n\nZadanie:\n\n1. Vypracujte prehľad systémov generovania prirodzeného jazyka, ktoré podporujú vyhľadávanie a sú vhodné na spracovanie právnych informácií.  \n2. Na základe tohto prehľadu navrhnite a implementujte agentový systém, ktorý umožní vyhľadávanie v právnych dokumentoch, odpovedanie na otázky a sumarizáciu textov.  \n3. Vytvorte s",
    "content_length": 17458
  },
  {
    "path": "pages/students/2021/matej_novotny/README.md",
    "title": "Matej Novotný",
    "categories": [
      "dp2026"
    ],
    "tags": [
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2026"
      ],
      "tag": [
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Matej Novotný",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2026"
        ],
        "tag": [
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2021\n\n# Diplomová práca 2026\n\nKlasifikácia webových dát pre lepšie jazykové modelovanie\n\nRepo https://git.kemt.fei.tuke.sk/mn180gd/diplomovka\n\nZadanie:\n\n1. Vypracujte prehľad súčasných prístupov a nástrojov na klasifikáciu webových dát podľa typu a na detekciu nenávistného obsahu.  \n2. Navrhnite a implementujte systém, ktorý automaticky roztriedi webové texty podľa uvedených typov a domén a zároveň vyhodnotí ich úroveň nenávisti.  \n3. Zostavte kvalitný všeobecný a tematický ",
    "content_length": 6550
  },
  {
    "path": "pages/students/2021/matej_scislak/README.md",
    "title": "Matej Ščišľak",
    "categories": [
      "bp2024",
      "dp2026"
    ],
    "tags": [
      "chatbot",
      "rasa",
      "dialog",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2024",
        "dp2026"
      ],
      "tag": [
        "chatbot",
        "rasa",
        "dialog",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Matej Ščišľak",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2024",
          "dp2026"
        ],
        "tag": [
          "chatbot",
          "rasa",
          "dialog",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2021\n\n\n# Diplomová práca 2026\n\nNázov:\n\nZnalostné grafy pre zlepšenie vyhľadávania právnych informácií.\n\nZadanie:\n\n1. Vypracujte prehľad súčasných prístupov k využitiu znalostných grafov na vyhľadávanie pomocou jazykových modelov.  \n2. Zostavte vzorový znalostný graf z právnej oblasti.  \n3. Navrhnite a implementujte systém, ktorý pomocou znalostných grafov umožní vyhľadávanie v rozsudkoch, zákonoch a vyhláškach, odpovedanie na otázky a sumarizáciu dokumentov.  \n4. Otestujte s",
    "content_length": 11061
  },
  {
    "path": "pages/students/2021/nikita_bodnar/README.md",
    "title": "Nikita Bodnar",
    "categories": [
      "vp2023",
      "bp2024",
      "bp2025"
    ],
    "tags": [
      "chatbot",
      "rasa",
      "dialog",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "vp2023",
        "bp2024",
        "bp2025"
      ],
      "tag": [
        "chatbot",
        "rasa",
        "dialog",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Nikita Bodnar",
      "published": true,
      "taxonomy": {
        "category": [
          "vp2023",
          "bp2024",
          "bp2025"
        ],
        "tag": [
          "chatbot",
          "rasa",
          "dialog",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2021\n\n# Bakalárska práca 2025\n\nZadanie:\n\n1. Vypracujte prehľad neurónových sietí a metód na vykonávanie opravy textu. \n2. Vyberte a pripravte slovenské dáta do vhodnej podoby a aplikujte viacero existujúcich modelov na opravu textu.\n3. Číselne a slovne vyhodnoťte modely a navrhnite zlepšenia.\n\nStretnutie 27.3.\n\nStav:\n\n- Text je v lepšom stave.\n\nStretnutie 11.3.\n\nStav:\n\n- Vypracované experimenty pre obnovu interpunkcie, zatiaľ na dosť krátkom texte. Výsledky sú v nejakej prez",
    "content_length": 6066
  },
  {
    "path": "pages/students/2021/oleksandr_hryshchenko/README.md",
    "title": "Oleksandr Hryshchenko",
    "categories": [
      "dp2026"
    ],
    "tags": [
      "ir",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2026"
      ],
      "tag": [
        "ir",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Oleksandr Hryshchenko",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2026"
        ],
        "tag": [
          "ir",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2021\n\n# Diplomová práca 2026\n \nGrafové neurónové siete pre získavanie informácií\n\nProjekt zakončený.\n\nStretnutie 13.2.2025\n\nÚlohy:\n\n- Precvičte si jazyk Python, nainštalujte si prostredie Anaconda.\n- Zistite čo sú to grafové neurónové siete. Prečítajte si odborné články a urobte si poznámky. Pozrite sa na https://scholar.google.sk/ vyhľadávajte \"graph neural network\".\n- Oboznámte sa s frameworkom LangChain https://python.langchain.com/docs/tutorials/graph/ https://python.lan",
    "content_length": 963
  },
  {
    "path": "pages/students/2021/vladimir_ferko/README.md",
    "title": "Vladimír Ferko",
    "categories": [
      "bp2024"
    ],
    "tags": [
      "dialog",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2024"
      ],
      "tag": [
        "dialog",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Vladimír Ferko",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2024"
        ],
        "tag": [
          "dialog",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2021\n\nštudent KPI, pracovník DTSS\n\n## Bakalárska práca 2024\n\n- [Projekt HateSpeech](/topics/hatespeech)\n- [Pokyny KPI ku záverečným prácam](https://kpi.fei.tuke.sk/sk/zaverecne-prace)\n- Spolupráca: [Eduard Matovka](/students/2021/eduard_matovka)\n- Nadväzuje [Martin Jancura](/students/2017/martin_jancura)\n\nNázov: Anotácia a vyhodnotenie slovenskej databázy nenávistnej reči\n\n1. Napíšte prehľad existujúcich dátových zdrojov pre úlohu rozpoznávania sentimentu a nenávistnej reči ",
    "content_length": 7945
  },
  {
    "path": "pages/students/2022/andrii_pervashov/README.md",
    "title": "Andrii Pervashov",
    "categories": [
      "bp2025",
      "dp2027"
    ],
    "tags": [
      "rag",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2025",
        "dp2027"
      ],
      "tag": [
        "rag",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Andrii Pervashov",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2025",
          "dp2027"
        ],
        "tag": [
          "rag",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n# Diplomová práca 2027\n\nNávrh na tému:\n\nPrepis reči pre tvorbu štruktúrovaného zdravotného záznamu\n\nCiele:\n\n- Vytvorte systém pre prepis reči a naplnenie formulára pomocou lokálnych jazykových modelov\n- Zlepšite jazykový model pre extraktiu štruktúrovaných informácií z medicínskej alebo súdnej domény.\n\nÚlohy:\n\n- Oboznámte sa so systémom OpenWebUI - prečítajte si dokumentáciu, príp. spravte si svoju inštanciu.\n- Vytvorte jedno alebo viacero rozšírení, ktoré umožnia napň",
    "content_length": 5093
  },
  {
    "path": "pages/students/2022/daniil_huzenko/README.md",
    "title": "Daniil Huzenko",
    "categories": [
      "bp2025"
    ],
    "tags": [
      "klaud"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2025"
      ],
      "tag": [
        "klaud"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Daniil Huzenko",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2025"
        ],
        "tag": [
          "klaud"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n# Bakalárska práca 2025\n\nVedúci: doc. Matúš Pleva PhD.\n\nPredbežný názov:\n\nTestovanie hybridného klaudu s využiťím kombinácie verejného a privátneho riešenia\n\nCielom práce je vytvorenie vzelávacích materiálov o Kubernetes a funkčného prototypu privátneho klastra Kubernetes .\n\nZadanie:\n\n1.\tNapíšte prehľad metód automatizácie procesov a vypracujte úvod do platformy Kubernetes. \n2.\tVypracujte prehľad domácich klastrov založených na platforme ARM.\n3.\tZostavte vlastný klaste",
    "content_length": 3960
  },
  {
    "path": "pages/students/2022/jakub_schwarc/README.md",
    "title": "Jakub Schwarc",
    "categories": [
      "dp2027"
    ],
    "tags": [
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2027"
      ],
      "tag": [
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Jakub Schwarc",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2027"
        ],
        "tag": [
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n# Diplomový projekt 2026\n\n\nTéma:\n\nInštrukčné dotrénovanie jazykového modelu\n\nCiele na semester:\n\n- Dotrénujte a vyhodnotte Slovak Mistral.\n\nStretnutie 27.2.\n\n- Obozn8mte sa problematikou podľa zadaných zdrojov.\n- Pozrite si https://allenai.org/olmo\n\nÚlohy:\n\n- Oboznámte sa s problematikou veľkých jazykových modelov. Towards Data Science\n- Naučte sa Python lepšie. Nainštalujte si prostredie Anaconda.\n- Poučte sa o strojovom účení. Dive into deep learning.\n- Vyskúšajte si",
    "content_length": 1139
  },
  {
    "path": "pages/students/2022/jan_malinovsky/README.md",
    "title": "Ján Malinovský",
    "categories": [
      "dp2027"
    ],
    "tags": [
      "rag",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2027"
      ],
      "tag": [
        "rag",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Ján Malinovský",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2027"
        ],
        "tag": [
          "rag",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n# Diplomový projekt 2026\n\n\nTéma:\n\nGrafové vyhľadávanie pre podporu vzdelávania\n\nCiele na semester.\n\n- Zistite čo je to Retrieval Augmented Generation\n- Zistite, čo je to znalostný graf\n- Naučte sa čo je to GraphRAG\n- Zostavte malý znalostný graf z oblasti vzdelávania. Pri zostavení môžete využiť jazykový model. Môžete preložiť existujúci znalostný graf. \n- Využite znalostný graf pre zlepšenie práce alebo vysvetliteľnosti jazkového modelu\n\nNapr.\n\n- výchovné opatrenia v ",
    "content_length": 3764
  },
  {
    "path": "pages/students/2022/jan_ptak/README.md",
    "title": "Ján Pták",
    "categories": [
      "dp2027"
    ],
    "tags": [
      "rag",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "dp2027"
      ],
      "tag": [
        "rag",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Ján Pták",
      "published": true,
      "taxonomy": {
        "category": [
          "dp2027"
        ],
        "tag": [
          "rag",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n# Diplomový projekt 2026\n\n\nTéma:\n\nAgent pre manažment záverečných prác\n\n\nCiele na semester.\n\n- Zistite čo je to Retrieval Augmented Generation\n- Vytvorte agenta pre zlepšenie manažmentu záverečných prác zpwiki. \n- Ako rozhranie použite OpenWebUI. \n- Navrhnite deployment pomocou Docker. Implementujte aj synchronizáciou (pomocou WebHOOK)\n\n\nZásobník úloh:\n\n- Zistite, čo je to znalostný graf\n- Naučte sa čo je to GraphRAG\n- Využite znalostný graf pre zlepšenie práce alebo v",
    "content_length": 1126
  },
  {
    "path": "pages/students/2022/oleh_poiasnik/README.md",
    "title": "Oleh Poiasnik",
    "categories": [
      "bp2025",
      "dp2027"
    ],
    "tags": [
      "rag",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2025",
        "dp2027"
      ],
      "tag": [
        "rag",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Oleh Poiasnik",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2025",
          "dp2027"
        ],
        "tag": [
          "rag",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n# Diplomová práca 2027\n\nExpertný agentový systém na podporu rozhodovania v lekárni\n\nCieľ:\n\n- Vylepšiť agenta pre prácu so znalostným grafom - interakcie a kontraindikácie.\n- Zostaviť znalostný graf z databázy príbalových letákov adc a s jeho pomocou zlepšiť generovanie odpovede.\n\nStretnutie 14.5.\n\nStav:\n\n- Získaná databáza ADC pomocou scrapera.\n- Dáta sú transformované do JSON, je definovaná schéma.\n- Pomocou LightRAG je vytvorený znalostný graf pre niekoľko (500) liek",
    "content_length": 9493
  },
  {
    "path": "pages/students/2022/samuel_vasil/README.md",
    "title": "Samuel Vasiľ",
    "categories": [
      "bp2026"
    ],
    "tags": [
      "llm",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2026"
      ],
      "tag": [
        "llm",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Samuel Vasiľ",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2026"
        ],
        "tag": [
          "llm",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n\n## Bakalárska práca 2026\n\nkonzultant Matúš Čavojský\n\nPredbežný názov:\n\nOrchestrácia veľkých jazykových modelov pomocou model context protokolu s využitím OpenWebUI\n\nZadanie:\n\n- Vypracujte prehľad súčasných veľkých jazykových modelov s podporou slovenčiny, ktoré sa používajú na generovanie prirodzeného jazyka, generovanie programového kódu a vyhľadávanie informácií.  \n- Nasaďte OpenWebUI pomocou Docker Compose a vybrať niekoľko vhodných modelov, ktoré sprístupníte pros",
    "content_length": 1699
  },
  {
    "path": "pages/students/2022/serhii_yemets/README.md",
    "title": "Serhii Yemets",
    "categories": [
      "bp2025"
    ],
    "tags": [
      "ner",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2025"
      ],
      "tag": [
        "ner",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Serhii Yemets",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2025"
        ],
        "tag": [
          "ner",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n# Bakalárska práca 2025\n\nCieľ:\n\n- Zlepšenie slovenského modelu  pre rozpoznávanie pomenovaných entít.\n\nDo budúcnosti: \n\n- Vypracovanie webového dema\n- Využitie modelu v nejakej zaujímavej úlohe (chatbot alebo právne texty).\n\nNávrh na zadanie bakalárskej práce:\n\n1. Napíšte prehľad neurónových modelov vhodných pre rozpoznávanie pomenovaných entít v slovenskom jazku.\n2. Napíšte prehľad existujúcich dátových množín, vhodných na trénovanie modelu pre rozpoznávanie pomenovan",
    "content_length": 4823
  },
  {
    "path": "pages/students/2022/tetiana_mohorian/README.md",
    "title": "Tetiana Mohorian",
    "categories": [
      "bp2025"
    ],
    "tags": [
      "rag",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2025"
      ],
      "tag": [
        "rag",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Tetiana Mohorian",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2025"
        ],
        "tag": [
          "rag",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n\n## Bakalárska práca 2025\n\n- Spolupráca [P. Pokrivčák](/students/2019/patrik_pokrivcak)\n- [Python](/topics/python)\n- [Hate Speech](/topics/hatespeech)\n\n\nRozpoznávanie nenávistnej reči pomocou veľkých jazykových modelov.\n\nZadanie:\n\n1. Vypracujte prehľad veľkých jazykových modelov s podporou slovenčiny.\n2. Vypracujte prehľad dostupných textových korpusov pre rozpoznávanie nenávistnej reči.\n3. Vyberte  model a metódu rozpoznávania nenávistnej reči. Vyhodnoťte presnosť roz",
    "content_length": 5068
  },
  {
    "path": "pages/students/2022/valerii_kutsenko/README.md",
    "title": "Valerii Kutsenko",
    "categories": [
      "vp2024",
      "bp2025",
      "dp2027"
    ],
    "tags": [
      "rag",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "vp2024",
        "bp2025",
        "dp2027"
      ],
      "tag": [
        "rag",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Valerii Kutsenko",
      "published": true,
      "taxonomy": {
        "category": [
          "vp2024",
          "bp2025",
          "dp2027"
        ],
        "tag": [
          "rag",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n# Diplomová práca 2027\n\nZlepšenie vyhľadávania pomocou znalostných grafov.\n\nMyšlienky:\n\n- Agent si buduje vnútornú reprezentáciu pomocu ktorej vie lepšie generovať.\n- Vnútorná reprezentácia je v človeku zrozumiteľnej podobe, napr. znalostný graf.\n\nMožné úlohy:\n\n- Navrhnite agenta, ktorý bude budovať a využívať znalostný graf pri vyhľadávaní.\n- Môže to byť v oblasti vzdelávania, práva alebo medicíny.\n- Zostavte multilinguálny znalostný graf, ktorý môže pomôcť pri genero",
    "content_length": 13632
  },
  {
    "path": "pages/students/2022/vladyslav_yanchenko/README.md",
    "title": "Vladyslav Yanchenko",
    "categories": [
      "bp2025"
    ],
    "tags": [
      "klaud"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2025"
      ],
      "tag": [
        "klaud"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Vladyslav Yanchenko",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2025"
        ],
        "tag": [
          "klaud"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n# Bakalárska práca 2025\n\nNázov: \n\nKontinuálne nasadenie a testovanie aplikácie v klaudovom prostredí. \n\nÚlohy BP:\n\n1. Vypracujte písomný prehľad verejných klaudových služieb a softvérových prosriedkov  pre podporu  procesu a nasadenia aplikácie.\n2. Vytvorte a opíšte webovú aplikáciu zloženú z viacerých komponentov a upravte ju do podoby vhodnej na nasadenie v klaude. K aplikácii vytvorte automatické testy.\n3. Vytvorte a opíšte proces kontinuálneho nasadenia a integráci",
    "content_length": 3972
  },
  {
    "path": "pages/students/2022/yevhenii_leonov/README.md",
    "title": "Yevhenii Leonov",
    "categories": [
      "vp2024",
      "bp2025"
    ],
    "tags": [
      "rag",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "vp2024",
        "bp2025"
      ],
      "tag": [
        "rag",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Yevhenii Leonov",
      "published": true,
      "taxonomy": {
        "category": [
          "vp2024",
          "bp2025"
        ],
        "tag": [
          "rag",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2022\n\n# Bakalárska práca 2025\n\n\nTéma:\n\n\nVyhodnotenie generovania slovenského jazyka s pomocou vyhľadávania\n\nPredbežné zadanie:\n\n1. Vypracujte prehľad metód a modelov  generovania jazyka s pomocou vyhľadávania.\n2. Vypracujte prehľad metód ich vyhodnotenia. \n3. Vyskúšajte a vyhodnoťte vybranú metódu generovania jazyka s pomocou vyhľadávania.\n4. Navrhnite zlepšenia pre vybranú metódu generovania odpovede. \n\n\nNávrh na tému:\n\n- Vyhodnotenie systémov RAG\n\nSpolupráca Oleh Poiasnik\n",
    "content_length": 3613
  },
  {
    "path": "pages/students/2023/denis_le_thanh/README.md",
    "title": "Denis Le Thanh",
    "categories": [
      "bp2026"
    ],
    "tags": [
      "lm",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2026"
      ],
      "tag": [
        "lm",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Denis Le Thanh",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2026"
        ],
        "tag": [
          "lm",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2023\n\nštudent KPI\n\nvedúci Ing. Tomáš Kormaník\n\nkonzultácie: Ing. Kristián Sopkovič\n\n# Bakalárska práca 2026\n\n\nTéma:\n\nTrénovanie jazykového modelu pre spracovanie inštrukcií v prirodzenom jazyku\n\n\nCiele:\n\n- Skúsiť dotrénovať slovenský generatívny model (slovak-mistral-7b) pre inštrukcie.\n\nStretnutie 5.12. (K. Sopkovič)\n\nStav:\n\n- Analyticka praca cca 12 stran \n- Su potrebne vyhotiv zmeny - tema musi suvisiet so studijnum odborom - kyberbezpecnost (potrebna diskusia s D.Hladek)",
    "content_length": 2608
  },
  {
    "path": "pages/students/2023/maksym_zatirka/README.md",
    "title": "Maksym Zatirka",
    "categories": [
      "bp2026"
    ],
    "tags": [
      "nlp",
      "graph",
      "db"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2026"
      ],
      "tag": [
        "nlp",
        "graph",
        "db"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Maksym Zatirka",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2026"
        ],
        "tag": [
          "nlp",
          "graph",
          "db"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2023\n\nštudent KM\n\n\n# Bakalárska práca 2026\n\n\nTéma:\n\nGrafová databáza pre podporu generovania slovenského jazyka\n\nZadanie:\n\n1. Vypracujte prehľad metód podpory generovania prirodzeného jazyka pomocou znalostných grafov.\n2. Zostavte znalostný graf pre slovenské právo a vložte ho do vybranej grafovej databázy. \n3. Navrhnite a vytvorte inteligentného agenta, ktorý využije vytvorený znalostný graf.\n4. Vyhodnoťte agenta, identifikujte jeho slabé miesta a navrhnite zlepšenia pre pr",
    "content_length": 5342
  },
  {
    "path": "pages/students/2023/oleksandr_dorybohov/README.md",
    "title": "Oleksandr Dorybohov",
    "categories": [
      "bp2026"
    ],
    "tags": [
      "lm",
      "nlp",
      "agent"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2026"
      ],
      "tag": [
        "lm",
        "nlp",
        "agent"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Oleksandr Dorybohov",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2026"
        ],
        "tag": [
          "lm",
          "nlp",
          "agent"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2023\n\n\n# Bakalárska práca 2026\n\nhttps://git.kemt.fei.tuke.sk/od059jr/ai-lawyer-agent\n\nTéma:\n\nAutomatické odpovede na otázky v právnej oblasti\n\nCiele:\n\nVytvorte agenta pre spracovanie slovenských právnych textov \n\nPredbežné zadanie:\nZadanie:\n\n1. Vypracujte prehľad jazykových modelov s podporou slovenčiny a s možnosťou volania nástrojov.   \n2. Vyberte a opíšte vhodné verejné API pre prístup k informáciám z právnej oblasti.  \n3. Navrhnite a vypracujte inteligentného agenta, kto",
    "content_length": 4663
  },
  {
    "path": "pages/students/2023/ronald_zalacko/README.md",
    "title": "Ronald Zalacko",
    "categories": [
      "bp2026"
    ],
    "tags": [
      "web"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2026"
      ],
      "tag": [
        "web"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Ronald Zalacko",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2026"
        ],
        "tag": [
          "web"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2023\n\n\nVedúci: Matúš Pleva\n\n\n# Bakalárska práca 2026\n\n\nTéma:\n\nSkórovací online systém pre robotické súťaže\n\n\nhttps://git.kemt.fei.tuke.sk/rz409st/scoring-system/src/branch/main/backend\n\nCiele:\n\n- Vypracujte prehľad robotických súťaží a podporného softvéru pre robotické súťaže.\n- Vyberte jeden druh robotickej sútaže a opíšte procesy ktoré tam prebiehajú.\n- Podľa vykonanej analýzy navrhnite a vytvorte aplikáciu pre podporu a manažment robotickej súťaže.\n- Aplikáciu nasaďte pom",
    "content_length": 2685
  },
  {
    "path": "pages/students/2023/rostyslav_rodzhuk/README.md",
    "title": "Rostyslav Rodzhuk",
    "categories": [
      "vp2025",
      "bp2026"
    ],
    "tags": [
      "agent",
      "lm",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "vp2025",
        "bp2026"
      ],
      "tag": [
        "agent",
        "lm",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Rostyslav Rodzhuk",
      "published": true,
      "taxonomy": {
        "category": [
          "vp2025",
          "bp2026"
        ],
        "tag": [
          "agent",
          "lm",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2023\n\n\n\n# Bakalárska práca 2026\n\n\nTéma:\n\nInteligentný agent pre podporu práce špeciálneho pedagóga\n\nPredbežné zadanie:\n\n1. Vypracujte prehľad agentových systémov na báze veľkého jazykového modelu.  \n2. Získajte dáta z internetu a vytvorte inteligentného agenta na pomoc špeciálnemu pedagógovi.  \n3. Navrhnite a nasadte webové rozhranie pre inteligentného agenta.  \n4. Navrhnite viacero scenárov interakcie  s inteligentným agentom a slovne vyhodnoťte ich priebeh.  \n\n\nhttps://git",
    "content_length": 4768
  },
  {
    "path": "pages/students/2023/samuel_dzurina/README.md",
    "title": "Samuel Džurina",
    "categories": [
      "bp2026"
    ],
    "tags": [
      "lm",
      "nlp",
      "agent"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2026"
      ],
      "tag": [
        "lm",
        "nlp",
        "agent"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Samuel Džurina",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2026"
        ],
        "tag": [
          "lm",
          "nlp",
          "agent"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2023\n\n\n# Bakalárska práca 2026\n\n\nTéma:\n\nDialógový systém pre podporu firemných procesov\n\n\nCiele:\n\nVytvorte agenta pre podporu činnosti zásielkovej spoločnosti.\n\nZadanie:\n\n1. Vypracujte prehľad architektúr a jazykových modelov pre inteligentných agentov.  \n2. Vypracujte zoznam požiadaviek na agenta pre podporu činnosti zásielkovej spoločnosti.  \n3. Na základe vypracovaného prehľadu a zoznamu požiadaviek navrhnite a vypracujte inteligentného agenta.  \n4. Agenta otestujte a vyh",
    "content_length": 6751
  },
  {
    "path": "pages/students/2023/simona_bobrovcanova/README.md",
    "title": "Simona Bobrovčanová",
    "categories": [
      "bp2026"
    ],
    "tags": [
      "lm",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2026"
      ],
      "tag": [
        "lm",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Simona Bobrovčanová",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2026"
        ],
        "tag": [
          "lm",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2023\n\n\n# Bakalárska práca 2026\n\nTéma:\n\nAutomatická sumarizácia slovenského textu\n\nZadanie:\n\n1. Zostavte prehľad modelov a metód vhodných na automatickú sumarizáciu textov v slovenskom jazyku.\n2. Vyberte viacero vhodných modelov a vykonajte sumarizáciu na vybranej množine.\n3. Vyhodnoťte výsledky vhodnou metódou.\n4. Identifikujte slabé miesta existujúceho spôsobu sumarizácie a navrhnite možné zlepšenia. \n\nhttps://git.kemt.fei.tuke.sk/sb610oy/bakalarska-praca\n\nCiele:\n\nZlepšite ",
    "content_length": 4181
  },
  {
    "path": "pages/students/2023/yevhenii_medushivskyi/README.md",
    "title": "Yevhenii Medushivskyi",
    "categories": [
      "bp2026"
    ],
    "tags": [
      "ir",
      "lm",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "bp2026"
      ],
      "tag": [
        "ir",
        "lm",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Yevhenii Medushivskyi",
      "published": true,
      "taxonomy": {
        "category": [
          "bp2026"
        ],
        "tag": [
          "ir",
          "lm",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "rok začiatku štúdia: 2023\n\n# Bakalárska práca 2026\n\n\nTéma:\n\nZískavanie textu  z webových stránok\n\nZadanie:\n\n1. Vypracujte prehľad webových korpusov a metód ich tvorby.  \n2. Vytvorte a nasadte webový crawler na sledovanie a sťahovanie slovenského internetu.  \n3. Pomocou crawlera získajte dáta z internetu a vytvorte korpus dát pre viaceré domény.  \n4. Analyzujte získané dáta, priebeh ich sťahovania a navrhnite zlepšenia procesu získavania textových dát.  \n\nStretnutie 11.5.2026.\n\nStav:\n\n- Napísaná ",
    "content_length": 6139
  },
  {
    "path": "pages/topics/akopisat/README.md",
    "title": "Záverečné práce a projekty",
    "categories": [
      "info"
    ],
    "tags": [
      "zp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "info"
      ],
      "tag": [
        "zp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Záverečné práce a projekty",
      "published": true,
      "taxonomy": {
        "category": [
          "info"
        ],
        "tag": [
          "zp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Ako písať záverečnú prácu\n\n- [Ako písať záverečnú prácu](http://akopisatprace.sk/wp-content/uploads/ako_pisat_zav_prace_final_skratene2_6.pdf)\n- [Odovzdanie a šablóna](https://portal.lib.tuke.sk/etd/)\n\n## Osnova záverečnej práce\n\n1. Úvod: Predstavte čitateľovi problém  \n2. Teória (State-of-the-art): Vysvetlíte možné spôsoby riešenia definovaného problému a vysvetlíte dôležité pojmy. Mali by ste sa odvolávať na najnovšie vedecké články a knihy.\n3. Riešenie: Z možných spôsobov riešenia vyberte j",
    "content_length": 2877
  },
  {
    "path": "pages/topics/bert/README.md",
    "title": "Jazykový model slovenského jazyka",
    "categories": [],
    "tags": [],
    "published": true,
    "author": "Daniel Hládek",
    "taxonomy": {},
    "metadata": {
      "title": "Jazykový model slovenského jazyka",
      "published": true,
      "author": "Daniel Hládek"
    },
    "content_preview": "! Cieľ:\n!\n! - Natrénovať a vyhodnotiť slovenský jazykový model typu BERT z korpusu webových textov\n\n## Súvisiace projekty\n\n- [SlovakBERT](https://github.com/gerulata/slovakbert) od Kinit, a [článok](https://arxiv.org/abs/2109.15254)\n- [SK Quad](/topics/question) - Slovak Question Answering Dataset \n- bakalárska práca [Ondrej Megela](/students/2018/ondrej_megela)\n- diplomová práza Jozef Olekšák (in progress, trénovanie electra na colab).\n- https://git.kemt.fei.tuke.sk/dano/bert-train\n\n## Rozpraco",
    "content_length": 4790
  },
  {
    "path": "pages/topics/chatbot/README.md",
    "title": "Dialógový systém",
    "categories": [
      "project"
    ],
    "tags": [
      "chatbot",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "project"
      ],
      "tag": [
        "chatbot",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Dialógový systém",
      "published": true,
      "taxonomy": {
        "category": [
          "project"
        ],
        "tag": [
          "chatbot",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "Navrhnite a vytvorte dialógový systém komunikujúci v slovenskom jazyku pre úlohu komunikácie občana s mestom.\n\n## Úlohy\n\n- Zostavte bázu pravidiel pre systém RASA.\n- Vyhodnoťte chatbota pre rôzne úlohy.\n- Vytvorte a nasaďte webovú aplikáciu pre testovací prístup.\n\n- Spracujte dáta o digitálnych služnách od mesta. Vytvorte z nich trénovaciu databázu.\n- Identifikujte agendu ktorú by riešil chatbot.\n- Identifikujte, ktoré časti pravidiel sa budú dať meniť.\n- Vytvorte webovú aplikáciu pre úpravu báz",
    "content_length": 1675
  },
  {
    "path": "pages/topics/faq/README.md",
    "title": null,
    "categories": [
      "info"
    ],
    "tags": [
      "zp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "info"
      ],
      "tag": [
        "zp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "published": true,
      "taxonomy": {
        "category": [
          "info"
        ],
        "tag": [
          "zp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Často kladené otázky\n\n## Pre koho to je?\n\nStránka je určená pre študentov a vyučujúcich na Katedre elektroniky a multimediálnych telekomunikácií pre zdieľanie výsledkov záverečných prác.\nPomôže aj záujemcom o štúdium, zamestnávateľom a partnerom katedry na získanie prehľadu o študentskej odbornej činnosti.\n\n## Ako to funguje\n\nStránka je založená na princípe WIKI - každý prihlásený použvateľ môže zapisovať na ľubovoľné miesto. Každá zmena aj jej autor sa ale zaznamenáva pomocou [systému GIT](ht",
    "content_length": 3809
  },
  {
    "path": "pages/topics/hatespeech/README.md",
    "title": "Hate Speech",
    "categories": [
      "project"
    ],
    "tags": [
      "hatespeech",
      "nlp",
      "nlm"
    ],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {
      "title": "Hate Speech",
      "category": [
        "project"
      ],
      "tag": [
        "hatespeech",
        "nlp",
        "nlm"
      ]
    },
    "content_preview": "# Hate Speech Scientific Project\n\nGoal:\n\n- To be able to recognize parts of text that contains hate or vulgarisms.\n\nPossible applications:\n\n- Management of discussion forums / detection of spam or abuse.\n- \"Postprocessing\" for biased generative language models - preventing to generate inapropriate responses.\n\nPlan:\n\n- Perform a review of the state-of-the-art\n- Pick established (english) corpora\n- Formalize the problem - classification of sentiment, recognition of topic, keyword selection, \n- Pro",
    "content_length": 2083
  },
  {
    "path": "pages/topics/legal/README.md",
    "title": "Legal Data Processing",
    "categories": [
      "project"
    ],
    "tags": [
      "legal",
      "nlp"
    ],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {
      "title": "Legal Data Processing",
      "category": [
        "project"
      ],
      "tag": [
        "legal",
        "nlp"
      ]
    },
    "content_preview": "# Legal Data Processing Scientific Project\n\nGoal:\n\n- Help the slovak judges \n\nPossible applications:\n\n- agent retrieval agent to search in laws and processdings.\n- question answering system\n\nPlan:\n\n- Develop a demo agent for  legal and proceeding  retrieval anad answering.\n- Develop a summarization system - retrieve and highlight important parts of document. Generate a summary.\n\n\nPeople:\n\n- Daniel Hládek\n- [Martin Šarišský](/students/2021/martin_sarissky)  - agentový systém\n- [Matej Ščišľak](/st",
    "content_length": 1876
  },
  {
    "path": "pages/topics/morphology/README.md",
    "title": "Morfologická analýza slovenského jazyka",
    "categories": [
      "project"
    ],
    "tags": [
      "pos",
      "spacy",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "project"
      ],
      "tag": [
        "pos",
        "spacy",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Morfologická analýza slovenského jazyka",
      "published": true,
      "taxonomy": {
        "category": [
          "project"
        ],
        "tag": [
          "pos",
          "spacy",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Morfologická analýza slovenského jayzka\n\n\nIdentifikácia morfologických jednotiek\n\n- Hunspell Leamtizátor, pravidlá pre affix\n\nByte Pair Encoding\n\nWord Prep  https://ieeexplore.ieee.org/document/9005608\n\n\nMorfessor morfologické jednotky",
    "content_length": 237
  },
  {
    "path": "pages/topics/named-entity/README.md",
    "title": "Pomenované entity",
    "categories": [
      "project"
    ],
    "tags": [
      "ner",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "project"
      ],
      "tag": [
        "ner",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Pomenované entity",
      "published": true,
      "taxonomy": {
        "category": [
          "project"
        ],
        "tag": [
          "ner",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Pomenované entity\n## Stretnutia\n\n11.8.2020\n\nRozdelíme wikicorpus na 100 častí.\n\nNebudeme riešiť doménový bias vo wikipédii.\n\nBudeme riešiť bias na dĺžku článkov.\n\nTagová značka asi: LOC, MISC, ORG, PER.\n\nPeter sa pozrie na wikiextraktor.\n\nDaniel:\n\n- vyrieši šablóny\n- vypočíta štatistiky o dĺžke paragrafov\n- navrhne pravidlo na ohodnotenie kvality článku, Kvalita článku závisí na dĺžke dobrých paragrafov a dĺžke celého článku.\n\n## Úlohy\n\n### Príprava dát\n\n[Repozitár annotation/wikicorpus](https",
    "content_length": 2232
  },
  {
    "path": "pages/topics/named-entity/navod/README.md",
    "title": "Anotácia pomenovaných entít",
    "categories": [],
    "tags": [
      "ner",
      "annotation"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "author": "Daniel Hladek",
      "categories": [
        "project"
      ],
      "tags": [
        "ner",
        "annotation"
      ]
    },
    "metadata": {
      "title": "Anotácia pomenovaných entít",
      "published": true,
      "process": {
        "twig": true
      },
      "cache_enable": false,
      "taxonomy": {
        "author": "Daniel Hladek",
        "categories": [
          "project"
        ],
        "tags": [
          "ner",
          "annotation"
        ]
      },
      "forms": {
        "ner1": {
          "name": "ner1",
          "fields": [
            {
              "name": "name",
              "label": "Login",
              "placeholder": "Váš e-mail",
              "autofocus": true,
              "autocomplete": true,
              "type": "email",
              "validate": {
                "required": true,
                "message": "Musíte zadať platný e-mail aby sa započítala anotácia"
              }
            }
          ],
          "buttons": [
            {
              "type": "submit",
              "value": "Začni anotovať"
            }
          ],
          "process": [
            {
              "redirect": "https://skner.tukekemt.xyz/?session={{ form.value.name }}"
            }
          ]
        }
      }
    },
    "content_preview": "# Anotácia pomenovaných entít\n\nPomôžte nám pri vedeckom výskume tým, že naučíte stroj rozpoznávať vlastné podstatné mená.\nUčenie prebieha tak, že v texte ukážete ktoré slová patria názvom osôb, miest, organizácií alebo vecí.\nÚčasť v tomto experimente Vám pomôže vylepšiť Vaše študijné výsledky a vyhrať aj televízny otázkový kvíz \"Tisícionár\".\n\n## Návod pre anotátorov\n\n\nVašou úlohou bude v texte vyznačiť vlastné podstatné mená.\nVlastné podstatné meno sa v slovenskom jazyku spravidla začína veľkým ",
    "content_length": 1925
  },
  {
    "path": "pages/topics/nlp/README.md",
    "title": "Nástroje a zdroje pre spracovanie prirodzeného jazyka",
    "categories": [
      "info"
    ],
    "tags": [
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "info"
      ],
      "tag": [
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Nástroje a zdroje pre spracovanie prirodzeného jazyka",
      "published": true,
      "taxonomy": {
        "category": [
          "info"
        ],
        "tag": [
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "## Knihy\n\n- Lane, Howard, Hopke: Natural language processing  in action\n- [Spacy Tutoriál](https://nlpforhackers.io/complete-guide-to-spacy/)\n- [Dive into Python](https://diveintopython3.problemsolving.io/)  [(česky)](http://diveintopython3.py.cz/index.html)\n- [Natural Language Processing in Action](https://www.manning.com/books/natural-language-processing-in-action) [(git)](https://github.com/totalgood/nlpia)\n- [Python Data Science Handbook](https://github.com/jakevdp/PythonDataScienceHandbook)",
    "content_length": 1524
  },
  {
    "path": "pages/topics/otvorene/README.md",
    "title": "Otvorené projekty",
    "categories": [
      "info"
    ],
    "tags": [
      "nn",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "info"
      ],
      "tag": [
        "nn",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Otvorené projekty",
      "published": true,
      "taxonomy": {
        "category": [
          "info"
        ],
        "tag": [
          "nn",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Otvorené témy záverečných prác\n\nDaniel Hládek\n\n\n## Nápady na projekty\n\n- Čistenie dát - zlepšenie webových trénovacích korpusov. Identifikácia \"neužitočných častí\" textu. Reklámy, eshopy. Vulgárne diskusie. Zostavenie modelu pre identifikáciu.\n- Sumarizácia na súdnych alebo lekárskych dátach.\n- Dotrénovanie jazykového modelu pre súdnu alebo lekársku doménu pomoocu LORA/PEFT.\n- Spracovanie pomenovaných entít - anonymizácia. \n- Grafové neurónové siete - súdna doména. Alebo Open Data. \n- Zber slo",
    "content_length": 3062
  },
  {
    "path": "pages/topics/prodigy/README.md",
    "title": "Anotácia textových dát",
    "categories": [
      "info"
    ],
    "tags": [
      "annotation",
      "ner",
      "question-answer",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "info"
      ],
      "tag": [
        "annotation",
        "ner",
        "question-answer",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Anotácia textových dát",
      "published": true,
      "taxonomy": {
        "category": [
          "info"
        ],
        "tag": [
          "annotation",
          "ner",
          "question-answer",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Anotácia textových dát\n\n- Natrénovanie štatistického modelu pre spracovanie prirodzeného jazyka zo slovenských dát\n- Manuálna anotácia slovenských dát pre výskyt pomenovaných entít\n\n## Postup\n\n- Definovanie anotačnej schémy\n- Príprava dátovej množiny vhodnej na anotáciu\n- Natrénovanie štatistického modelu Spacy\n- Príprava anotačnej úlohy Prodigy\n\n## Nástroje\n\n- Python (príprava dát)\n- Spacy (štatistický model) [Spacy](https://spacy.io/))\n- [Prodigy](https://prodi.gy/) (anotácie) \n\n## Riešiteli",
    "content_length": 646
  },
  {
    "path": "pages/topics/python/README.md",
    "title": "Jazyk Python",
    "categories": [
      "info"
    ],
    "tags": [
      "python"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "info"
      ],
      "tag": [
        "python"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Jazyk Python",
      "published": true,
      "taxonomy": {
        "category": [
          "info"
        ],
        "tag": [
          "python"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Práca s jazykom Python v prostredí Anaconda\n\nVhodný na spracovanie prirodzeného jazyka\n\n\nPodobné prostredie si viete vytvoriť na Vašom počítači, na školskom servri alebo na Google Colab.\n\n\n## Ako začať s Pythonom\n\nPrečítajte si \n\nhttps://diveintopython3.net/\n\nhttp://diveintopython3.py.cz/index.html\n\nhttps://jakevdp.github.io/PythonDataScienceHandbook/\n\n## Vývojové prostredie Anaconda\n\nNainštalujte si prostedie [anaconda](https://www.anaconda.com/). \n\nStiahnite si [inštalátor](https://docs.cond",
    "content_length": 2940
  },
  {
    "path": "pages/topics/question/README.md",
    "title": "Question Answering",
    "categories": [
      "project"
    ],
    "tags": [
      "annotation",
      "question-answer",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "project"
      ],
      "tag": [
        "annotation",
        "question-answer",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Question Answering",
      "published": true,
      "taxonomy": {
        "category": [
          "project"
        ],
        "tag": [
          "annotation",
          "question-answer",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Question Answering\n\n- [Project repository](https://git.kemt.fei.tuke.sk/dano/annotation) (private)\n- [Annotation Manual for question annotation](navod)\n- [Annotation Manual for validations](validacie)\n- [Annotation Manual for unanswerable questions](nezodpovedatelne)\n- [Summary database application](https://app.question.tukekemt,xyz)\n\n\n## Project Description\n\n- Create a clone of [SQuaD 2.0](https://rajpurkar.github.io/SQuAD-explorer/) in the Slovak language\n- Setup annotation infrastructure wi",
    "content_length": 5492
  },
  {
    "path": "pages/topics/question/navod/README.md",
    "title": "Anotácia otázok a odpovedí",
    "categories": [],
    "tags": [
      "question-answer",
      "annotation"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "author": "Daniel Hladek",
      "categories": [
        "project"
      ],
      "tags": [
        "question-answer",
        "annotation"
      ]
    },
    "metadata": {
      "title": "Anotácia otázok a odpovedí",
      "published": true,
      "process": {
        "twig": true
      },
      "cache_enable": false,
      "taxonomy": {
        "author": "Daniel Hladek",
        "categories": [
          "project"
        ],
        "tags": [
          "question-answer",
          "annotation"
        ]
      },
      "forms": {
        "question1": {
          "name": "question1",
          "fields": [
            {
              "name": "name",
              "label": "Login",
              "placeholder": "Váš e-mail",
              "autofocus": true,
              "autocomplete": true,
              "type": "email",
              "validate": {
                "required": true,
                "message": "Musíte zadať platný e-mail aby sa započítala anotácia"
              }
            }
          ],
          "buttons": [
            {
              "type": "submit",
              "value": "Začni anotovať"
            }
          ],
          "process": [
            {
              "redirect": "https://question.tukekemt.xyz/?session={{ form.value.name }}"
            }
          ]
        },
        "questionapp": {
          "name": "questionapp",
          "fields": [
            {
              "name": "name",
              "label": "Login",
              "placeholder": "Váš e-mail",
              "autofocus": true,
              "autocomplete": true,
              "type": "email",
              "validate": {
                "required": true,
                "message": "Zadajte e-mail s anotáciami"
              }
            }
          ],
          "buttons": [
            {
              "type": "submit",
              "value": "Koľko som anotoval?"
            }
          ],
          "process": [
            {
              "redirect": "https://app.question.tukekemt.xyz/annotator/{{ form.value.name }}"
            }
          ]
        }
      }
    },
    "content_preview": "Pomôžte nám pri vedeckom výskume tým, že naučíte stroj odpovedať na otázky z Wikipédie. \nUčenie prebieha tak, že vytvoríte príklad s otázkou a odpoveďou. Účasť v tomto experimente Vám pomôže vylepšiť Vaše študijné výsledky a vyhrať televízny kvíz \"Tisícionár\".\n\n## Návod pre anotátorov\n\nAk chcete, pozrite si [videonávod](https://files.kemt.fei.tuke.sk/predmety/question_answer/navod1.mp4) a [motivačnú prednášku](https://files.kemt.fei.tuke.sk/predmety/usaa/videa/usaa20pr10.mp4) o  systémoch na gen",
    "content_length": 4408
  },
  {
    "path": "pages/topics/question/nezodpovedatelne/README.md",
    "title": "Tvorba nezodpovedateľných otázok",
    "categories": [],
    "tags": [
      "question-answer",
      "annotation"
    ],
    "published": false,
    "author": "Daniel Hladek",
    "taxonomy": {
      "author": "Daniel Hladek",
      "categories": [
        "project"
      ],
      "tags": [
        "question-answer",
        "annotation"
      ]
    },
    "metadata": {
      "title": "Tvorba nezodpovedateľných otázok",
      "published": false,
      "process": {
        "twig": true
      },
      "cache_enable": false,
      "taxonomy": {
        "author": "Daniel Hladek",
        "categories": [
          "project"
        ],
        "tags": [
          "question-answer",
          "annotation"
        ]
      },
      "forms": {
        "question3": {
          "name": "question3",
          "fields": [
            {
              "name": "name",
              "label": "Login",
              "placeholder": "Váš e-mail",
              "autofocus": true,
              "autocomplete": true,
              "type": "email",
              "validate": {
                "required": true,
                "message": "Musíte zadať platný e-mail aby sa započítala anotácia"
              }
            }
          ],
          "buttons": [
            {
              "type": "submit",
              "value": "Začni anotovať"
            }
          ],
          "process": [
            {
              "redirect": "https://unanswerable.question.tukekemt.xyz/?session={{ form.value.name }}"
            }
          ]
        },
        "questionapp": {
          "name": "questionapp",
          "fields": [
            {
              "name": "name",
              "label": "Login",
              "placeholder": "Váš e-mail",
              "autofocus": true,
              "autocomplete": true,
              "type": "email",
              "validate": {
                "required": true,
                "message": "Zadajte e-mail s anotáciami"
              }
            }
          ],
          "buttons": [
            {
              "type": "submit",
              "value": "Koľko som anotoval?"
            }
          ],
          "process": [
            {
              "redirect": "https://app.question.tukekemt.xyz/annotator/{{ form.value.name }}"
            }
          ]
        }
      }
    },
    "content_preview": "Pomôžte nám pri vedeckom výskume tým, že naučíte stroj odpovedať na otázky z Wikipédie. \nÚčasť v tomto experimente Vám pomôže vylepšiť Vaše študijné výsledky a vyhrať televízny kvíz \"Tisícionár\".\nHotová nezodpovedateľná otázka a odpoveď bude slúžiť ako negatívny príklad pre učenie systému pre automatické odpovede. Vďaka negatívnym príkladom bude možné lepšie rozlíšiť, ktoré odpovede systému sú nerelevantné k danému odseku.\n\nAk chcete, pozrite si  [motivačnú prednášku](https://files.kemt.fei.tuke",
    "content_length": 2972
  },
  {
    "path": "pages/topics/question/validacie/README.md",
    "title": "Validácia otázok a odpovedí",
    "categories": [],
    "tags": [
      "question-answer",
      "annotation"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "author": "Daniel Hladek",
      "categories": [
        "project"
      ],
      "tags": [
        "question-answer",
        "annotation"
      ]
    },
    "metadata": {
      "title": "Validácia otázok a odpovedí",
      "published": true,
      "process": {
        "twig": true
      },
      "cache_enable": false,
      "taxonomy": {
        "author": "Daniel Hladek",
        "categories": [
          "project"
        ],
        "tags": [
          "question-answer",
          "annotation"
        ]
      },
      "forms": {
        "question2": {
          "name": "question2",
          "fields": [
            {
              "name": "name",
              "label": "Login",
              "placeholder": "Váš e-mail",
              "autofocus": true,
              "autocomplete": true,
              "type": "email",
              "validate": {
                "required": true,
                "message": "Musíte zadať platný e-mail aby sa započítala anotácia"
              }
            }
          ],
          "buttons": [
            {
              "type": "submit",
              "value": "Začni anotovať"
            }
          ],
          "process": [
            {
              "redirect": "https://validation.question.tukekemt.xyz/?session={{ form.value.name }}"
            }
          ]
        },
        "questionapp": {
          "name": "questionapp",
          "fields": [
            {
              "name": "name",
              "label": "Login",
              "placeholder": "Váš e-mail",
              "autofocus": true,
              "autocomplete": true,
              "type": "email",
              "validate": {
                "required": true,
                "message": "Zadajte e-mail s anotáciami"
              }
            }
          ],
          "buttons": [
            {
              "type": "submit",
              "value": "Koľko som anotoval?"
            }
          ],
          "process": [
            {
              "redirect": "https://app.question.tukekemt.xyz/annotator/{{ form.value.name }}"
            }
          ]
        }
      }
    },
    "content_preview": "Pomôžte nám pri vedeckom výskume tým, že naučíte stroj odpovedať na otázky z Wikipédie. \nUčenie prebieha tak, že vytvoríte príklad s otázkou a odpoveďou. Účasť v tomto experimente Vám pomôže vylepšiť Vaše študijné výsledky a vyhrať televízny kvíz \"Tisícionár\".\n\nAk chcete, pozrite si  [motivačnú prednášku](https://files.kemt.fei.tuke.sk/predmety/usaa/videa/usaa20pr10.mp4) o  systémoch na generovanie odpovede na otázku v prirodzenom jazyku.\n\n# Úloha\n\nVašou úlohou bude overiť, či je napísaná otázka",
    "content_length": 2171
  },
  {
    "path": "pages/topics/resources/README.md",
    "title": "Slovenské jazykové zdroje",
    "categories": [
      "info"
    ],
    "tags": [
      "annotation",
      "ner",
      "pos",
      "question-answer",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "info"
      ],
      "tag": [
        "annotation",
        "ner",
        "pos",
        "question-answer",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Slovenské jazykové zdroje",
      "published": true,
      "taxonomy": {
        "category": [
          "info"
        ],
        "tag": [
          "annotation",
          "ner",
          "pos",
          "question-answer",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Slovenské jazykové zdroje\n\n### POS\n\n[Multext East](http://nl.ijs.si/ME/)  Anotovaný román George Orwell 1984 v 15 európskych jazykoch\n\n\n### NER\n\n- Learning multilingual named entity recognition from Wikipedia- WIKI Ner?\n- Cross-lingual Name Tagging and Linking for 282 Languages - NER anotácia aj slovenskej Wikipédie podľa anglickej\n    -  https://drive.google.com/drive/folders/1bkK6ly_awxe9IgAKL16VVvCtjcYcDSw8\n    -  https://elisa-ie.github.io/wikiann/\n\n### Parsing-POS\n\n[Slovak Dependency Tree",
    "content_length": 2631
  },
  {
    "path": "pages/topics/seq2seq/README.md",
    "title": "Prepis postupností",
    "categories": [
      "info"
    ],
    "tags": [
      "nn",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "info"
      ],
      "tag": [
        "nn",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Prepis postupností",
      "published": true,
      "taxonomy": {
        "category": [
          "info"
        ],
        "tag": [
          "nn",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Sequence to sequence\n\n[Fairseq](https://github.com/pytorch/fairseq) je riadkový nástroj pre spracovanie prirodezného jazyka  naprogramovaný v jazyku Python využívajúci neurónové siete.\nVie sa na príkladoch naučiť ako prepisovať jednu postupnosť ľubovoľných symbolov (znakov alebo slov) na inú postuponosť.\n\n\n## Transformer\n\nNiektoré zaujímavé odkazy na tému sequence to sequence:\n\nhttps://github.com/pytorch/fairseq\n\nhttp://jalammar.github.io/illustrated-transformer/\n\nhttps://arxiv.org/abs/1706.03",
    "content_length": 503
  },
  {
    "path": "pages/topics/spacy/README.md",
    "title": "Podpora slovenčiny v knižnici Spacy",
    "categories": [
      "project"
    ],
    "tags": [
      "spacy",
      "nn",
      "pos",
      "ner",
      "annotation",
      "nlp"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "project"
      ],
      "tag": [
        "spacy",
        "nn",
        "pos",
        "ner",
        "annotation",
        "nlp"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Podpora slovenčiny v knižnici Spacy",
      "published": true,
      "taxonomy": {
        "category": [
          "project"
        ],
        "tag": [
          "spacy",
          "nn",
          "pos",
          "ner",
          "annotation",
          "nlp"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "[Trénovanie modelov Spacy](https://spacy.io/usage/training)\n\n## Ciele\n\n- Vytvoriť modul v jazyku Python  pre podporu slovenčiny\n- Natrénovať štatistické modely:\n   - pre morfologickú analýzu \n   - rozpoznávanie pomenovaných entít\n- Unifikovaný systém pre predspracovanie slovenského jazyka\n- Možné aplikácie:\n    - Podporiť dialógový systém RASA\n    - Neurónové vyhľadávanie\n\n## Hotové úlohy\n\n- trénovanie modelu Spacy 2, kompletné skripty\n- trénovanie modelu Spacy 3 do SNK POS tagsetu (ver. 3.0), k",
    "content_length": 2107
  },
  {
    "path": "pages/topics/steel/README.md",
    "title": null,
    "categories": [],
    "tags": [],
    "published": null,
    "author": null,
    "taxonomy": {},
    "metadata": {},
    "content_preview": "# AI4Steel\n\n## Cieľ\n\n- Návrh modelu zloženia tavnej zmesi v konvertore  s využitím hlbokých neurónových sietí\n\n## Riešitelia\n\n- [Maroš Harahus](/students/2016/maros_harahus)\n- Lukáš Hruška\n\n## Metódy\n\n- klasické (štatistické) metódy predikcie postupností a predikcie časových radov.\n- modelovanie pomocou hlbokých neurónových sietí (RNN, LSTM, VAE, CNN, Transformer, GNN, GAN)\n- https://en.m.wikipedia.org/wiki/Basic_oxygen_steelmaking\n- Time Series Prediction\n- Markov Decision Process?\n- Možné nást",
    "content_length": 2728
  },
  {
    "path": "pages/topics/translation/README.md",
    "title": "Strojový preklad",
    "categories": [
      "project"
    ],
    "tags": [
      "translation"
    ],
    "published": true,
    "author": "Daniel Hladek",
    "taxonomy": {
      "category": [
        "project"
      ],
      "tag": [
        "translation"
      ],
      "author": "Daniel Hladek"
    },
    "metadata": {
      "title": "Strojový preklad",
      "published": true,
      "taxonomy": {
        "category": [
          "project"
        ],
        "tag": [
          "translation"
        ],
        "author": "Daniel Hladek"
      }
    },
    "content_preview": "# Strojový preklad\n\n- Štatistický strojový preklad\n- Neurónový strojový preklad\n\n## Študenti\n\n- [Patrik Pavlišin](/students/2016/patrik_pavlisin)\n- [Dominik Nagy](/students/2016/dominik_nagy)\n- [Martin Jancura](/students/2017/martin_jancura)",
    "content_length": 241
  }
]