zpwiki/pages/students/2016/maros_harahus/mark_feher/README.md

1.0 KiB

title published taxonomy
Márk Fehér true
category tag author
dp2022
scikit
nlp
klasifikácia
Daniel Hladek

Márk Fehér

Názov diplomovej práce: Klasifikácia textu metódami strojového učenia

Návrh na zadanie DP

  1. Vypracujte prehľad metód klasifikácie textu metódami strojového učenia.
  2. Pripravte slovenské trénovacie dáta vo vhodnom formáte a natrénujte viacero modelov pre klasifikáciu textu do viacerých kategórií
  3. Navrhnite, vykonajte a vyhodnoťte experimenty pre porovnanie presnosti klasifikácie textu.
  4. Navrhnite zlepšenia presnosti klasifikácie textu.

Diplomový projekt 2021

Stav:

  • vypracovaný draft diplomovej práce
  • pripravené dáta z BeautifulSoup - z rôznych webov (sme.sk)
  • vypracované experimenty pomocou scikit-learn na klasifikátoroch:
    • multinomial Bayes
    • random forest
    • support vector machine
    • Stochastic Gradient Descent Classifier
    • k-neighbours
    • decision tree
  • vypracované vyhodnotenie pomocou konfúznej matice,