From 5ea1c96a202318bcf0f2fab1a2adf20522b17c56 Mon Sep 17 00:00:00 2001 From: Daniel Hladek Date: Fri, 18 Mar 2022 14:41:10 +0100 Subject: [PATCH] z --- pages/students/2020/matus_suchanic/README.md | 38 ++++++++++++++++++++ 1 file changed, 38 insertions(+) create mode 100644 pages/students/2020/matus_suchanic/README.md diff --git a/pages/students/2020/matus_suchanic/README.md b/pages/students/2020/matus_suchanic/README.md new file mode 100644 index 00000000..509d8c25 --- /dev/null +++ b/pages/students/2020/matus_suchanic/README.md @@ -0,0 +1,38 @@ +--- +title: Matúš Suchanič +published: true +taxonomy: + category: [vp2022] + tag: [spacy,nlp] + author: Daniel Hladek +--- + +rok začiatku štúdia: 2020 + +# Vedecký projekt 2022 + +Extrakcia informácií z webových stránok + + +Finálny cieľ: + +- Vytvoriť skript ktorý spracuje HTML kód a identifikuje zaujímavé časti z webstránky, napr. noviny alebo diskusie (modrý koník) +- Naučte sa niečo o spracovaní prirodzeného jazyka + +Výstupy: + +- Report na cca 4 strany - ako si nainštalovať anacondu, niečo o knižnici HUggingFace Transformers +- Skript na parsovanie dvoch stránok + +Stretnutie 18.3.2022 + +Úlohy: + +- Nainštalovať si systém Anaconda +- Napíšte návod ako nainštalovať a používať systém Anacona +- Nainštalovať si knižnicu BeautifulSoup4, prejsť si tutoriál +- napíšte krátky úvod do knižnice Huggingface Transformers +- Prečítajte si články o hlbokých neurónových sieťach a spracovaní prirodzeného jazyka + + +