From 6b2a8ba95d9fd50d78d2699181976b76c9be5f6c Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Maro=C5=A1=20Harahus?= Date: Sat, 14 Dec 2019 22:17:38 +0000 Subject: [PATCH] Aktualizovat "pages/students/2016/maros_harahus/timovy_projekt/README.md --- .../2016/maros_harahus/timovy_projekt/README.md | 10 +++++----- 1 file changed, 5 insertions(+), 5 deletions(-) diff --git a/pages/students/2016/maros_harahus/timovy_projekt/README.md b/pages/students/2016/maros_harahus/timovy_projekt/README.md index b57c8793..83c61975 100644 --- a/pages/students/2016/maros_harahus/timovy_projekt/README.md +++ b/pages/students/2016/maros_harahus/timovy_projekt/README.md @@ -148,12 +148,12 @@ for token in doc: * **token.idx** znakový index začiatku, * **token.lemma_** základná podoba tokenu bez inflexných prípon, - * **token.is_punct** je to interpunkcia znamienka, - * **token.is_space** pozostáva token z bielych znakov, - * **token.shape_** transformácia reťazca tokenov na zobrazenie ortografických prvkov, +* **token.is_punct** je to interpunkcia znamienka, +* **token.is_space** pozostáva token z bielych znakov, +* **token.shape_** transformácia reťazca tokenov na zobrazenie ortografických prvkov, napríklad „Xxxx“ alebo „dd“ - * **token.pos_** hrubozrnná časť reči, - ***token.tag_** jemnozrnná reč. +* **token.pos_** hrubozrnná časť reči, +* **token.tag_** jemnozrnná reč. Poďme si rozobrať výstup prvého slova Next. Ako prvé sa nám vypíše samotné slovo, ďalej nasleduje, na ktorom indexe slovo začína. V našom prípade je to index 0. V ďalšom stĺpci máme slovo napísané pomocou malých písmen. Ďalšie dva stĺpce nám zisťujú, či dané slovo obsahuje interpunkčné znamienko (napr. apostrof) a či slovo nepozostáva z medzery. Predposledný stĺpec nám zisťuje, aký slovný druh (viď. tabuľku nižšie) je dané slovo v našom prípade je to podstatné meno atd.