Aktualizovat "pages/students/2016/maros_harahus/timovy_projekt/README.md

This commit is contained in:
Maroš Harahus 2019-12-14 22:17:38 +00:00
parent 8d39dffa52
commit 6b2a8ba95d

View File

@ -148,12 +148,12 @@ for token in doc:
* **token.idx** znakový index začiatku,
* **token.lemma_** základná podoba tokenu bez inflexných prípon,
* **token.is_punct** je to interpunkcia znamienka,
* **token.is_space** pozostáva token z bielych znakov,
* **token.shape_** transformácia reťazca tokenov na zobrazenie ortografických prvkov,
* **token.is_punct** je to interpunkcia znamienka,
* **token.is_space** pozostáva token z bielych znakov,
* **token.shape_** transformácia reťazca tokenov na zobrazenie ortografických prvkov,
napríklad „Xxxx“ alebo „dd“
* **token.pos_** hrubozrnná časť reči,
***token.tag_** jemnozrnná reč.
* **token.pos_** hrubozrnná časť reči,
* **token.tag_** jemnozrnná reč.
Poďme si rozobrať výstup prvého slova Next. Ako prvé sa nám vypíše samotné slovo, ďalej nasleduje, na ktorom indexe slovo začína. V našom prípade je to index 0. V ďalšom stĺpci máme slovo napísané pomocou malých písmen. Ďalšie dva stĺpce nám zisťujú, či dané slovo obsahuje interpunkčné znamienko (napr. apostrof) a či slovo nepozostáva z medzery. Predposledný stĺpec nám zisťuje, aký slovný druh (viď. tabuľku nižšie) je dané slovo v našom prípade je to podstatné meno atd.