forked from KEMT/zpwiki
Aktualizovat "pages/students/2016/maros_harahus/timovy_projekt/README.md
This commit is contained in:
parent
8d39dffa52
commit
6b2a8ba95d
@ -148,12 +148,12 @@ for token in doc:
|
||||
|
||||
* **token.idx** znakový index začiatku,
|
||||
* **token.lemma_** základná podoba tokenu bez inflexných prípon,
|
||||
* **token.is_punct** je to interpunkcia znamienka,
|
||||
* **token.is_space** pozostáva token z bielych znakov,
|
||||
* **token.shape_** transformácia reťazca tokenov na zobrazenie ortografických prvkov,
|
||||
* **token.is_punct** je to interpunkcia znamienka,
|
||||
* **token.is_space** pozostáva token z bielych znakov,
|
||||
* **token.shape_** transformácia reťazca tokenov na zobrazenie ortografických prvkov,
|
||||
napríklad „Xxxx“ alebo „dd“
|
||||
* **token.pos_** hrubozrnná časť reči,
|
||||
***token.tag_** jemnozrnná reč.
|
||||
* **token.pos_** hrubozrnná časť reči,
|
||||
* **token.tag_** jemnozrnná reč.
|
||||
|
||||
Poďme si rozobrať výstup prvého slova Next. Ako prvé sa nám vypíše samotné slovo, ďalej nasleduje, na ktorom indexe slovo začína. V našom prípade je to index 0. V ďalšom stĺpci máme slovo napísané pomocou malých písmen. Ďalšie dva stĺpce nám zisťujú, či dané slovo obsahuje interpunkčné znamienko (napr. apostrof) a či slovo nepozostáva z medzery. Predposledný stĺpec nám zisťuje, aký slovný druh (viď. tabuľku nižšie) je dané slovo v našom prípade je to podstatné meno atd.
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user