forked from KEMT/zpwiki
14 lines
790 B
Markdown
14 lines
790 B
Markdown
## Update 09.04.2020
|
|
- Upravil som vzorový zdrojový kód, ktorý riešil Named-Entity Recognition, tak, aby dopĺňal interpunkciu.
|
|
- Momentálne to funguje s ručne vpísanými trénovacími dátami a ručným "otagovaním", avšak iba pre bodku a otáznik.
|
|
- Keď som skúšal použiť dáta, kde bol aj otáznik, ale namiesto otáznika model doplňoval bodku.
|
|
|
|
vysvetlenie zápisu dát:
|
|
- v texte som nahradil interpunciu slovami, resp. skratkami ('.' -> 'PER', ',' -> 'COM', '?' -> '.QUE')
|
|
- sekvencie slov som označil ako "S", nerozlišoval som slovné druhy
|
|
- interpunkčné znamienka som označil ako "C" (pre čiarku), "P" (pre bodku) a "Q" (pre otáznik)
|
|
|
|
vysvetlenie výstupu:
|
|
- Prvý tensor je predikcia modelu pred trénovaním.
|
|
- Druhý tensor je predikcia po trénovaní.
|