forked from KEMT/zpwiki
		
	
		
			
				
	
	
		
			35 lines
		
	
	
		
			851 B
		
	
	
	
		
			Markdown
		
	
	
	
	
	
			
		
		
	
	
			35 lines
		
	
	
		
			851 B
		
	
	
	
		
			Markdown
		
	
	
	
	
	
---
 | 
						|
title: Anotácia textových dát
 | 
						|
published: true
 | 
						|
taxonomy:
 | 
						|
    category: [info]
 | 
						|
    tag: [annotation,ner,question-answer,nlp]
 | 
						|
    author: Daniel Hladek
 | 
						|
---
 | 
						|
 | 
						|
# Anotácia textových dát
 | 
						|
 | 
						|
- Natrénovanie štatistického modelu pre spracovanie prirodzeného jazyka zo slovenských dát
 | 
						|
- Manuálna anotácia slovenských dát pre výskyt pomenovaných entít
 | 
						|
 | 
						|
## Postup
 | 
						|
 | 
						|
- Definovanie anotačnej schémy
 | 
						|
- Príprava dátovej množiny vhodnej na anotáciu
 | 
						|
- Natrénovanie štatistického modelu Spacy
 | 
						|
- Príprava anotačnej úlohy Prodigy
 | 
						|
 | 
						|
## Nástroje
 | 
						|
 | 
						|
- Python (príprava dát)
 | 
						|
- Spacy (štatistický model) [Spacy](https://spacy.io/))
 | 
						|
- [Prodigy](https://prodi.gy/) (anotácie) 
 | 
						|
 | 
						|
## Riešitelia
 | 
						|
 | 
						|
- Andrej Hopko (BP, ex?)
 | 
						|
- Tomáš Kuchárik (príprava dát z wikipedie)
 | 
						|
- Jakub Maruniak
 | 
						|
- [Cesar Gutierez](/topics/named-entity) (stáž leto 2019)
 | 
						|
 |