readme update

This commit is contained in:
Tomáš Kuchárik 2020-04-16 13:04:30 +02:00
parent e8c5619687
commit 150f099cbf

View File

@ -2,7 +2,7 @@
## Parsovanie wikipédie ## Parsovanie wikipédie
1. Parsovanie bzip2 suboru zo [https://dumps.wikimedia.org/skwiki/20200401/](slovenského wikidump) pomocou nástroja [wikiextractor](https://github.com/attardi/wikiextractor) 1. Parsovanie bzip2 suboru z [https://dumps.wikimedia.org/skwiki/20200401/](skwikidump) pomocou nástroja [wikiextractor](https://github.com/attardi/wikiextractor)
Príkaz na použitie nástroja wikiextractor Príkaz na použitie nástroja wikiextractor
python WikiExtractor.py <cesta k bzip2 súboru> -s -l -o <priečinok pre výstupné súbory> python WikiExtractor.py <cesta k bzip2 súboru> -s -l -o <priečinok pre výstupné súbory>