Update pages/students/2022/serhii_yemets/README.md

2024-10-30 12:17:27 +00:00 · 2024-10-30 12:17:27 +00:00 · 4936ab1e93
commit 4936ab1e93
parent d22679dab6
1 changed files with 3 additions and 3 deletions
--- a/pages/students/2022/serhii_yemets/README.md
+++ b/pages/students/2022/serhii_yemets/README.md
@ -34,13 +34,13 @@ Stav:
 Úlohy:

 - Naštudujte korpusy s NER pre slovenský jazyk. Napíšte ich zoznam. Ku každému napíšte veľkosť (počet viet, slov) a druhy pomenovaných entít.
- Najprv budeme pracovať s ručne anotovanými dátami. Použite ich na natrénovanie modelu typu BERT (napr. SlovakBER alebo mbert) a vyhodnotte ich presnosť.
+- Najprv budeme pracovať s ručne anotovanými dátami. Použite ich na natrénovanie modelu typu BERT (napr. SlovakBER alebo mbert) a vyhodnotte ich presnosť. Na trénovanie použite Spacy alebo Transformers.
 - Pokračujte v písaní BP.  Stručne (max. 1.5 strany) vysvetlite ako funguje transformer. Na google scholar nájdite vedecké články o NER a napíšte čo ste sa z nich dozvedeli. Aké majú výsledky a aké metódy používaju?
-
+- Prejdite si tutoriál https://huggingface.co/docs/transformers/en/tasks/token_classification

 Zásobník úloh:

- Natrénujte nový Spacy NER model ktorý by bol lepší ako pôvodný.
+- Natrénujte nový Spacy  NER model ktorý by bol lepší ako pôvodný.
 - Spojte viacero dátových množin  (manuálne anotovaných) do jednej a použite je na natrénovanie modelu. 
 - Použite veľký jazykový model pre NER anotáciu a porovnajte ho s menším dotrénovaným NER modelom.
 - Vykonané experimenty slovne opíšte a výslekdy zapíšte do tabuliek. Výsledky slovne okomentujte.