From 4936ab1e9335d8fb8db97c2770d40cf32269137e Mon Sep 17 00:00:00 2001 From: dano Date: Wed, 30 Oct 2024 12:17:27 +0000 Subject: [PATCH] Update pages/students/2022/serhii_yemets/README.md --- pages/students/2022/serhii_yemets/README.md | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/pages/students/2022/serhii_yemets/README.md b/pages/students/2022/serhii_yemets/README.md index 2acc17f1..83c94a7e 100644 --- a/pages/students/2022/serhii_yemets/README.md +++ b/pages/students/2022/serhii_yemets/README.md @@ -34,13 +34,13 @@ Stav: Úlohy: - Naštudujte korpusy s NER pre slovenský jazyk. Napíšte ich zoznam. Ku každému napíšte veľkosť (počet viet, slov) a druhy pomenovaných entít. -- Najprv budeme pracovať s ručne anotovanými dátami. Použite ich na natrénovanie modelu typu BERT (napr. SlovakBER alebo mbert) a vyhodnotte ich presnosť. +- Najprv budeme pracovať s ručne anotovanými dátami. Použite ich na natrénovanie modelu typu BERT (napr. SlovakBER alebo mbert) a vyhodnotte ich presnosť. Na trénovanie použite Spacy alebo Transformers. - Pokračujte v písaní BP. Stručne (max. 1.5 strany) vysvetlite ako funguje transformer. Na google scholar nájdite vedecké články o NER a napíšte čo ste sa z nich dozvedeli. Aké majú výsledky a aké metódy používaju? - +- Prejdite si tutoriál https://huggingface.co/docs/transformers/en/tasks/token_classification Zásobník úloh: -- Natrénujte nový Spacy NER model ktorý by bol lepší ako pôvodný. +- Natrénujte nový Spacy NER model ktorý by bol lepší ako pôvodný. - Spojte viacero dátových množin (manuálne anotovaných) do jednej a použite je na natrénovanie modelu. - Použite veľký jazykový model pre NER anotáciu a porovnajte ho s menším dotrénovaným NER modelom. - Vykonané experimenty slovne opíšte a výslekdy zapíšte do tabuliek. Výsledky slovne okomentujte.