diff --git a/pages/students/2018/adrian_remias/README.md b/pages/students/2018/adrian_remias/README.md index 2a513e74..285106cf 100644 --- a/pages/students/2018/adrian_remias/README.md +++ b/pages/students/2018/adrian_remias/README.md @@ -27,6 +27,22 @@ Ciele: - Natrénovanie modelu pre opravu iterpunkcie a jeho vyhodnotenie. - Výsledky by mali byť prezentovateľné vo vedeckom článku. +Stretnutie 23.11.2023 + +Stav: + +- Boli nainštalované softvéry na idoc podľa pokynov. +- Śtúdium a kódovanie: problémy. + +Úlohy: + +- Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si + článok. Urobte si poznámky čo ste sa dozvedeli. Zistite, aké metódy iné sa používajú na PR a aká metóda je v článku. Zistitie, ako to súvisí s Modelom BERT. + - Pohľadajte iný podobný repozitár. + - Získajte zdrojové kódy a spustite experimenty v naglickom a bangla jazyku s dátami dodanými v repozitári. Oboznámte sa so zdrojovými kódmi a skúste pochopiť ktorá časť robí čo. + - Pokračujte v štúdiu jazyka Python. + - Pokračujte v písaní práce podľa pokynov vyššie. + Stretnutie 26.10.2023 Stav: @@ -36,13 +52,13 @@ Stav: Úlohy: -- Pokračovať v štúdiu a v poznámkach. To je teoretická časť DP. +- [ ] Pokračovať v štúdiu a v poznámkach. To je teoretická časť DP. - [-] Na katedrovom gite si vytvorte repozitár s názvom DP2024, do neho dajte kódy pre tvorbu dát a trénovanie siete. Dáta nedávajte na git. - [x] Inštalujte Pytorch s podporou CUDA 10.1 alebo 10.2 z https://pytorch.org/get-started/previous-versions/ - [x] Na idoc nainštalujte transformers, pytorch s CUDA 10.1 pomocou Anaconda. - Vyberte množinu slovenských textov a upravte ju do podoby vhodnej na trénovanie neurónovej siete. Dáta sa nachádzajú na servri idoc.fei.tuke.sk v /mnt/sharedhome/hladek/bert-train/data/corpus3/. Na ľavej strane bude text bez interpunkcie. Na pravej strane bude len interpunkcia. -- Natrénujte neurónovú sieť. Množinu rozdeľte na trénovaciu a testovaciu časť. Začneme s modelom SlovakBERT. +- [ ] Natrénujte neurónovú sieť. Množinu rozdeľte na trénovaciu a testovaciu časť. Začneme s modelom SlovakBERT. Zásobník úloh: