From b2083cf40b98863cb4dd4ed441c82bc5554e2667 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 13 Nov 2020 09:03:49 +0000 Subject: [PATCH] Update 'pages/students/2016/lukas_pokryvka/README.md' --- pages/students/2016/lukas_pokryvka/README.md | 9 +++++---- 1 file changed, 5 insertions(+), 4 deletions(-) diff --git a/pages/students/2016/lukas_pokryvka/README.md b/pages/students/2016/lukas_pokryvka/README.md index 58854d4d..738b5087 100644 --- a/pages/students/2016/lukas_pokryvka/README.md +++ b/pages/students/2016/lukas_pokryvka/README.md @@ -13,10 +13,10 @@ taxonomy: ## Diplomový projekt 2 2020 Ciele na semester: -- Pripraviť tabuľku s výsledkami experimentov v rôznych konfuguráciách +- Pripraviť tabuľku s výsledkami experimentov v rôznych konfiguráciách - Napísať stručný report (cca 8 strán) vo forme článku. -Zásobník úloh : +Zásobník úloh: - Ten istý scenár spustiť v rôznych podmienkach a zmerať čas. - Trénovanie na jednej karte na jednom stroji @@ -30,13 +30,14 @@ Zásobník úloh : - *Trénovanie na dvoch kartách na dvoch strojoch pomocou NCCL (idoc, tesla)* - možno trénovanie na 2 kartách na dvoch strojoch (quadra plus idoc). - Virtuálne stretnutie 13.11.2020 Stav: - Preštudovaná kniha "Deep Learning with PyTorch" o multi GPU tréningu. -- vyskúšaný LUNA dataset, CT torza pre detekciu rakoviny pľúc - 60GB dát. Dáta sa predpripravia a uložia do cache. 10 epoch trvá 1 hod na bežnom počítači. +- vyskúšaný LUNA dataset, CT torza pre detekciu rakoviny pľúc - 60GB dát. Dáta sa predpripravia a uložia do cache. 10 epoch trvá 1 hod na bežnom počítači. Nastal problém s "Compute Capability" - kompatibilita verzie CUDA, Pytorch a GPU Tesla V40. +- vyskúšaný wrapper data_paralel, distribute_data_parallel (trénovanie pytorch v klastri). +- Pytorch Lightning - cluster trénovanie Pytorch cez Slurm. Virtuálne stretnutie 27.10.2020