From e84e585d5245a1fd4ce6a580e0f7ddd3bc75df26 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 4 Dec 2020 08:39:43 +0000 Subject: [PATCH] Update 'pages/students/2016/lukas_pokryvka/README.md' --- pages/students/2016/lukas_pokryvka/README.md | 10 ++++++++++ 1 file changed, 10 insertions(+) diff --git a/pages/students/2016/lukas_pokryvka/README.md b/pages/students/2016/lukas_pokryvka/README.md index 0d58a0e0f..d0bbfeee5 100644 --- a/pages/students/2016/lukas_pokryvka/README.md +++ b/pages/students/2016/lukas_pokryvka/README.md @@ -30,6 +30,16 @@ Zásobník úloh: - *Trénovanie na dvoch kartách na dvoch strojoch pomocou NCCL (idoc, tesla)* - možno trénovanie na 2 kartách na dvoch strojoch (quadra plus idoc). +Virtuálne stretnutie 4.12.2020 + +Stav: +- Vyriešený problém s CUDA Compute Capability. Každý conda baliček podporuje inú verziu CC. Aktuálna verzia Pytorch pracuje iba s Compute Capability 3.7 a viac. Conda Pytorch 1.3 vyžaduje CC 3.7. Tesla karta podporuje iba 3.5. Podpora CC sa dá pridať inštaláciou zo zdroja. Funguje cuda 10.0. +- Podarilo sa natrénovať MNIST na dvoch strojoch naraz - idoc + tesla. Pytorch 1.4, wrapper distributed_data_paralel. NCCL backend. Na každom stroji sa používa rovnaký počet GPU. GPU môžu byť rôzne. + +Úlohy: + +- Doplniť tabuľku podpory CC v Pytorch. + Virtuálne stretnutie 13.11.2020 Stav: