Update 'pages/students/2016/lukas_pokryvka/README.md'

This commit is contained in:
dano 2020-12-04 08:39:43 +00:00
parent fefcf2fc0a
commit e84e585d52

View File

@ -30,6 +30,16 @@ Zásobník úloh:
- *Trénovanie na dvoch kartách na dvoch strojoch pomocou NCCL (idoc, tesla)* - *Trénovanie na dvoch kartách na dvoch strojoch pomocou NCCL (idoc, tesla)*
- možno trénovanie na 2 kartách na dvoch strojoch (quadra plus idoc). - možno trénovanie na 2 kartách na dvoch strojoch (quadra plus idoc).
Virtuálne stretnutie 4.12.2020
Stav:
- Vyriešený problém s CUDA Compute Capability. Každý conda baliček podporuje inú verziu CC. Aktuálna verzia Pytorch pracuje iba s Compute Capability 3.7 a viac. Conda Pytorch 1.3 vyžaduje CC 3.7. Tesla karta podporuje iba 3.5. Podpora CC sa dá pridať inštaláciou zo zdroja. Funguje cuda 10.0.
- Podarilo sa natrénovať MNIST na dvoch strojoch naraz - idoc + tesla. Pytorch 1.4, wrapper distributed_data_paralel. NCCL backend. Na každom stroji sa používa rovnaký počet GPU. GPU môžu byť rôzne.
Úlohy:
- Doplniť tabuľku podpory CC v Pytorch.
Virtuálne stretnutie 13.11.2020 Virtuálne stretnutie 13.11.2020
Stav: Stav: