使用阿里雲ECS進行深度學習筆記

2021-09-11 10:28:48 字數 372 閱讀 5290

學生一枚,嘗試一下用阿里雲的gpu伺服器跑深度學習。

基本過程參照這篇部落格

記錄一下其中遇到的問題

1.建立完例項檢視一下配置

檢視顯示卡資訊,驅動和cuda版本:nvidia-smi

3.建立自定義映象是需要時間的,不要著急釋放例項,確定映象狀態儲存完後再釋放,不然從頭再來,別問我怎麼知道的。。。

4.遠端訪問按照部落格中所說的配置還是連不上,折騰半天發現**應該是http://ip:埠,不是https,伺服器端開啟jupyter notebook時有提示**的,沒注意。

5.看你的伺服器是否支援停機不收費,我的停機不釋放的話是一小時0.01元,如果短期內還要使用就省的釋放再建立了。

6.conda換源設定參考

阿里雲ECS使用

按流量計費設定使用ali映象源 使用 epel 庫安裝 docker rpm elvm2 7 2.02 105 14 el7.x86 64 curl ssl sh 配置docker加速器 您可以使用如下的指令碼將mirror的配置新增到docker daemon的啟動引數中。系統要求 centos ...

阿里雲ECS使用體驗

今天充值了 105試用阿里雲ecs服務,申請了一台ubuntu18的例項。發現以下問題 只有root使用者。參考aws,提供了sudo許可權的ubuntu使用者。熟悉linux系統的都明白,root使用者是很少用的,而且對於普通使用者來說,比較危險。需要自己配置其他使用者,比如乙個類似ubuntu的...

阿里雲深度學習平台試玩

python cifar pai.py buckets users kylefan program cifar 10 cifar 10 batches py checkpointdir users kylefan program cifar 10 checkpoint 其中 buckets對應下圖的...