Translate

2017年8月22日火曜日

DockerコンテナでTensorFlow環境上げる場合、ホスト側はNVIDIAドライバだけで良いことに気づく

TensorFlowが1.3.0正式版になっとる..
しかもCUDA Toolkitのバージョンが5.1では動かないらしい..

環境をつくりなおさんと..
と思っていたらちょうど
他部署で使用していない Telsa K20c搭載マシンが余ったので
使わせてもらうことになった。

Ubuntu Server 16.04 LTS を最小構成+OpenSSH Serverでインストールして
以下のNVIDIAサイトでドライバをダウンロードする。

NDIVIAドライバダウンロードサイト:
http://www.nvidia.co.jp/Download/index.aspx?lang=jp

製品のタイプ:Telsa
製品シリーズ:P-Series
製品ファミリ:Telsa P100
OS:Linux 64-bit Ubuntu 16.04
CUDA Toolkit: 8.0
言語: Japanese


で検索、上記K20cではないが製品サポートリストに "Telsa K20c" があることを確認。

deb ファイルが落とせるようになるのでこれを落とす。
そして追加情報タブに書かれた手順でドライバをインストールする。


このあとcuDNN..と思ったのだけど、NVIDIAのサイトで以下のページを見つけた。


GPU を搭載した Docker コンテナ
http://www.nvidia.co.jp/object/docker-container-jp.html

どうも
https://github.com/NVIDIA/nvidia-docker
README.mdを日本語訳したものらしい..

で、絵をあらためて眺めてみると..

nvidia-docker環境だったら、
ホスト側 CUDA Dirverまででいい

ことに今頃気づく!


TensorFlowのバージョンでcuDNNのバージョン指定があったりするけど
Dockerコンテナで動作させている限りcuDNNは無視して良いわけだ..


..やっぱり、Dockerコンテナだな、TensorFlow動かすのは..


0 件のコメント:

o1-previewにナップサック問題を解かせてみた

Azure環境上にあるo1-previewを使って、以下のナップサック問題を解かせてみました。   ナップサック問題とは、ナップサックにものを入れるときどれを何個入れればいいかを計算する問題です。数学では数理最適化手法を使う際の例でよく出てきます。 Azure OpenAI Se...