Translate

2017年2月27日月曜日

リブートしたら nvidia-docker が起動しなくなった

週末 nvidia-docker をあげているマシンを止めて
今朝立ち上げてみたら..

Could not load uvm kernel module. Is nvidia-modprobe installed?

と出て、nvidia-docker だけ立ち上がらなくなってしまった。

Docker Engineのデーモンは動いているのに..


で調べたら、

  • ドライバの再インストール
  • nvidia-docker volume setup

せよという日本語の記事が幾つか..




どうもこの方法、ちょっと前までの
NVIDIA DockerのGitHubのREADME.mdにかかれていた
方法らしい..
今はその記述は消えている

でも..

nvidia-docker volume setup

なんてコマンド無いんですけど..

で、nvidia-docker volume のヘルプを見ていたら

nvidia-docker volume prune というコマンドを見つけた。

使っていないボリューム設定を削除するコマンドらしい。


ということで nvidia-docker volume prune を実行して
systemctl start nvidia-docker したらもとに戻った..


..これが正しいかはよくわからないけど、とりあえずご参考迄..


0 件のコメント:

ollama 上で動作させているgpt-oss:20bのコンテキスト長を8kから128kにする方法

ollama上にgpt-oss:20bをpullして、API経由でOpenCode CLI連携してつかっていたら、ちょうど8000トークンで返答してくれなくなりました。 で、次に質問したら新セッションになっていたことが何度かありました。 gpt-oss:20bのコンテキスト長を調...