Translate

2016年12月12日月曜日

CUDA Toolkit 8.0 をUbuntu Server16.04LTSへインストールしようとすると、Nouveauカーネルドライバが邪魔と言われ、失敗する

CUDA対応の黒箱 GeForce GTX 750 Tiを刺したPCに
Ubuntu Server 16.04LTSを最小構成でインストールして、
apt update / apt -y upgrade した後、
openssh server, vuftpd, gcc, g++, make を個別にインストールし、
NVIDIAサイトから
cuda_8.0.44_linux.run
をダウンロードして、root権限で

sh cuda_8.0.44_linux.run


を実行したら


以下のようなメッセージが出てインストールに失敗した..

Installing the NVIDIA display driver...
A system reboot is required to continue installation. Please reboot then run the installer again. An attmept has been made to disable Nouveau. If this message persists after reboot, please see the display driver log file at /var/log/nvidia-installer.log for more information.

===========
= Summary =
===========

Driver:   Reboot required to continue
Toolkit:  Installation skipped
Samples:  Installation skipped

To uninstall the NVIDIA Driver, run nvidia-uninstall

Logfile is /tmp/cuda_install_13653.log


"Please reboot"とあるので、リブートして再度root権限で
sh cuda_8.0.44_linux.run
を実行してみたが、まったく同じメッセージが出てきた..

で同じくメッセージに書かれている/var/log/nvidia-installer.log を開いてみると、
以下のエラーメッセージが出ていた。

ERROR: The Nouveau kernel driver is currently in use by your system.  This driver is incompatible with the NVIDIA driver, and must be disabled before proceeding.  Please consult the NVIDIA driver README and your Linux distribution's documentation for details on how to correctly disable the Nouveau kernel driver.
WARNING: One or more modprobe configuration files to disable Nouveau are already present at: /etc/modprobe.d/nvidia-installer-disable-nouveau.conf.  Please be sure you have rebooted your system since these files were written.  If you have rebooted, then Nouveau may be enabled for other reasons, such as being included in the system initial ramdisk or in your X configuration file.  Please consult the NVIDIA driver README and your Linux distribution's documentation for details on how to correctly disable the Nouveau kernel driver.
-> For some distributions, Nouveau can be disabled by adding a file in the modprobe configuration directory.  Would you like nvidia-installer to attempt to create this modprobe file for you? (Answer: Yes)
-> One or more modprobe configuration files to disable Nouveau have been written.  For some distributions, this may be sufficient to disable Nouveau; other distributions may require modification of the initial ramdisk.  Please reboot your system and attempt NVIDIA driver installation again.  Note if you later wish to reenable Nouveau, you will need to delete these files: /etc/modprobe.d/nvidia-installer-disable-nouveau.conf
ERROR: Installation has failed.  Please see the file '/var/log/nvidia-installer.log' for details.  You may find suggestions on fixing installation problems in the README available on the Linux driver download page at www.nvidia.com.

エラー:Nouveauカーネルドライバが現在システムで使用されています。このドライバはNVIDIAドライバと互換性がありませんので、先に進む前に無効にする必要があります。 Nouveauカーネルドライバを正しく無効にする方法の詳細については、NVIDIAドライバのREADMEおよびLinuxディストリビューションのドキュメントを参照してください。
警告:Nouveauを無効にするための1つ以上のmodprobe設定ファイルは、すでに/etc/modprobe.d/nvidia-installer-disable-nouveau.confにあります。これらのファイルが書き込まれてからシステムを再起動してください。再起動した場合は、システム初期ラムディスクやX設定ファイルに含まれるなどの理由でNouveauが有効になることがあります。 Nouveauカーネルドライバを正しく無効にする方法の詳細については、NVIDIAドライバのREADMEおよびLinuxディストリビューションのドキュメントを参照してください。
- >いくつかのディストリビューションでは、modprobe設定ディレクトリにファイルを追加することでNouveauを無効にすることができます。 nvidia-installerがこのmodprobeファイルを作成しようとしますか? (回答:はい)
- > Nouveauを無効にするための1つ以上のmodprobe設定ファイルが記述されています。いくつかのディストリビューションでは、これはNouveauを無効にするのに十分かもしれません。他のディストリビューションでは初期のRAMディスクを変更する必要があります。システムを再起動し、NVIDIAドライバのインストールを再度試みてください。あとでNouveauを再度有効にしたい場合は、これらのファイルを削除する必要があります:/etc/modprobe.d/nvidia-installer-disable-nouveau.conf
エラー:インストールに失敗しました。詳細については、ファイル '/var/log/nvidia-installer.log'を参照してください。 Linuxドライバのダウンロードページ(www.nvidia.com)にあるREADMEに、インストールに関する問題を修正するための提案があります。


どうも「Nouveau カーネルドライバ」が邪魔らしく
これをアンインストールせよ
ということらしい..

..ったく、Xを入れてない最小構成なのに
なんでNouveauグラフィックスドライバが入るのか..
イランお世話やっちゅーの..

/etc/modprobe.d/nvidia-installer-disable-nouveau.conf にカーネルオプションができるので、これを再起動時反映してもらうためにroot権限で

update-initramfs -u


を実行して再起動すると..以下のメッセージがでて、
とりあえずうまくいった..


===========
= Summary =
===========

Driver:   Installed
Toolkit:  Installed in /usr/local/cuda-8.0
Samples:  Installed in /root, but missing recommended libraries

Please make sure that
 -   PATH includes /usr/local/cuda-8.0/bin
 -   LD_LIBRARY_PATH includes /usr/local/cuda-8.0/lib64, or, add /usr/local/cuda-8.0/lib64 to /etc/ld.so.conf and run ldconfig as root

To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-8.0/bin
To uninstall the NVIDIA Driver, run nvidia-uninstall

Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-8.0/doc/pdf for detailed information on setting up CUDA.

Logfile is /tmp/cuda_install_1590.log

..じゃ、cuDNNいれるかな..

0 件のコメント:

既存アプリケーションをK8s上でコンテナ化して動かす場合の設計注意事項メモ

既存アプリをK8sなどのコンテナにして動かすには、どこを注意すればいいか..ちょっと調べたときの注意事項をメモにした。   1. The Twelve Factors (日本語訳からの転記) コードベース   バージョン管理されている1つのコードベースと複数のデプロイ 依存関係 ...