windows10 版本号:1909 操作系统版本:18363.778

0x01 确定 nvidia 显卡驱动的版本是否满足安装条件

  1. 打开 nvidia 控制面板,看到我的显卡为 GTX1060 驱动版本为 445.75

  2. 进入nvidia官网 ,查看 CUDA 版本与 nvidia 显卡驱动版本之间的关系

    我们要安装的是 CUDA10.1,可以看到在 64 位 Windows 下 nvidia 显卡驱动版本大于418.96即可安装。

0x02 下载CUDA与cuDNN

  • CUDA是一种由NVIDIA推出的通用并行计算架构,cuDNN是用于深度神经网络的GPU加速库。要能够运行gpu版本的tensorflow和pytorch等框架,需要同时安装这两个模块。
  1. 下载CUDA10.1
    进入nvidia官网,下载windows10版本的exe(local),点击此处直接下载

  2. 添加环境变量C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib\x64
    安装完重启电脑,验证cuda是否安装成功

    1
    $ nvcc -V
  3. 下载CUDA对应的cuDNN
    进入nvidia官网,需要登录,没有账号的注册一个即可,点击此处直接下载

  4. 将cuDNN下载得到的三个文件夹里的文件复制到CUDA对应的三个文件夹里

    • 打开环境变量查看CUDA的安装目录
    • 打开C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1,依次复制文件夹里面的文件到对应的文件夹。(注意是把里面的文件复制过去,分别为cudnn.libcudnn.hcudnn64_7.dll

    检验cudnn是不是安装成功(不要把命令中引号删了,下同)

    1
    $ "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\demo_suite\deviceQuery.exe"



    看到PASS

    1
    $ "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\demo_suite\bandwidthTest.exe" 


    看到PASS,则cuDNN安装成功

0x03 安装anaconda

0x04 安装pytorch1.4 与torchvision

  1. 创建conda环境

    1
    $ conda create -n myenv python==3.6.5

    这个表示安装一个名字为myenv的环境,并同时安装python版本为3.6.5
    不要使用python3.6.0版本,血的教训,安装pytorch后会报找不到dll模块的错误。原因未知,其他版本应该都可。

  2. conda 换源

    1
    2
    3
    4
    $ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    $ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
    $ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
    $ conda config --set show_channel_urls yes

    其他源请自行添加

  3. 安装pytorch、torchvision

    1
    $ conda install pytorch torchvision cudatoolkit=10.1
  4. 检测pytorch是否安装成功

    1
    2
    3
    4
    $ python
    >> import torch
    >> print(torch.__version__)
    >> print(torch.cuda.is_available())

    至此全部安装成功

  5. 提供一个识别mnist简单实验的测验安装成果的代码
    下载下来直接python main.py运行即可