《在谷歌云平台搭建基于GPU的深度学习》
我知道,基于GPU的高端的深度学习系统构建起来非常昂贵,并且不容易获得,除非你……
https://hackernoon.com/deep-learning-with-google-cloud-platform-66ada9d7d029
安装CUDA驱动程序
安装TensorFlow
pip install tensorflow-gpu==1.8.0
在TensorFlow安装的时候,我们运行下Python shell,
python
import tensorflow as tf
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
9.0版本、文件名或者是其他的报错,这取决于您选择的TensorFlow版本。但是这样做的目的是知道我们需要哪个版本的CUDA,在这个例子中是9.0。官方文档中TF版本和CUDA版本的对应关系不是很清楚,所以我一直觉得这种逆向工程方法更好。
exit()
安装CUDA驱动(相信我,这次是真的安装)
Linux->x86_64->Ubuntu->16.04 (or 17.04)->deb (network)
再次打开Python shell并运行下面的代码,
ImportError: libcudnn.so.7: cannot open shared object file: No such file or directory
打开https://developer.nvidia.com/cudnn并注册一个帐户(免费的)。
https://developer.nvidia.com/rdp/cudnn-archive。
选择你需要的cuDNN版本,并确保你选择该版本所对应的CUDA版本。在本教程中,我们需要下载以下版本,
在下拉选项中选择,
这样,.tgz文件就开始下载了,将文件存储到你的机器上,并使用以下命令进行提取,
最终提取出一个名为“CUDA”的文件夹,切换到该目录,并执行下面两条命令,
这样就完成了(但愿如此)。再次启动Python shell,这次你知道该做什么。
为确保TensorFlow能够检测到GPU,在Python shell中使用以下代码,
它将会把所有可用的GPU显示出来。如果这个命令在旧版本的TF可能运行不了,可以试试下面的命令。
问题修复
如果所有配置都正确, nvidia-smi也可以执行,但TensorFlow仍然报出相同的错误,那么很有可能环境变量出了问题。执行下面的命令进行修复:
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:${LD_LIBRARY_PATH}
export PATH=/usr/local/cuda/lib64:${PATH}
原文标题:
Setting up your GPU machine to be Deep Learning ready
原文链接:
https://hackernoon.com/setting-up-your-gpu-machine-to-be-deep-learning-ready-96b61a7df278
译者简介