一、tensorflow2 gpu 安装方法
1. 首先安装anaconda3环境
2. 在anaconda prompt 中安装tensorflow2
conda update conda
conda create -n tensorflow python=3.9
conda activate tensorflow
pip install tensorflow-gpu==2.7.0 -i https://pypi.mirrors.ustc.edu.cn/simple
pip install protobuf==3.19.6 -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn
# 找不到cuda could not load dynamic library 'libcudart.so.11.0'
# 安装cuda的时候记得退出当前虚拟环境,不然还是会找不到cuda
conda install -c nvidia/label/cuda-11.6.1 cuda
https://zhuanlan.zhihu.com/p/483398695
which nvcc 查看是否安装好
接下来要做的很重要,在服务器上,我们自己安装的都在miniconda中
使用which nvcc 可以找到:
我们可以查看miniconda3路径下的lib,里面可以找到我们需要的cuda链接库
然后我们就可以去配置我们的路径了
vim ~/.bashrc #进入配置文件;
找个位置将下面两行插入进去就行:
export path=/mnt/sda3/home/xx/miniconda3/bin/:$path
export ld_library_path=/mnt/sda3/home/xx/miniconda3/lib:$ld_library_path
vim: i 插入 :wq 保存退出
然后更新配置:
source ~/.bashrc
再次激活环境,就不会有异常了:
当出现下面问题时,是还没有安装cudnn
could not load dynamic library 'libcudnn.so.8'; dlerror: libcudnn.so.8: cannot open shared object file: no such file or directory;
cudnn 下载地址
https://developer.nvidia.com/cudnn
tar -xvf cudnn-linux-x86_64-8.9.5.29_cuda11-archive.tar
cp include/* miniconda3/include
cp lib/* miniconda3/lib
成功
3. 验证gpu是否可以使用
参考博客:https://blog.csdn.net/weixin_43412762/article/details/129824339
4. 错误解决
- 如果在训练时出现以下错误,需要重新安装其他版本的cuda,我是重新安装了cuda12的cuda.
tensorflow/stream_executor/gpu/redzone_allocator.cc:314] unknown: failed to create a newwriteablefile:
- 如果出现 i tensorflow/stream_executor/cuda/cuda_dnn.cc:366] loaded cudnn version 8500,然后程序终止了,提示缺少文件
按照图片进行配置,可以看到实际的报错是什么,会在输出中看到缺少安装zlibwapi.lib。
下面是
下载之后放在c:\windows\system32中就可以了
发表评论