CVPR2022——立体匹配算法Fast-ACVNet复现
1.简介
Fast-ACVNet 是一款高效且精确的立体匹配算法,在 CVPR 2022 上首次亮相,随后在 TPAMI 2023 上发表了扩展版本。该方法旨在在保持高精度的同时,实现实时性能,适用于自动驾驶、机器人视觉等对速度和精度要求较高的场景。
论文地址:Accurate and Efficient Stereo Matching via Attention Concatenation Volume | IEEE Journals & Magazine | IEEE Xplore
源码地址:https://github.com/gangweix/Fast-ACVNet
2.复现步骤
下载到源码后解压,用编译器打开
该py文件就是运行代码
环境还没有配置,我们先配置一下环境
github源码下面有命令栏,如果你电脑有conda环境你可以打开命令栏直接复制就可以
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch -c nvidia
pip install torch==1.8.1+cu111 torchvision==0.9.1+cu111 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
把这一句换成下一句,用镜像源下载
然后我们下载权重:
GitHub界面找到这个,或者点下方链接:
https://drive.google.com/drive/folders/1vLt_9W3F2K-MciV8Pmv8iRpU24lkMXGo?usp=share_link
Accurate and Efficient Stereo Matching via Attention Concatenation Volume | IEEE Journals & Magazine | IEEE Xplore
我们打开save_disp.py代码,生成视差图的代码。
我们来看这里的参数一个一个看:
1. model 你可以选择Fast-ACV,Fast_ACVNet_plus两个选项,权重如果你下的是Fast-ACVNet就填Fast-ACV,“+”填Fast_ACVNet_plus
2. maxdisp 不用管
3. dataset 数据集 这里有讲究,(这里跟后面是数据集路径设置有关)填kittit就行
4. kitti15 和 kitt12 注意这里就是待匹配图片的地址
我们先创建
在这两个文件夹中放入左右视图,test15也是一样,一定要有test12和test15两个文件夹
创建完之后我们需要创建一个txt文件在这个目录下:
名字一样,txt填入你左视图,右视图地址:
代码会根据test的编号来判断你用的是哪个数据集来执行后续代码,所以一定要有test12和test15两
个文件夹。
5. 让后将txt的地址填入
6. loadckpt 将你的权重地址填入即可,注意对应model
7.
代码中的这一句是保存的地址,如果你不想保存到这里可以自己修改。
我们运行代码:
出现saving to 就成功了,我们打开看看效果