装多系统踩的坑
之前装过好多次双系统都非常顺利,因此天真地以为装第三个系统也会很顺利。但是没想到竟然这么波折。把之前没踩的坑都还上了。
波折主要在恢复原来系统的环境上。
当时我用diskgenius把windows的系统盘一部分划分为了新分区,geniusdisk默认从PE系统进行硬盘划分。但可能之前装过ubuntu的缘故,本来重启进入PE来着结果进了ubuntu的启动界面,我勾选windows启动,顺利地进入了PE系统。然而它完成分区任务重启后,再也进不去windows了。系统自带的修复系统无法修复,我用windows 安装u盘、PE系统也都没办法解决(可能有办法,但我没找到),只好重装windows
于是我把含有windows系统盘的那块分区给删掉了,这一删直接把ubuntu也删崩了,无法再进ubuntu系统。事到如今我感觉已经难以很快修好,于是我进入PE系统拷贝下来了ubuntu上一些重要的代码,然后把整个盘给抹掉。
第二天开始重装系统。我先安装windows,非常顺利。接着按之前的双系统步骤安装ubuntu,但是进安装程序时黑屏,搜索后要更改安装系统里的一个代码。在Try or install Ubuntu选项那块按E键,把---改成nomodeset(大概)
但安装时忘记勾选“安装第三方库,包括图形化界面、网卡”
因为勾选了这个选项后,还需要设置一个安全密码,那个密码必须设置比较长,如果它显示short password则无法点击continue。当时我不知道为啥不让continue,之前没记得设置过这个密码,就没勾选“安装第三方库”
可能是没有选择这个的缘故,我安装好后,根本不会自动进入ubuntu,而是自动进入windows。
我试着在开启时按F11这种方式选择进入ubuntu,但这样可以进到那个选择ubuntu和windows那个grub界面,但选择ubuntu后,加载会卡在转圈的界面。🤮
我搜了网上说这跟Nvidia驱动之类的有关系,这不就跟“安装第三方库,包括图形化界面、网卡”选项对上了嘛。而且我进命令行界面输入nvdia-smi命令,发现找不到这个命令。于是我把原来Ubuntu删掉重装。但我发现删不掉。。。不论咋样我删,我在bios里都会发现还有ubuntu这个启动选项。有可能是我有分区没清理干净?当时安装的时候分了三个分区,一个启动引导分区,一个swap分区,一个存数据的主要分区。删了几个我记不清了,但应该是三个分区都清掉了。
于是我直接把整个盘又全抹去了(包括windows分区)
这次直接安装ubuntu,先不安windows。
勾选上“安装第三方库,包括图形化界面、网卡”,设置好了能点continue的密码,一路安下去,比较顺利地安好。
接着开始配环境,先装搜狗输入法,但一开始下载的安装包不太对(忘了是啥安装包了)回去看看,没安装好。
下载Fcix框架后,我系统里的选项是Fcix 4而不是网上教程里的fcix,因此我以为这个也是一部分我没安装好搜狗输入法的原因。但实际上Fcix4 是可以的。我担心是框架之间有影响,又把iBus删掉。最后又通过另一个安装包安装了输入法,重启电脑就安好了。
接下来安装cuda和cudnn。首先装cuda,通过nvidia-smi,可以看到最高支持的cuda版本是12.4。我选了个折中一点12.2版本的。附一个各个版本cuda的下载地址集合:https://developer.nvidia.com/cuda-toolkit-archive
起初用del(local)方式安装,安装包真是大呀,但下载好后我以为照着输命令就没事了,但没想到报错:什么什么依赖出现了问题。搜了一下发现用run文件可以解决问题。于是我用run文件(run文件也很大。。)
用run文件安装时,让我接受他们的条款那个界面,居然遇上了显示不全的bug,显示不出来accept输入框。。我苦哈哈地往下滑那个非常长的协议表,完全不记得之前需要翻这么长的这个,翻到底部发现也没有地方能接受。。。
后来网上搜了下其他人显示界面很正常,我重新跑run程序的时候把终端最大化一下,就能正常显示accept输入部分了。
接着装cudnn,这个感觉不难装,下载完压缩包后就tar+cp+chmod。然后安装4DGS的环境,但就在此时出现问题:cuda版本不对!!!
我去,这个项目原来还需要特定的cuda版本。。
于是我就把cuda那些东西全部删掉,用命令行删除,然后从以上流程安装cuda11.8
首先通过run文件安,结果显示/tmp空间不足。我直接???明明还有几百G的总空间。搜了一下说是因为下载run文件出了问题。我下载run文件时一开始开了梯子,后来把梯子关了(关了梯子下载速度更快),中间有一步网络的转换,很可能是这一步导致了问题。于是我把原来的所有run文件都删掉重新下载。
带宽大真爽呀,40+M每秒也不用下太久就下好了。这次确实正常,原来的报错没了。
接下来重新安装cudnn,这次我使用cp命令的时候没改对路径(疏忽了。。),导致后来验证是否安装成功的时候不会有正常输出。
修修补补后cudnn应该安好了,有正常输出了。
接下来跑4DGS库,pip install 时候出现 error: subprocess-exited-with-error 错误。
搜索后可能是cuda问题,但是cuda能有啥问题呢,也没报错呀QWQ
于是我用pytorch验证是否有cuda:
torch.cuda.is_available()
返回False。。。
你记不记得之前删除了cuda12.2,当时把显卡驱动也顺手删了。。
再把驱动下回来,就解决了问题,代码也跑通了。
折腾了一天,终于把环境恢复到了两天前的状况QWQ
反思:
是什么原因导致更改windows分区后,windows系统进不去了呢?
首先必然是diskgenius的锅,但为何恰恰是这次,以下是我的猜测:
1.我当时修改windows的分区是点的建立新分区,或许我应该点调整分区大小,之前就是这个没做的没出问题。
2.因为开机默认进的是ubuntu的grub,而不是完全由diskgenius控制进PE系统,导致了bug。
个人感觉第二个原因概率更大些。