DORIS 服务器宕机重启后出现的问题
在Doris服务器重启后或者Doris BE节点挂了,重启Doris 的BE 节点时,显示系统当前允许的最大打开文件数(ulimit -n)低于推荐值(60000),这可能导致 Doris BE 在高并发或处理大量数据时出错或性能下降。
解决方法:使用 root 权限编辑这个文件:
sudo vi /etc/security/limits.conf
添加以下内容(如果已有类似内容,直接修改即可):
doris soft nofile 655350
doris hard nofile 655350
修改 /etc/pam.d/common-session 或 /etc/pam.d/login(不同系统略有区别):
sudo vi /etc/pam.d/login
确认有这行:
session required pam_limits.so
重启系统:
sudo reboot
重启后查看 :得到的数据是:655350
ulimit -n
重启完系统后需要关闭分区才能启动BE
swapoff -a
当重启完BE。发现脚本错误,最后发现是FE节点服务器和BE节点服务器之间的网不通:如下
注意这个是都Doris的物理地址不是DCN地址
具体原因是因为重启服务器后,FE的ip 发生了变化,使用 ip r 查看路由 :
最后需要关闭 多出来的这个路由:
sudo ifconfig eno3 down
最后重启BE执行脚本就正常了