当前位置: 首页 > news >正文

NodeTextFileCollectorScrapeError 报警原因及解决方法

现象

prometheus 经常有告警 NodeTextFileCollectorScrapeError
查看 node-exporter 日志出现如下报错

time=2025-04-01T06:43:18.266Z level=ERROR source=textfile.go:248 msg="failed to collect textfile data" collector=textfile file=ipmitool.prom err="failed to parse textfile data from \"/host/root/var/lib/node_exporter/textfile/ipmitool.prom\": text format parsing error in line 35: invalid label value \"r\\x85r??\""

从日志来看,ipmitool.prom 文件在第 35 行存在格式错误,具体错误是 “invalid label value”,可能的原因如下:

可能的原因

1.特殊字符或乱码
r\x85r?? 可能是非 ASCII 字符或二进制数据,导致解析失败。
可能是 IPMI 工具输出的数据包含不可见字符。

2.标签格式错误
Prometheus 指标的标签必须符合:

metric_name{label="value"} number

例如:

ipmi_temperature{sensor="CPU Temp"} 42.0

label=“r\x85r??” 说明 value 部分包含了非法字符。

3.文件编码问题
ipmitool.prom 可能是 UTF-16、UTF-8 BOM 或其他非标准编码,导致解析失败。

4.IPMI 读取错误
ipmitool 可能返回了异常字符,导致 .prom 文件生成时包含错误数据。

解决方法

1.检查 ipmitool.prom 文件

cat -A /host/root/var/lib/node_exporter/textfile/ipmitool.prom | grep -n .

cat -A 显示所有特殊字符(^M、\x85 等)。
找到第 35 行的内容,看是否有乱码或特殊字符。

2.手动清理 ipmitool.prom
如果确认文件有乱码,可以手动编辑:

nano /host/root/var/lib/node_exporter/textfile/ipmitool.prom

删除第 35 行的无效字符
确保格式正确,如:

ipmi_temperature{sensor="CPU Temp"} 42.0

不要使用非 ASCII 字符(如中文、特殊符号等)。

3.自动清理文件
如果是 ipmitool 生成的问题,可用 sed 或 tr 过滤非标准字符:

sed -i 's/[^a-zA-Z0-9_{}=",.\-]//g' /host/root/var/lib/node_exporter/textfile/ipmitool.prom

或者:

tr -cd '\11\12\15\40-\176' < /host/root/var/lib/node_exporter/textfile/ipmitool.prom > /tmp/clean.prom && mv /tmp/clean.prom /host/root/var/lib/node_exporter/textfile/ipmitool.prom

这会删除所有 非 ASCII 可打印字符,避免 Prometheus 解析失败。

4.检查 ipmitool 生成的内容
如果 ipmitool 仍然生成错误数据,建议先手动运行:

ipmitool sensor

然后检查输出是否包含乱码或特殊字符。如果有问题,可以尝试:

LANG=C ipmitool sensor

或者重定向输出后检查:

ipmitool sensor > /tmp/ipmi_output.txt
cat -A /tmp/ipmi_output.txt

5.重新生成 .prom 文件
如果 ipmitool 是用脚本生成 .prom 文件的,建议在脚本里加个清理步骤:

ipmitool sensor | tr -cd '\11\12\15\40-\176' > /host/root/var/lib/node_exporter/textfile/ipmitool.prom

这样可以确保生成的 .prom 文件不会带有非法字符。

6.重新启动 node_exporter
清理后,重启 node_exporter 并检查日志:

sudo systemctl restart node_exporter
journalctl -u node_exporter --no-pager | tail -n 20

然后再访问 Prometheus /metrics 端点:

curl -s http://localhost:9100/metrics | grep textfile

如果 node_textfile_scrape_error 0,说明错误已经修复。

tr -cd ‘\11\12\15\40-\176’ 命令解释

tr -cd '\11\12\15\40-\176' 这个命令的作用是 过滤掉所有非 ASCII 可打印字符,只保留特定的字符集。

解释各个部分

  • tr:翻译或删除字符的命令(translate)
  • -c取反,即匹配不在指定字符集范围内的字符
  • -d:删除匹配到的字符
  • '\11\12\15\40-\176':保留的字符集:
    • \11(Tab 键 HT,ASCII 9)
    • \12(换行符 LF,ASCII 10)
    • \15(回车 CR,ASCII 13)
    • \40-\176(范围表示法,ASCII 32 到 126,即所有可见的 ASCII 字符)

字符范围

ASCII 范围说明
\11 (9)Tab (HT)
\12 (10)换行 (LF)
\15 (13)回车 (CR)
\40 (32)空格 (Space)
\176 (126)~(所有可打印 ASCII 字符)

总结
这个命令 删除所有不可打印字符(比如 \x85、控制字符、二进制字符等)

  • 只保留:
    • 可见的 ASCII 字符(32-126
    • Tab换行回车(用于格式化)

示例

示例 1:清理包含特殊字符的文件

cat file.txt | tr -cd '\11\12\15\40-\176' > clean.txt
  • 作用:从 file.txt删除不可打印字符,输出到 clean.txt
  • 适用于清理 Prometheus .prom 文件格式错误问题

示例 2:处理 ipmitool.prom

tr -cd '\11\12\15\40-\176' < ipmitool.prom > clean.prom
mv clean.prom ipmitool.prom
  • 作用:去除 .prom 文件中的乱码或非法字符,保证 Prometheus 能正确解析

这样可以确保 ipmitool.prom 不包含非标准字符,避免 NodeTextFileCollectorScrapeError

ansible 中写法

如果使用ansible 部署,tr -cd ‘\11\12\15\40-\176’ 里的 \ 需要转义(在 YAML 里 \ 是特殊字符)
示例如下

- name: Creates a cron file for prometheus monitor ipmi
  cron:
    name: "{{ item.name }}"
    minute: "{{ item.minute }}"
    hour: "{{ item.hour }}"
    day: "{{ item.day }}"
    month: "{{ item.month }}"
    weekday: "{{ item.weekday }}"
    user: "{{ item.user }}"
    job: "{{ item.job }}"
  with_items:
    - { name: "ipmitool", minute: "*/1", hour: "*", day: "*", month: "*", weekday: "*", user: "root", job: "sudo ipmitool sensor | sudo awk -f {{ node_exporter_root_dir }}/ipmitool | tr -cd '\\11\\12\\15\\40-\\176' > {{ node_exporter_textfile_dir }}/ipmitool.prom" }

tr -cd ‘\11\12\15\40-\176’ 可以使用双引号吗

在 tr -cd ‘\11\12\15\40-\176’ 中,单引号 ‘’ 是用来确保 \11\12\15\40-\176 作为转义字符被 tr 正确解析。

如果使用 双引号 “”,bash 可能会对 \11\12\15\40-\176 进行额外的 shell 解析,可能导致错误或不符合预期的行为。

是否可以使用双引号?
单引号 ’ ’ ✅(推荐)

tr -cd '\11\12\15\40-\176'

✅ 正确,tr 直接解析 \11\12\15\40-\176 作为 ASCII 码范围。

双引号 " " ⚠️(可能错误)

tr -cd "\11\12\15\40-\176"

⚠️ 可能错误,bash 会优先解析 \,可能导致 tr 不能正确识别 ASCII 码。

相关文章:

  • Linux中的权限管理(附加详细实验示例)
  • swe-bench环境安装踩坑
  • 如何利用 AI 进行 A/B 测试的优化?
  • 【设计模式】过滤器模式
  • 手机显示5GA图标的条件
  • Oracle中文一二三四排序【失败】
  • Linux防火墙的iptables命令示例与详细解释
  • deepseek v3-0324实现数学方程式绘制曲线功能
  • Redis-14.在Java中操作Redis-Spring Data Redis使用方式-操作列表类型的数据
  • 西门子TCP通讯过程中硬件连接突然断开
  • 轻帆云智能ITSM应用最佳实践,助力IT共享服务中心高效运营
  • Redis:集群
  • 广告推荐算法:COSMO算法与A9算法的对比
  • 如何让AI帮你做用户运营:用户消费偏好分层和洞察
  • Java之JDBC数据库连接技术
  • git 操作记录
  • 多账号安全登录与浏览器指纹管理的实现方案
  • 基于AvgPool与自编码器的语音识别
  • 去中心化自治组织(DAO):革新未来治理的下一站
  • 2021-07-05 C,C++定义结构体变量按年龄进行升序排序
  • “上博号”彩绘大飞机今日启航:万米高空传播中国古代文化
  • 量子传感新技术“攻克”退相干难题
  • 中信银行一季度净利195.09亿增1.66%,不良率持平
  • 建行一季度净利833.51亿同比下降3.99%,营收降5.4%
  • 中使馆:奉劝菲方有关人士不要在台湾问题上挑衅,玩火者必自焚
  • 港交所与香港证监会就“中概股回流意向”已与部分相关企业进行接触