R语言 生物分析 CEL 文件是 **Affymetrix 基因芯片的原始扫描文件**,全称 **Cell Intensity File**。
CEL 文件是 Affymetrix 基因芯片的原始扫描文件,全称 Cell Intensity File。
🔍 一句话理解
它保存了 芯片上每一个探针的荧光强度值,是 最原始、未经过任何处理 的数据。
📁 CEL 文件里有什么?
内容 | 说明 |
---|---|
探针坐标 | 芯片上每个探针的 X, Y 位置 |
荧光强度值 | 对应探针的原始像素强度(通常是 16-bit 灰度) |
标准差 | 该探针区域内像素强度的标准差 |
像素数 | 用于计算该探针强度的像素个数 |
🧪 常见场景
- 平台:Affymetrix HG-U133_Plus_2、HG-U133A、Gene 1.0 ST、Clariom S 等;
- 下载地:GEO → Supplemenary file →
*.CEL
或CEL.tar
; - 用途:
- 用
affy
包justRMA()
→ 直接得到 RMA 标准化表达矩阵; - 用
oligo
包 → 支持更新一代芯片(Gene/ST/Clariom); - 用
Affymetrix Power Tools
→ 命令行级别处理。
- 用
🧩 与其他文件区别
文件 | 级别 | 是否原始 | 是否可直接用 |
---|---|---|---|
CEL | 探针级 | ✅ 原始 | ✅ 推荐 |
CHP | 探针组级 | ❌ 已分析 | ❌ 不常用 |
TXT | 表达矩阵 | ❌ 已标准化 | ⚠️ 可能用旧算法 |
✅ 总结一句话
CEL = Affymetrix 芯片的“底片”,拿到它才能用 RMA/MAS5/PLIER 等算法重新标准化,保证不同数据集间可比。