当前位置: 首页 > news >正文

文献分享0719

一、讲稿

研究背景

1、cfDNA和ctDNA

  1. 细胞游离DNA(cfDNA)的来源

    • 正常情况下,非恶性细胞(尤其是造血细胞)死亡后会释放**细胞游离DNA(cfDNA)**进入血液中。
    • 在癌症患者中,除了正常来源的cfDNA,还会释放循环肿瘤DNA(ctDNA),这是肿瘤细胞死亡或脱落释放的DNA片段。
  2. ctDNA在临床中的应用

    • 通过检测血液中的ctDNA水平,可以实现非侵入性诊断疾病监测
    • 监测ctDNA动态变化,有助于在治疗期间和临床试验中追踪肿瘤的进展。

2、已有ctDNA检测方法及其局限性

  1. 靶向深度测序(Ultra-deep targeted sequencing)

    • 这种方法常用于临床,因为它可以检测可操作的基因突变(actionable mutations)。
    • 通常通过突变的**等位基因频率(VAF)**来估算ctDNA水平。
    • 局限性
      • 并非所有肿瘤都含有靶向面板覆盖的突变;
      • VAF估算受多种因素影响,如突变的克隆性(clonality)、拷贝数变化、克隆性造血(clonal haematopoiesis)等。
  2. 现有ctDNA定量方法的限制

    • 大多数方法需要低通量全基因组测序(lpWGS)DNA甲基化分析,或者需要对靶向测序面板进行修改
    • 这些方法不能很好地兼容常规的靶向测序数据,限制了其在临床中的广泛应用。
  3. 研究需求

    • 因此,亟需开发一种准确、正交、通用性强的ctDNA定量方法,能够适用于不同患者、不同肿瘤类型以及不同测序平台。

3、ctDNA与cfDNA片段长度的关系

  1. cfDNA片段长度分布特征

    • 健康人血浆中的cfDNA片段长度分布有一个主峰,约166个碱基对(bp),这是由于核小体保护DNA片段所致。
    • 癌症患者的cfDNA片段通常更短,小于150 bp的片段比例更高
    • 癌症患者的cfDNA还表现出:
      • 10 bp周期性振荡增强(90–145 bp区间);
      • 大于180 bp的片段比例也更高
      • 片段长度变化可能与基因组位置有关
  2. 这些差异的潜力

    • 这些关于片段长度的差异已被用于区分癌症患者与健康个体。
    • 激发了研究者探索利用cfDNA片段长度特征进行癌症检测和ctDNA定量的思路。

4、本文提出的新方法:Fragle

  1. Fragle的定义

    • 作者开发了一种名为Fragle多阶段机器学习模型,能够从cfDNA的片段长度密度分布量化ctDNA水平
  2. 模型训练与验证

    • 使用约4000例低通量全基因组测序(lpWGS)数据进行训练和评估;
    • 数据涵盖多种癌症类型和健康对照组
    • 在独立队列中评估了Fragle的准确性最低检测限(LoD)
  3. Fragle的优势与应用前景

    • 能够应用于靶向测序数据(这是一大创新点);
    • 可用于纵向血浆样本分析,研究ctDNA动态变化与治疗反应之间的关系
    • 最小残留病(MRD)检测方面也具有潜力,例如在术后肺癌患者中预测复发风险

研究方法

1、训练和验证数据

发现队列(Discovery cohort)

  • 样本数量 (n = 426): 总共有426个样本。

  • 数据类型: 使用的是低通量全基因组测序(lpWGS)数据。

  • 患者群体:

    • 癌症患者: 包括结肠癌、乳腺癌、肝癌和卵巢癌的患者。

    • 健康对照组: 来自两个不同的来源,分别是GIS和CUHK1、CUHK2。

数据分割与增强

  • 数据分割:

    • 将发现队列中的数据分为训练集(Train)和验证集(Val),分别用红色和橙色表示癌症患者的数据,绿色表示健康对照组的数据。

    • 训练集和验证集的比例没有明确给出,但通常会按照一定的比例(如70%训练集和30%验证集)进行划分。

  • 数据增强:

    • 通过计算机模拟混合(train spike-ins 和 val spike-ins)生成额外的训练和验证样本,以增加数据多样性并提高模型的泛化能力。

    • 训练集中生成了2,800个样本,验证集中生成了1,300个样本。

重复实验

  • Repeat 10 times: 整个过程重复进行了10次,这可能是为了确保结果的稳定性和可靠性,减少随机误差的影响。

流程总结

  1. 原始数据收集: 从不同类型的癌症患者和健康对照组收集lpWGS数据。

  2. 数据分割: 将数据分为训练集和验证集。

  3. 数据增强: 通过计算机模拟混合生成额外的训练和验证样本。

  4. 重复实验: 整个流程重复10次,以确保结果的稳健性。

2、数据增强

计算机模拟混合(In Silico Dilution)
  • 目的: 通过模拟不同ctDNA(循环肿瘤DNA)比例的样本,生成更多具有不同ctDNA含量的训练和验证样本,以增加数据集的多样性。
  • 实现方式:
    • 使用已有的癌症患者样本(高ctDNA含量)和健康对照组样本(低或无ctDNA含量),通过计算机算法将两者按不同的比例混合。
    • 混合比例根据研究需要设定,可以覆盖从低到高的广泛ctDNA分数范围。

3、数据分布和模型架构

左侧:cfDNA片段长度分布

原始密度(Raw density)

  • 曲线展示: 图中显示了不同ctDNA水平样本的原始片段长度分布曲线。

    • 绿色线代表健康个体的cfDNA片段长度分布。

    • 其他颜色的线分别代表不同比例的ctDNA混合样本(1-10%,10-25%,25-50%,50-70%)。

  • 观察: 随着ctDNA比例的增加,片段长度分布曲线逐渐发生变化,显示出与健康个体不同的特征。

归一化密度(Normalized density)

  • 归一化处理: 对原始密度进行归一化处理,使得不同样本之间的比较更加公平。

  • 曲线变化: 归一化后的曲线进一步突出了不同ctDNA水平样本之间的差异,特别是在某些特定的片段长度区间内。

  • 归一化原因:

    • 消除样本间差异:由于不同样本中的cfDNA总量可能不同,直接比较原始密度可能会受到这些差异的影响。归一化可以帮助消除这种影响,使得不同样本可以在相同的尺度上进行比较。
    • 提高模型性能:通过标准化输入数据,可以提高机器学习模型的学习效率和预测准确性。

样本排序(Samples sorted by ctDNA level)

  • 热图展示: 下方的热图展示了按ctDNA水平排序的所有样本的片段长度分布情况。

    • 横轴表示片段长度(51 bp 到 400 bp),纵轴表示样本编号,并用颜色标注了不同的ctDNA水平范围。

    • 热图中的颜色强度反映了在特定片段长度下的片段数量或比例。

右侧:Fragle模型架构

输入数据

  • cfDNA片段长度直方图: 将每个样本的cfDNA片段长度分布转换为直方图形式作为模型的输入。

信号处理与特征选择(Signal processing + feature selection)

  • 预处理步骤: 对输入数据进行信号处理和特征选择,提取出对ctDNA检测最有价值的特征。

模型结构

  • 嵌入块(Embedding block): 将输入特征映射到一个高维空间,便于后续的深度学习处理。

  • 残差块(Residual block): 引入残差连接,帮助模型更好地学习复杂的非线性关系。

  • 密集块(Dense block): 包含多个全连接层,用于进一步提取和整合特征。

低ctDNA负担模型与高ctDNA负担模型

  • 双路径设计: Fragle模型采用了双路径设计,分别针对低ctDNA负担和高ctDNA负担的情况进行优化。

    • 低ctDNA负担模型: 专注于检测低浓度的ctDNA,使用相对MAE损失和分类损失进行训练。

    • 高ctDNA负担模型: 专注于检测高浓度的ctDNA,同样使用MAE损失和分类损失进行训练。

分数选择模型(Selection model)

  • 支持向量机(SVM): 使用SVM作为选择模型,根据样本的特征将其分配到低ctDNA负担模型或高ctDNA负担模型中进行预测。

最终输出

  • 预测的ctDNA分数: 经过上述处理后,模型输出预测的ctDNA分数,用于判断样本中ctDNA的存在及其含量。

4、模型评估数据

测试队列(Test cohort)

  • 样本数量 (n = 506): 总共有506个样本。

  • 数据类型: 使用的是低通量全基因组测序(lpWGS)数据或靶向测序数据。

目的与意义

展示数据多样性

  • 多癌种覆盖: 测试队列涵盖了多种不同类型的癌症,这有助于评估Fragle模型在不同癌症类型中的泛化能力和检测性能。

  • 独立验证: 由于这些数据是未见过的独立测试数据,可以更客观地评估模型的实际应用效果和鲁棒性。

评估模型性能

  • 真实世界应用: 通过在独立测试队列上的表现,可以了解Fragle模型在实际临床场景中的检测准确性和可靠性。

  • 跨批次一致性: 健康对照组来自不同的批次,可以帮助评估模型在不同实验条件下的稳定性和一致性。

研究结果

1、通过cfDNA片段化分布量化预测ctDNA水平

本研究在训练集上通过交叉验证评估了Fragle模型在四种癌症中的ctDNA预测性能,结果显示该模型在结直肠癌、乳腺癌、肝癌和卵巢癌中均表现出较高准确度,其中卵巢癌的预测相关性因一位患者样本偏差较低,剔除后提升至r=0.88(图2a-d)。在多个外部队列中,Fragle对ctDNA水平的预测结果与ichorCNA高度一致,包括结直肠癌、乳腺癌、肝癌和胃癌(图2e-h),并在其他外部验证癌种(如肺癌、鼻咽癌、头颈癌)中也表现出良好适应性。

Figure 2j 展示了Fragle模型在不同癌症类型和分期中的ctDNA分数预测结果,通过箱线图(box plot)的形式直观地比较了健康对照组与不同癌症患者之间的差异。Figure 2j 通过箱线图展示了Fragle模型在不同癌症类型和分期中的ctDNA分数预测结果,清晰地显示了健康对照组与不同癌症患者之间的差异,以及随着癌症分期的进展,ctDNA分数逐渐升高的趋势。这一结果验证了Fragle模型在检测和量化ctDNA方面的有效性,为临床应用提供了重要的参考依据。

2、Fragle模型的最低检出限评估与高灵敏度验证

Figure 3a 展示了Fragle模型预测的ctDNA分数与预期ctDNA分数之间的关系,并通过Wilcoxon秩和检验评估了不同预期分数组之间的统计显著性差异。

箱线图概述

  • 横轴: 表示不同的预期ctDNA分数(Expected fraction),从0到5%,以1×10^-3为起点,逐步增加。
  • 纵轴: 表示由Fragle模型预测的ctDNA分数(Predicted fraction)。

统计显著性

  • Wilcoxon秩和检验: 用于比较不同预期分数组之间的统计显著性差异。
  • P值: 图中标注了每两个相邻组之间的P值,例如:
    • 预期分数为0%与1×10^-3%之间的P值为0.13,表明两者之间没有显著差异。
    • 预期分数为1×10^-3%与1%之间的P值为2.5×10^-24,表明两者之间存在极显著差异。
    • 其他相邻组之间的P值也均小于0.05,表明这些组之间的差异具有统计学意义。

Figure 3b在文中是用来比较三种不同方法在区分健康样本与癌症样本(ctDNA水平≥1%)方面的性能。这三种方法分别是Fragle、ichorCNA和一个基于四个特征的模型(4-feature model)。下面是对这三个方法的简要介绍及其在Figure 3b中的表现:

  1. Fragle:这是一个多阶段机器学习模型,专门设计用于从cfDNA片段长度分布中量化ctDNA水平。研究表明,在多种类型的癌症样本中,Fragle能够有效地识别并量化ctDNA,即使是在低覆盖度的情况下也能保持较高的准确性和较低的检测限。

  2. ichorCNA:这是一种用于估计肿瘤分数的方法,主要通过分析拷贝数变异(Copy Number Alterations, CNA)来实现。它被广泛应用于液体活检领域,以评估ctDNA的存在及比例。然而,在本文的研究中,当面对某些特定类型的样本或在低ctDNA水平下,ichorCNA的表现不如Fragle。

  3. 4-feature model:这个模型是基于之前研究中常用的片段长度特征建立的,包括了四个从片段长度分布中提取的特征,并使用随机森林算法进行训练。尽管这种方法对于分类健康样本和癌症样本具有一定的能力,但其AUC值显著低于Fragle,表明其整体分类准确性较差。

在Figure 3b中的表现

  • Fragle展示了最高的AUC值(0.93),表明它在区分健康个体和癌症患者方面具有最佳的表现。特别是在处理那些ctDNA水平≥1%的癌症样本时,Fragle不仅优于其他两种方法,而且在低ctDNA水平下也显示出了良好的敏感性和特异性。

  • ichorCNA虽然也是一种有效的工具,但在本研究中,它的AUC值为0.88,略低于Fragle。特别是在低ctDNA水平下,ichorCNA可能无法像Fragle那样准确地检测出ctDNA。

  • 4-feature model在这次比较中表现最差,AUC仅为0.79。这说明单纯依靠几个片段长度特征来进行分类,其效果远不及利用更复杂的模型如Fragle。

Figure 3b关注于验证集上的模型比较,旨在对比不同方法在同一数据集上的表现。

Figure 3c则侧重于测试Fragle模型在未见过的数据集上的性能,强调了模型的实际应用价值和鲁棒性

Figure 3d展示的是Fragle模型在预测不同预期ctDNA分数(Expected fraction)时的表现。该图使用箱形图来表示预测的ctDNA分数(Predicted fraction - Fragle),并标注了Wilcoxon秩和检验的结果,以评估不同预期分数之间的统计学差异。

Figure 3a和Figure 3d主要区别

  1. 预期分数范围:

    • Figure 3a: 覆盖了从0到5%的预期分数,间隔较大。
    • Figure 3d: 在低浓度范围内进行了更细致的划分,特别关注了0.156%、0.313%、0.625%等极低浓度的检测能力。
  2. 重点:

    • Figure 3a: 更全面地展示了Fragle模型在不同浓度下的整体预测性能。
    • Figure 3d: 更加聚焦于模型在低浓度ctDNA检测中的表现,强调其在临床早期诊断中的潜力。

Figure 3e 和 Figure 3f

分别展示了Fragle模型在预测结肠癌(Colon cancer)和胃癌(Gastric cancer)样本中ctDNA分数的表现。这两个图通过散点图的形式,比较了预期的ctDNA分数(Expected fraction)与Fragle模型预测的ctDNA分数(Predicted fraction - Fragile),并使用不同颜色的点来区分不同的样本类型。

3、Fragle在靶向测序数据中的应用

Figure 4a 描述了两种不同的测序方法——低通量全基因组测序(Low-pass whole-genome sequencing, lpWGS)和靶向测序(Targeted sequencing),以及它们如何通过Fragle模型进行分析。

figure 5e 展示了患者E在接受不同治疗方案期间,其循环肿瘤DNA(ctDNA)中特定基因突变的变异等位基因频率(VAF)以及Fragle模型预测的ctDNA分数随时间的变化情况。

4、对早期肺癌患者进行风险分层

二、Fragle模型的具体工作原理

Fragle是一个多阶段的机器学习模型,专门设计用于直接从细胞游离DNA(cfDNA)片段长度密度分布中量化循环肿瘤DNA(ctDNA)水平。其核心工作原理基于利用片段组学特征来准确量化不同癌症类型患者中的ctDNA,而不需要肿瘤活检或匹配的正常样本。以下是Fragle模型具体工作原理的一些关键点:

1. 数据准备与预处理:
- Fragle使用低覆盖度全基因组测序(lpWGS)和靶向测序数据进行开发和验证。这些数据包括来自八种癌症类型的lpWGS数据和六种癌症类型的靶向测序数据。
- 在对变异进行调用时,FASTQ文件首先被预处理以添加独特的分子标识符(UMIs),然后使用BWA-MEM进行读段比对。通过fgbio包执行UMI感知的去重复操作,并生成共识序列。

2. 特征提取:
- Fragle利用了跨多种癌症类型共有的片段组学特征。这意味着它能够识别并利用那些在健康个体和癌症患者之间存在差异的cfDNA片段长度特征。

3. 模型训练与评估:
- 使用了一种名为“in silico”的数据增强方法,即计算机模拟的数据增强方法,对大约四千个lpWGS样本进行了训练和评估。这涵盖了多个癌症类型和健康对照队列。
- 该模型不仅在体外数据上进行了测试,还在未见过的样本的计算机模拟稀释数据上展示了对血浆ctDNA水平的精确量化能力,其检测限(LoD)低于当前最先进的ctDNA量化方法。

4. 性能与应用:
- 在独立队列中,Fragle表现出优于无肿瘤背景的方法,实现了更高的准确性和更低的检测限。
- 特别是在结直肠癌患者的纵向分析中,Fragle揭示了ctDNA动态变化与治疗反应之间的强一致性。
- 对于早期肺癌患者,Fragle在预测最小残留疾病(MRD)方面也优于传统的肿瘤未知基因面板,有助于风险分层。

5. 进一步优化与潜力:
- 研究指出,结合不同的正交片段组学特征以及拷贝数谱型可能为ctDNA量化方法带来新的改进机会。
- 虽然Fragle已经通过全基因组和靶向cfDNA测序数据得到了开发和验证,但未来还需要研究它是否可以应用于其他测序模式,如亚硫酸氢盐测序数据。

综上所述,Fragle模型通过利用cfDNA片段长度分布中的信息,提供了一种无需肿瘤组织即可准确量化ctDNA的新方法,显示出在多种临床场景下的潜在应用价值,尤其是在监测癌症进展、检测微小残留病灶等方面。

三、靶向测序面板(targeted sequencing panel)

在本文中,“targeted sequencing panel”指的是靶向测序面板,这是一种专注于特定基因或基因组区域的高通量测序方法。与全基因组测序(WGS)不同,靶向测序panel仅针对预先定义的一组基因或基因区域进行深度测序,这使得研究者能够高效地检测这些区域内存在的遗传变异,如单核苷酸多态性(SNPs)、插入/删除(indels)等。

在本文中的应用

  1. 基因选择:在文中提到的例子中,使用了不同的靶向测序panel来覆盖与癌症相关的特定基因。例如,对于结直肠癌突变的100个基因和乳腺癌突变的77个基因分别设计了panel。这些panel被用来对样本进行测序,并通过分析这些特定基因内的变异来评估ctDNA水平。

  2. 数据处理:为了确保数据的质量,已知的种系变异(即非体细胞突变)被过滤掉,以便更准确地识别与肿瘤相关的体细胞突变。此外,还计算了每个panel的基本统计信息,包括基因数量、基因组覆盖率、目标区域以及目标覆盖比例。

  3. Fragle模型的应用:Fragle不仅适用于低覆盖度全基因组测序(lpWGS)数据,也可以应用于来自靶向测序的数据。研究表明,即使利用“脱靶”读段(即那些未直接针对目标区域但仍然有用的读段),Fragle也能有效预测ctDNA水平。这种方法展示了Fragle在不同类型的测序数据上的灵活性和适用性。

  4. 临床应用潜力:通过使用商业液体活检检测(如Foundation Medicine Liquid CDx assay),研究人员验证了Fragle模型在预测最大VAFs(变异等位基因频率)方面的准确性,这表明该模型可能在临床上用于监测治疗反应及疾病进展。

四、LoD

在本文中,LoD指的是“Limit of Detection”,即检测限。这是指一个分析方法能够可靠地检测到目标物质的最低浓度或量。对于循环肿瘤DNA(ctDNA)的量化来说,LoD是指该方法可以准确识别和量化最小比例的ctDNA的能力。

具体而言,在这项研究中,通过一系列实验评估了Fragle模型的LoD,包括使用未见过的测试样本进行计算机模拟稀释实验以及体外稀释实验。这些实验旨在验证Fragle在不同ctDNA浓度下的表现,特别是当ctDNA水平非常低时(例如0.5%至1%)。研究结果显示:

- 在计算机模拟稀释实验中,Fragle能够区分健康样本与低ctDNA样本,其LoD达到了0.5%-1%的ctDNA水平。
- 在体外实验中,通过对结直肠癌和胃癌患者的高ctDNA血浆样本进行连续稀释,并使用健康个体的cfDNA混合物逐步稀释这些样本,Fragle同样展示了对ctDNA水平的精确量化能力,准确预测了低至约1% ctDNA水平的情况。

总体上,这些结果表明Fragle具有大约1%的LoD,意味着它可以量化血液样本中低至1%的ctDNA水平。这对于早期癌症检测、监测治疗反应及检测微小残留病灶等方面尤为重要,因为它提供了更高的灵敏度,有助于更早发现疾病迹象或评估治疗效果。

五、IQR

四分位数间距(Interquartile Range, IQR)是统计学中用来衡量一组数据分散程度的一个指标。它定义为第三四分位数(Q3,即第75百分位数)与第一四分位数(Q1,即第25百分位数)之间的差值。IQR主要用于描述中间50%数据的范围,因此它提供了一种衡量数据集中间部分的离散度的方法,而不受极端值或异常值的影响。

在本文的研究背景下,IQR被用于图表展示和数据分析中,具体表现为:

  • 箱形图(Box Plot):文中提到使用箱形图表示预测ctDNA分数时,通过中位数和IQR来展示健康样本和低ctDNA水平样本的数据分布情况。箱形图中的“箱子”部分代表了IQR,即从Q1到Q3的范围,而箱子内部的横线则代表中位数(Q2)。此外,“须”的两端通常延伸至1.5倍IQR的位置,超出这一范围的点可能被认为是异常值。

例如,在验证集样本中预测的ctDNA分数(Fig. 3a),以及对20个癌症样本进行计算机模拟稀释后得到的未见队列中预测的ctDNA分数(Fig. 3d)都采用了这种表示方法。这种方式有助于直观地比较不同组别之间的ctDNA水平差异,并识别潜在的异常值。

总之,IQR作为一种稳健的统计量,能够有效地反映数据集的核心分布特征,特别是在存在异常值的情况下比标准差等其他离散度度量更加可靠。在本研究中,它帮助研究人员更清晰地展示了Fragle模型在量化循环肿瘤DNA方面的性能表现。

六、多变量Cox比例风险回归分析

多变量Cox比例风险回归分析(Multivariate Cox Proportional Hazards Regression Analysis)是一种统计方法,广泛应用于医学研究中,尤其是生存分析领域。这种方法主要用于评估多个变量对某个事件发生时间的影响,比如疾病复发、死亡等。它允许研究人员同时考虑多个因素(如年龄、性别、治疗类型等),以确定哪些因素是独立的预后因子,并估计它们各自对事件发生风险的影响大小。

基本概念

  1. 事件:在生存分析中,"事件"通常指的是感兴趣的结局,如疾病复发或患者死亡。
  2. 风险比(Hazard Ratio, HR):表示在给定时间段内,某一特定因素增加或减少事件发生的风险的比例。HR大于1意味着该因素增加了事件发生的风险;HR小于1则意味着降低了风险。
  3. 比例风险假设:Cox模型假设所有协变量对风险函数的影响随时间保持恒定,即风险比不随时间变化。

如何进行多变量Cox回归分析

  1. 数据准备:需要包含每个患者的随访时间(从进入研究到事件发生或最后一次随访的时间)、事件状态(是否发生了感兴趣的结局)、以及一系列潜在影响结局的变量(如年龄、性别、疾病分期等)。
  2. 模型拟合:使用统计软件(如R、SAS、SPSS等)中的Cox回归函数,输入相关数据和变量,拟合出模型。
  3. 结果解释
    • 系数(Coefficients):每个变量的回归系数反映了其对风险函数的影响方向和强度。
    • 风险比(HRs)及95%置信区间(CI):HR及其置信区间提供了关于变量效应大小的信息。如果CI不包括1,则表明该变量与事件发生有显著关联。
    • P值:用于判断变量对结局的影响是否具有统计学意义

七、归一化

八、VAF变异等位基因频率

  • 变异等位基因频率(VAF):对于一个给定的基因组位置,如果存在一个变异(例如单核苷酸变异SNP、插入/删除indel等),那么VAF就是指在所有覆盖该位置的测序读段中,携带该变异的读段所占的比例。它通常以百分比表示。

    举例来说,如果在一个特定位置观察到了100个读段,其中有20个读段显示了某种变异,则该变异的VAF为20%。

  • 最大变异等位基因频率(Max VAF):在分析一个样本时,可能会发现多个不同的体细胞突变,每个突变都有其对应的VAF。Max VAF就是这些VAF中的最大值,代表了样本中最常见的那个变异等位基因的频率。

Max VAF的意义

  • 肿瘤异质性: 由于肿瘤内部可能存在不同的克隆群体,每个群体可能携带不同的突变。因此,Max VAF可以帮助识别出最显著或最常见的突变,这些突变可能代表了主要的肿瘤克隆。
  • 肿瘤负荷: 一般来说,较高的Max VAF值可能意味着更高的肿瘤负荷或者更多的ctDNA被释放进入血液循环。这是因为肿瘤越大或越活跃,其释放的ctDNA量就越多,相应的VAF也可能更高。
  • 治疗监测: 在治疗过程中,跟踪Max VAF的变化可以用来评估治疗效果。例如,成功的治疗可能导致Max VAF下降,表明肿瘤体积减小或活性降低。
  • 互补信息: 除了传统的基于突变的方法外,通过分析cfDNA片段长度分布也可以有效估计ctDNA水平。
  • 综合评估: 结合Max VAF和基于片段长度分布的ctDNA分数,可以提供更全面的肿瘤负荷评估,并有助于提高诊断准确性。

九、AUC

AUC通常指的是  AUROC,即ROC曲线下方面积,用于量化模型的分类性能。AUC的取值范围在0到1之间,其中0.5表示模型性能等同于随机猜测,1表示完美分类器。

AUROC纵轴是真正例率/敏感率横轴是假正例率。

http://www.dtcms.com/a/286305.html

相关文章:

  • MyBatis:配置文件完成增删改查_添加
  • 智慧后厨检测算法构建智能厨房防护网
  • 零基础入门:用按键精灵实现视频自动操作(附完整脚本)
  • C语言:数组
  • MySQL的关键日志
  • 洛谷 P1395 会议
  • Logback 配置的利器:深入理解<property>与<variable>
  • 教育行业网络升级最佳实践:SD-WAN、传统方案与混合方案对比分析
  • Android sdk 升级 34到35
  • SpringBoot中解决SpringApplication入口和其他Bean不在同属目录下的问题。
  • 暑期自学嵌入式——Day05补充(C语言阶段)
  • STM32+w5500+TcpClient学习笔记
  • 前端基础之《Vue(23)—跨域问题》
  • Effective Modern C++ 条款14:如果函数不抛出异常请使用noexcept
  • 如何将本地Git仓库推送到远程仓库的一个文件中并保留Commit记录
  • 对于编码电机-520直流减速电机
  • 硬核电子工程:从硅片到系统的全栈实战指南—— 融合电路理论、嵌入式开发与PCB设计的工程艺术
  • 正则表达式完全指南:从入门到实战
  • Web3加密货币交易:您需要知道的所有信息
  • 五分钟掌握 TDengine 数据文件的工作原理
  • 《设计模式之禅》笔记摘录 - 8.命令模式
  • 【Mediatek】AN7563搭建编译环境操作说明
  • 1 初识C++
  • 【java 安全】 IO流
  • 20250718-3-Kubernetes 应用程序生命周期管理-Pod对象:存在意义_笔记
  • Android性能优化之包体积优化
  • C++算法竞赛篇:DevC++ 如何进行debug调试
  • Django 实战:I18N 国际化与本地化配置、翻译与切换一步到位
  • 第7天 | openGauss中一个数据库中可以创建多个模式
  • 51c视觉~合集13