当前位置: 首页 > news >正文

单细胞转录组(2)单细胞测序原理

1. 细胞捕获分选技术

单细胞捕获分选方法
a微吸管分离
b显微镜 辅助毛细管捕获
c荧光标记 细胞分选( FACS
d激光捕获显微 分离 (
e微流控
f抗体 磁 珠 分选 MACS
g微液滴

单细胞测序的关键在于如何进行单细胞的捕获和分选,这是决定单细胞检测成本和通量的关键步骤。不同的单细胞测序平台主要差别也在于单细胞捕获分选的方法。

1.1 细胞分选技术

在这里插入图片描述

细胞分选技术可以分为特异性分选非特异性分选两大类:

  • 特异性分选

    • 微吸管分离:通过显微操作技术,用微吸管手动挑选单个细胞。
    • 激光捕获显微分离(LCM):利用激光将目标细胞从组织切片中分离出来。
    • 荧光激活细胞分选(FACS):基于细胞表面荧光标记物,通过流式细胞仪分选目标细胞。
    • 抗体磁珠分选(MACS):利用抗体偶联的磁珠,通过磁场分选目标细胞。
    • 优点:能够精确分选目标细胞。
    • 缺点通量低,依赖已知标记物,成本高,操作复杂。
  • 非特异性分选

    • 微流控技术:通过微流控芯片的微通道和微腔室,将单细胞分离并捕获。
    • 微液滴技术:将单细胞和反应试剂包裹在纳米级液滴中,每个液滴包含一个细胞和一个带有条形码的珠粒。
    • 微孔技术:利用蜂窝板上的微孔,让单细胞悬液流过并落入微孔中。
    • 优点:通量高,适合大规模单细胞测序。
    • 缺点:无法特异性分选目标细胞,需要后续分析筛选。
1.2 特异性分选类技术(低通量)

早期单细胞测序技术(如SMART-seq)主要基于特异性分选,但存在以下局限:

  • 细胞分选效率低,一次只能分选少量细胞。
  • 依赖已知标记物,难以发现新的细胞类型。
  • 检测成本高,不适合大规模研究。
1.3 非特异性分选类技术(高通量)

目前主流的单细胞测序平台(如10x Genomics、BD Rhapsody)均采用非特异性分选技术,能够一次捕获数千个细胞,大大提高了通量和效率。


2. 不同单细胞测序平台比较

单细胞测序平台的选择取决于实验需求、预算以及研究目标。不同的平台在通量、成本、操作复杂性以及数据分析难度等方面存在显著差异。以下是一些常见单细胞测序平台的比较:

技术类型代表性技术通量优点缺点
微流控芯片Fluidigm C196个细胞/芯片通量适中,适合少量细胞的高精度分析通量有限,成本较高
微液滴10x Genomics3000-8000个细胞/芯片高通量,适合大规模单细胞测序数据复杂,分析难度大
微孔技术BD Rhapsody20万+微孔高通量,适合大规模单细胞测序操作复杂,成本较高
2.1 微流控芯片技术
  • 代表性技术:Fluidigm C1
  • 通量:一次最多可以捕获96个单细胞。
  • 优点
    • 高精度:适合对少量细胞进行高精度的分析。
    • 自动化程度高:操作相对简单,适合实验室常规使用。
  • 缺点
    • 通量有限:一次只能处理96个细胞,对于大规模研究不够用。
    • 成本较高:芯片成本较高,不适合大规模单细胞测序。
2.2 微液滴技术
  • 代表性技术:10x Genomics
  • 通量:一次可以处理3000-8000个单细胞。
  • 优点
    • 高通量:能够一次处理数千个单细胞,适合大规模研究。
    • 成本较低:单个细胞的测序成本相对较低。
    • 数据丰富:能够提供丰富的基因表达信息。
  • 缺点
    • 数据分析复杂:产生的数据量大,分析难度较高。
    • 多细胞污染:存在一定的多细胞污染风险,需要后续分析筛选。
2.3 微孔技术
  • 代表性技术:BD Rhapsody
  • 通量:蜂窝板上有20万+微孔,理论上可以处理大量单细胞。
  • 优点
    • 超高通量:适合处理大量单细胞,适合大规模研究。
    • 灵活性高:可以同时处理多个样本,适合多组学分析。
  • 缺点
    • 操作复杂:实验操作较为复杂,需要专业的技术人员。
    • 成本较高:设备和耗材成本较高。

3. 10x Genomics 单细胞测序技术

10x Genomics 是目前最主流的单细胞测序平台之一,其核心技术包括 GEM(Gel Beads-in-Emulsion)BarcodeUMI(Unique Molecular Identifier)。这些技术的结合使得 10x Genomics 平台能够实现高通量、低成本的单细胞测序。

3.1 GEM(Gel Beads-in-Emulsion)

在这里插入图片描述

  • GEM 结构
    图中展示的是10x Genomics单细胞测序技术中使用的GEM(Gel Beads-in-Emulsion,凝胶珠-油包水)结构。GEM是10x Genomics单细胞测序技术的核心组成部分,它允许在单个细胞水平上进行基因表达的捕获和测序。
  1. 凝胶珠(Gel Bead):这是一个微小的凝胶珠,内部包含有用于后续逆转录和扩增的引物。

  2. 10x Barcode:这是一段16个碱基对(nt)的独特序列,每个凝胶珠上的Barcode都是唯一的,用于在测序后区分来自不同细胞的RNA分子。

  3. UMI(Unique Molecular Identifier,独特分子标识符):这是一段12个碱基对的序列,用于在同一个细胞内区分不同的转录本,并在后续分析中去除PCR扩增过程中产生的重复序列,从而实现更准确的基因表达定量。

  4. Poly(dT)引物:这是一段30个碱基对的poly(dT)序列,用于捕获细胞中的mRNA分子。mRNA的poly(A)尾巴会与poly(dT)引物结合,从而使得mRNA模板可以被逆转录成cDNA。

在单细胞测序过程中,每个细胞被包裹在自己的GEM中,这样每个细胞的mRNA分子都会被逆转录并加上特定的Barcode和UMI。这个过程发生在油包水的液滴中,每个液滴相当于一个微型反应室。随后,这些液滴被打破,释放出含有cDNA的凝胶珠,这些cDNA可以被进一步扩增并准备进行高通量测序。

  • 作用
    • 每个 GEM 中的细胞独立进行裂解、反转录和扩增,最终形成单细胞测序文库。
    • 通过 Barcode 和 UMI,可以将测序结果拆分到单个细胞,并去除 PCR 重复。
3.2 Barcode

Barcode 是一段 14-16bp 的标签序列,每个 GEM 中的 Barcode 不同,用于区分不同的细胞。10x Genomics 平台每次反应可以投入约 75 万个 GEM,远远大于细胞数目。

  • 作用

    • 通过 Barcode 序列,可以将测序结果拆分到单个细胞。
    • 每个细胞的 Barcode 唯一,用于标记细胞来源。
  • 特点

    • Barcode 序列在测序过程中用于区分不同细胞的转录本。
    • 10x Genomics 芯片同时可以上样 8 个文库,不同文库可以使用相同的 Barcode,但为了保证整合多个文库时 Barcode 不发生冲突,通常会在 Barcode 后面加一个数字标记其来源的文库。
3.3 UMI(Unique Molecular Identifier)

UMI 是单分子识别码,长度为 10-12bp,用于区分同一细胞中的不同转录本并去除 PCR 重复

  • 作用

    • 通过 UMI,可以准确计算基因表达量,避免 PCR 扩增带来的偏差。
    • UMI 在 cDNA 分子扩增前加入,用于识别并去除技术重复。
  • 特点

    • UMI 测序可以在 PCR 扩增之前标记每个分子,从而在后续分析中区分真实信号和 PCR 重复。
    • UMI 的使用提高了基因表达定量的准确性和可靠性。
    • 在这里插入图片描述
      先根据barcode区分细胞,然后根据umi去除重复
3.4 GEM 与 Barcode 以及 UMI 之间的关系
  • GEM 是反应体系:包含 Barcode 和 UMI。
  • 不同 GEM 中的 Barcode 不同:用于区分不同的细胞。
  • 同一 GEM 中的 UMI 不同:用于区分同一细胞中的不同转录本。
  • Barcode 代表细胞:用于标记细胞来源。
  • UMI 代表测序 reads:用于标记单个转录本。

总结

10x Genomics 单细胞测序技术通过 GEM、Barcode 和 UMI 的结合,实现了高通量、低成本的单细胞测序。这些技术的结合不仅提高了单细胞测序的通量,还提高了数据的准确性和可靠性。10x Genomics 平台因其高效性和经济性,已成为单细胞测序领域的主流选择。


4. 10x Genomics 单细胞测序文库构建及测序

10x Genomics 单细胞测序技术是一种革命性的方法,它通过将每个单细胞封装在独立的油滴中,与凝胶珠(GEM)结合,从而实现高通量、高效率的单细胞测序。以下是详细的文库构建及测序步骤:

4.1 文库构建步骤
  1. 单细胞悬液制备:首先,需要从组织或细胞样本中制备出高质量的单细胞悬液。这一步骤对后续分析的准确性至关重要。

  2. 细胞计数和活率检测:调整细胞浓度至700-1200个细胞/μL,并确保细胞活率高于80%,以保证测序结果的可靠性。

  3. GEM生成:利用微流控芯片技术,将带有唯一Barcode和UMI序列的凝胶珠与单细胞一起包裹在油滴中,形成GEM结构。每个GEM包含一个单细胞、一个凝胶珠和一个油滴。

  4. 细胞裂解和反转录:在油滴中,细胞被裂解,释放的mRNA与凝胶珠上的Barcode和UMI序列相连,进行逆转录反应形成cDNA。
    在这里插入图片描述
    1:PolyA+ RNA捕获

  • 过程:这条mRNA分子的3’端有一个polyA尾巴。我们使用带有寡聚T(polyT)的磁珠来捕获这个polyA尾巴,从而将这条mRNA从细胞中的所有RNA分子中分离出来。
  • 结果:我们成功捕获了这条mRNA分子。

2:RNA片段化和引物结合

  • 过程:捕获的mRNA分子被切割成较小的片段(例如200-300个核苷酸)。然后,我们使用随机引物或oligo(dT)引物与这些RNA片段结合,为后续的反转录做准备。
  • 结果:每个RNA片段都与一个引物结合,准备进行反转录。

3:第一条链cDNA合成

  • 过程:反转录酶使用引物和四种脱氧核苷酸(dNTPs)作为原料,根据RNA片段的序列合成第一条cDNA链。这条链是与原始mRNA序列互补的。
  • 结果:我们得到了与原始mRNA序列互补的第一条cDNA链。

4:第二条链cDNA合成

  • 过程:为了得到双链cDNA,我们使用DNA聚合酶合成第二条链。这个过程可能涉及到RNA模板的置换或使用RNAse H降解RNA模板,然后合成第二条cDNA链。
  • 结果:我们得到了双链cDNA分子。

5:3’端加A和5’端修复

  • 过程:在cDNA的3’端添加腺嘌呤(A)突出端,并对5’端进行修复,以便于后续接头的连接。
  • 结果:cDNA分子的两端被修饰,准备好连接测序接头。

6:连接DNA测序接头

  • 过程:在cDNA分子的两端分别连接上测序所需的接头(adapters)。这些接头包含了用于PCR扩增的引物结合位点以及测序所需的序列。
  • 结果:cDNA分子的两端被连接上了测序接头,形成了测序文库片段。

7:连接片段的PCR扩增

  • 过程:使用接头上的引物进行PCR扩增,以增加文库的量,准备进行高通量测序。在这个过程中,我们可能会加入条形码(barcode)以区分不同样本。
  • 结果:我们得到了大量的测序文库片段,每个片段都带有条形码,可以区分不同的样本。
  1. 破乳和文库构建:通过破乳过程,将油滴打破,释放出含有cDNA的凝胶珠。然后,将所有cDNA混合,进行文库构建,准备进行高通量测序。

  2. 上机测序:利用Illumina测序平台进行高通量测序,获取每个细胞的基因表达信息。

4.2 10x Genomics 单细胞测序平台优势
  • 真正单细胞测序:通过GEM技术实现真正意义上的单细胞测序。
  • 超高细胞通量:一次可检测500-80000个细胞,适合大规模研究。
  • 细胞捕获效率高:单细胞捕获效率高达65%,能够准确鉴别稀有细胞类型。
  • 细胞可适性高:对细胞大小和类型无限制,适用于多种细胞类型。
  • 多态率低:多态率(包含多个细胞的GEM)低于0.9%/1000细胞,保证了数据的准确性。
  • 时间周期短:从细胞悬液到cDNA文库构建的整个过程可以在1天内完成。
  • 性价比高:单个细胞的测序成本低,适合大规模应用。

5. 10x Genomics 单细胞测序平台优势

10x Genomics 单细胞测序平台因其独特的设计和高效的工作流程,在单细胞测序领域中占据了重要地位。以下是该平台的主要优势:

5.1 真正单细胞测序

10x Genomics 技术通过微流体“双十字”交叉系统分选单个细胞,并通过 barcode 磁珠-单细胞-油滴的对应关系形成 GEM(Gel Beads-in-emulsion),实现真正意义上的单细胞测序。这种方法确保了每个细胞的基因表达数据都是独立捕获和分析的,从而提高了数据的准确性和可靠性。

5.2 超高细胞通量

微流体“双十字”交叉系统为 8 通道系统,每个通道最高可捕获 10000 细胞,8 通道一次可检测细胞范围为 500-80000 个细胞。这种高通量的能力使得研究人员能够在短时间内分析大量的单细胞,非常适合大规模的单细胞研究。

5.3 细胞捕获效率高

单个细胞捕获效率高达 65%,这意味着在实验过程中可以准确鉴别稀有细胞类型,对于稀有样本或小细胞量类型样本研究尤为重要。

5.4 细胞可适性高

该平台对细胞大小(直径超过 40um 细胞需要制备成细胞核)及类型无限制,这使得它可以广泛应用于不同类型的细胞和组织样本。

5.5 多态率低(Multiplet Rate)

多态率(同一个 GEM 包含 2 个及 2 个以上细胞)低于 0.9%/1000 细胞。这种低多态率确保了大多数 GEM 中只包含一个细胞,从而减少了数据中的噪声和复杂性。

5.6 时间周期短

自动化分离过程,无需人工操作,1 天内可完成从细胞悬液到 cDNA 文库构建的所有测序准备工作。这种快速的流程大大缩短了实验周期,提高了研究效率。

5.7 性价比高

单个细胞成本低于其他单细胞平台,使得大规模的单细胞测序研究更加经济可行。

总结

10x Genomics 单细胞测序平台通过其高效、高通量和低成本的特点,为单细胞基因表达分析提供了强大的工具。这些优势使得该平台在单细胞研究领域中非常受欢迎,适用于各种生物学和医学研究。


6. 常见问题

在单细胞测序的实践中,研究人员可能会遇到一些常见问题。以下是这些问题的详细解释和解答:

6.1 为什么不做单细胞DNA测序?
  • 原因:同一个体的细胞DNA基本相同,主要的变异通常在转录水平上,即基因表达的差异。此外,DNA测序的数据量非常大,成本较高,而且现有的单细胞DNA测序主要用于检测拷贝数变异(CNV)等特定类型的遗传变异。
6.2 单细胞测序与三代测序结合?
  • 可能性:目前主流的单细胞测序主要采用二代测序技术,因为其成本较低,且主要用于计数,对片段长度要求不高。然而,单细胞测序也可以与三代测序结合,以利用三代测序的长读长优势,但这通常需要特殊的建库方法。
6.3 原核生物是否可以做单细胞测序?
  • 限制:原核生物不具有polyA尾巴,这是单细胞测序中用于捕获mRNA的关键结构。因此,目前无法使用常规的单细胞测序方法对原核生物进行测序。
6.4 植物可以做单细胞测序吗?
  • 可行性:可以,但植物细胞具有细胞壁,这使得在制备单细胞悬液时需要采用特殊的方法。此外,植物细胞的基因表达调控机制可能与动物细胞有所不同,因此在分析时需要特别注意。
6.5 单细胞测序数据量
  • 数据量计算:单细胞测序的数据量与细胞数目正相关。例如,测序5000个细胞,每个细胞5万条reads,根据测序文库的reads长度,可以计算出总数据量。这通常需要大量的存储空间和计算资源。
6.6 测序饱和度
  • 饱和度解释:单细胞测序每个细胞的reads数远低于饱和,但通过大量细胞重复,整体数据量可以达到饱和。有研究表明,每个细胞测序2~3k reads,也可以得到很好的分群准确性。
6.7 单细胞测序是否需要对照组?
  • 对照组需求:单细胞测序一般不需要对照组,因为其主要目的是鉴定整个组织的细胞类型,而非不同样品之间表达差异的比较。通过组织内部不同组之间比较差异表达基因即可。
6.8 单细胞测序是否需要加入内参?
  • 内参需求:单细胞测序一般不需要内参。建库已经在GEM内部完成,不容易混合,且通过UMI可以准确鉴定表达的reads数目,接近于绝对定量,不需要加入内参。

相关文章:

  • 【Linux网络与网络编程】12.NAT技术内网穿透代理服务
  • 【前端基础】HTML元素隐藏的四个方法(display设置为none、visibikity设置为hidden、rgba设置颜色、opacity设置透明度)
  • DeepSeek 赋能社会科学:解锁研究新范式
  • 现在市面上三大常用的拓客软件好用吗?
  • 机器学习,深度学习,神经网络,深度神经网络之间有何区别?
  • PostgreSQL内幕剖析——结构与架构
  • C++类与对象--1 特性一:封装
  • 深入浅出IIC协议 - 从总线原理到FPGA实战开发 -- 第一篇:I2C总线协议深度解剖
  • CentOS 下 FTP 与 NFS 服务深度解析:从基础配置到实战应用
  • 深度学习推理引擎---OpenVINO
  • Android核心系统服务:AMS、WMS、PMS 与 system_server 进程解析
  • 如何在纷杂的环境当中保持保持独立思考能力?
  • linux c++头文件生成源文件 使用python脚本 配置vim快捷键
  • Unity3D仿星露谷物语开发44之收集农作物
  • OAuth2.0
  • 6to4、6over4的类比解释
  • 使用tensorRT10部署低光照补偿模型
  • MySQL相关
  • [强化学习的数学原理—赵世钰老师]学习笔记02-贝尔曼方程
  • 支持selenium的chrome driver更新到136.0.7103.94
  • 被围观的“英之园”,谁建了潮汕天价违建?
  • 乌称苏梅州一公共汽车遭俄军袭击,致9死4伤
  • 词条数量大幅扩充,《辞海》第八版启动编纂
  • A股三大股指低收:汽车股领涨,大金融走弱,两市成交近1.1万亿元
  • 陈吉宁龚正黄莉新胡文容等在警示教育基地参观学习,出席深入贯彻中央八项规定精神学习教育交流会
  • 昆明警方重拳打击经济领域违法犯罪:去年抓获905名嫌犯