单细胞测序数据拟时序分析

分化与发育的过程一直备受研究者们的关注,但机体内的每个细胞都处在一个动态变化的过程,我们很难通过实验的方法分离得到所有状态下的细胞。而单细胞测序技术的发展,为我们对细胞群体内的异质性和发育分化轨迹研究提供了新的方法。今天我们就跟随王老师一起来看一下BD SeqGeq™之单细胞测序数据拟时序分析。

什么是拟时序分析?

实际上,单细胞转录组测序的每个细胞都处在某个特定的分化状态,因此可将每个细胞都看作整个连续分化发育程序中的快照。不同状态的细胞连起来就是一个“轨迹”,类似根据时间关系判断出的发育轨迹变化,但这并不是真正的时间,而是通过基因表达来模拟细胞的发育演化过程,所以称为“拟”时序分析(Pseudotime analysis)。

目前拟时序分析最常用的方法 Monocle是由Trapnell实验室开发的,采用了无监督算法,将单个细胞按照拟时间排列在对应的轨迹上。Monocle根据基因的表达状况把样本分为多个分化状态下的细胞群(State),生成直观的谱系发育树状图。

BD SeqGeq™ 支持拟时序分析

BD SeqGeq™目前将Monocle v2.0整合为插件。用户可以通过插件安装的方式获取Monocle功能,运行简单,无需编写R代码,操作界面十分友好。下面就为大家详细展示如何在SeqGeq™中获取Monocle以及使用它进行拟时序分析。

下载Monocle插件

进入SeqGeq™插件网站FlowJo exchange, 下载最新版Monocle插件。

进入The Comprehensive R Archive Network(CRAN)网站https://cran.r-project.org/ 下载电脑兼容的R版本。如电脑已安装R,则不必重新安装。

运行Monocle

选中目标细胞群,打开Workspace-Plugin-Monocle插件,指定基因进行Monocle运算。

结果解读

Monocle运行结束后,会生成一系列的结果图形和数据表格。选定的细胞群下会生成不同State的细胞亚群;在软件基因集位置,可查看每个State亚群的主要驱动基因,这些基因集可导出供使用;在Layout界面,会自动生成一张Monocle结果图和不同State基因表达图;自动生成的结果文件夹可查看热图。

首先,可将细胞的每个群在Monocle树状图中展示出来。相似分化状态的细胞被聚到一起,每个分叉点代表一个可能的细胞命运的决策点。根据自己的实验背景,去判断哪个细胞群可能为分化起始点或终点。

在Layout界面,会自动跳转出Monocle结果。左图是细胞拟时间值的分布情况,由蓝到红拟时间值依次增大;右图是根据颜色排列的不同的细胞状态,能够查看每个状态对应的基因表达,结合细胞群的分布去判断可能的分化发育轨迹。

相应地,SeqGeq™也会同时生成每个State细胞群的基因表达情况。

输出的基因随拟时间表达的热图,表达相似的细胞会聚在一起,形成不同的State亚群,方便直观查看结果。

Monocle安装方法

关联SeqGeq™

将SeqGeq™与R安装的位置和SeqGeq™安装目录下 Plugin文件夹的位置进行关联,并将下载好的插件包中的Monocle.jar文件复制至关联的Plugin文件夹中。

安装Monocle

打开插件中包中How_to_Monocle PDF文件,复制安装命令至 R中进行安装。

R包安装完成后,重启SeqGeq™。

Reference:

Trapnell,Cacchiarelli et al. The dynamics and regulators of cell fate decisions arerevealed by pseudotemporal ordering of single cells. Nature Biotechnology.2014