单细胞ATAC-seq携Cell文章重磅来袭 联合GWAS数据解析人类疾病与细胞类型关系-技术前沿-资讯-生物在线

单细胞ATAC-seq携Cell文章重磅来袭 联合GWAS数据解析人类疾病与细胞类型关系

作者:北京博奥晶典生物技术有限公司 2018-12-15T00:56 (访问量:7621)

上一期我们发布了博奥晶典最新推出的基于10x Genomics平台的新产品—单细胞ATAC-seq的技术及原理,你是不是还在回味其中呢?不要着急,下面小编通过《Cell》上的一篇文章展示单细胞ATAC-seq的数据分析思路,及其联合人类GWAS数据解析人类疾病与细胞类型的奥秘,为单细胞ATAC-seq多数据整合提供参考依据

单细胞ATAC-seq绘制哺乳动物

染色质可及性图谱

| 发表时间:2018年8月

| 发表期刊:《Cell》

 

| 影响因子:31.398

 

作者:Darren A. Cusanovich,Andrew J. Hill, DelasaAghamirzaie

 

摘 要:本文通过单细胞ATAC-seq技术对成年雄性小鼠13个组织的单细胞染色质可及性进行了分析。结果共鉴定出85个亚群和40万种调控元件。为理解不同哺乳动物细胞类型的染色质可及性和解释人类全基因组关联疾病奠定了基础.

亮点

 

❖ 通过单细胞ATAC-seq技术绘制小鼠不同组织染色质可及性图谱

❖ 对哺乳动物不同组织内的转录调控因子进行注释并解析细胞类型

 

❖ 染色质可及性数据帮助解释人类特征性疾病和细胞类型的关系

研究思路

研究结果

 

1

评估数据结果

 

 

单细胞ATAC-seq技术研究成年雄性小鼠C57BL/6J的13个组织单细胞染色质可及性(图1A.B),结果显示每个组织的细胞总数范围从小脑2278个到肺9996个。每个细胞可接受的最小读取深度从骨髓656个到胸腺1734个(图1D左),共鉴定到436206个可及性位点(图1D右),并为所有细胞可及性内位点进行活性评分(图1E)。

 

 

图1 小鼠单细胞染色质可及性工作流程


2

染色质可及性图谱绘制

 

质控之后,对13个组织的81173个细胞的染色质可及性绘制t-SNE(图2A),并鉴定出30个细胞亚群(图2B),发现每个细胞亚群大多来自于同一组织(亚群7的细胞97%来自于心脏,可能为心肌细胞)。30个亚群表现出了明显的异质性,对每个亚群中的细胞进行重复t-SNE和Louvain聚类分析,共识别85个细胞亚群(图2C)。

 

 

利用相关基因的启动子对85个亚群的细胞类型进行注释,除9个亚群细胞类型未知,大多数亚群注释到特异性细胞类型(图2D)。

图2 单细胞染色质可及性图谱绘制

 

3

单细胞染色质可及性与单细胞转录组数据

相关性分析

 

 

构建哺乳动物细胞类型综合图谱。将单细胞染色质可及性与单细胞转录组比较分析,发现不同组织的细胞类型表现出一致性。利用Spearman对每个ATAC-seq亚群的平均归一化活性评分与两个组织(肾、肺)RNA-seq的平均归一化基因表达谱进行比较,发现两种方法注释的细胞类型表现出高度一致性(图3A.B)。RNA-seq表达和ATAC-seq活性评分组合矩阵进行PCA分析,基于KNN分类将RNA-seq中最常见的标记关联到ATAC-seq数据。发现它们对细胞类型的分配基本一致(图3C-3G),因此可以使用更简单的单细胞ATAC-seq对细胞亚群进行注释。

图3 单细胞ATAC-seq数据与单细胞转录组数据整合分析注释细胞类型

 

4

组织中特异性细胞类型

 

 

为研究细胞类型是否表现出组织特异性。对内皮细胞的细胞群进行重分析得到9个不同的亚群(图4A),每个亚群都显示出组织特异性(图4B)。基于活性评分的可及性数据显示, Flt4和EphB4是静脉内皮细胞的Marker(图4C)。数据表明内皮细胞在组织内和组织间具有特殊的染色质可及性。单核细胞、巨噬细胞、树突状细胞的染色质可及性都表现出组织特异性(图4D-F)。

 

 

图4 染色质可及性反应组织特异性细胞类型


5

染色质可及性反映组织空间构架

为了研究神经元细胞中染色质可及性的异质性,重分析前额皮质的细胞(图5G),结果发现,兴奋性神经元和中间神经元明显地与神经胶质细胞、小胶质细胞和内皮细胞分离(图5H)。在兴奋性神经元内仍存在显著的异质性,可能反映了PFC不同层中的差异表达和甲基化(图5I)。因此推测细胞类型相对于解剖学坐标而变化。肾脏染色质可及性也表现出这样的特性(图J-L)。

图5 染色质可及性与组织空间构架

 

6

造血过程中染色质可及性动态变化

 

 

研究骨髓造血部位的染色质可及性t-SNE亚群图如下(图6A),染色质可及性不能完全分离细胞,因此利用Monocle 2绘制染色质可及性拟序列分析,探索血液的发育阶段。结果发现分支F4和F2上更容易获得红细胞或淋巴样细胞的特异性增强子;在F5和两个小分支(F1和F3)上更容易获得骨髓特异性增强子(图6B)。特异性标记基因(Cd3e、Cd19、Hbb-b1Cd11b / Itgam)的活性评分在根部处于或接近零,但是分别在五个分支的末端急剧上升(图6C)。这些观察结果与将造血祖细胞指定为B细胞(F2)、T细胞(F3)、红细胞(F4)和单核细胞(F5)的结果基本一致。

 

 

图6 造血过程中的染色质可接近性动态变化

7

人类基因组关联分析揭示细胞类型与疾病关系

根据全基因组关联研究(GWAS)的数据,普通人类特征和疾病的遗传主要通过远端调控元件且具有细胞特异性。因此,使用LDSC模型将人类的SNP提升到小鼠基因组中,根据DA峰值的重叠进行注释,并计算85个亚群中的DA峰值富集情况(图7A)。结果显示自身免疫性疾病如遗传性狼疮富集发生在神经元细胞(图7B下),组织块富集的峰不明显(图7B上),说明单细胞染色质可及性数据定义细胞类型的重要性。如LDL胆固醇、HDL胆固醇和甘油三酯类疾病富集在肝细胞(图7B下);免疫球蛋白A(IgA)缺乏的疾病富集在T细胞(图7C)。具有双相障碍的疾病富集在兴奋性神经元(图7D);阿尔茨海默病最强富集在小胶质细胞(图7E)。

图7 小鼠染色质可及性图谱与可遗传的人类性状

 

结论

 

文章通过单细胞ATAC-seq技术绘制小鼠13个组织的染色质可及性图谱,共分出85个细胞亚群,找到40万个差异染色质可及性元件,并鉴定出大部分亚群的细胞类型。与转录组数据整合注释细胞类型,证明了染色质可及性注释细胞类型的可靠性,并且可以反映组织特异性及组织空间构架。最后,小鼠染色质可及性数据与人类基因组数据关联分析揭示了人类特征性疾病与细胞类型的关系。为深入挖掘单细胞ATAC-seq数据,多数据整合分析提供了新思路。

参考文献:

 

Darren A. Cusanovich, Andrew J. Hill, Delasa Aghamirzaie,et al. A Single-Cell Atlas of In Vivo Mammalian Chromatin Accessibility.Cell(2018).

北京博奥晶典生物技术有限公司 商家主页

地 址: 北京市亦庄经济技术开发区科创六街88号,亦庄生物医药园C座

联系人: 市场部

电 话: 18600397163

传 真:

Email:zhiyuanjing@capitalbiotech.com

相关咨询
ADVERTISEMENT