rna-seq技术发展前景 港中大开发了一种连接批量
rna-seq技术发展前景 港中大开发了一种连接批量
2024-11-25 10:20:38  作者:流氓小浪种  网址:https://m.xinb2b.cn/sport/nds158887.html

编辑 | 萝卜皮

单细胞 RNA 测序已成为以明确的高分辨率研究生物学意义的强大工具。然而,它在新兴数据上的应用目前受到其内在技术的限制。

在这里,香港中文大学的研究人员介绍了 Tissue-AdaPtive autoEncoder(TAPE),这是一种连接批量 RNA-seq 和单细胞 RNA-seq 的深度学习方法,可在短时间内实现精确的反卷积。通过构建可解释的解码器并在独特的方案下进行训练,TAPE 可以自适应地预测细胞类型分数和细胞类型特异性基因表达组织。

与几个数据集上的流行方法相比,TAPE 在细胞类型水平上具有更好的整体性能和相当的准确性。此外,它在不同的细胞类型中更稳健、更快、更敏感,可以提供具有生物学意义的预测。

该研究以「Deep autoencoder for interpretable tissue-adaptive deconvolution and cell-type-specific gene analysis」为题,于 2022 年 11 月 8 日发布在《Nature Communications》。


批量 RNA 测序 (RNA-seq) 是一种广泛使用的高通量测序技术,为研究生物事件的转录组变异提供了强大的工具。RNA-seq 测量平均表达水平,它提供了来自转录水平的大样本的宏观图谱,没有细胞特异性信息。然而,在某些情况下,研究样本的细胞组成和比例也很重要,尤其是在具有细胞发育和增殖的系统中(例如癌症)。

最近,单细胞 RNA 测序 (scRNA-seq) 为识别和分析复杂组织的细胞异质性提供了前所未有的机会。虽然 scRNA-seq 在细胞粒度方面提供了令人印象深刻的分辨率,但它仍然昂贵且易受噪声影响,从而禁止对大规模样本进行测序。为了克服这些障碍,研究人员可以将丰富的批量 RNA-seq 数据与 scRNA-seq 数据相结合,参考小型 scRNA-seq 数据集从批量 RNA-seq 样本执行细胞类型反卷积。

近年来,许多单细胞图谱辅助算法如雨后春笋般涌现,以剖析大量 RNA-seq 数据。现有的方法大致可以分为两类:基于统计学习的方法和基于深度学习的方法。基于传统的回归模型,如非负最小二乘(NNLS)和支持向量回归(SVR),CIBERSORT(CS)、MuSiC、CIBERSORTx(CSx)、Bisque、DWLS、RNA-Sieve 和 BLADE 等一系列方法已被开发出来。

所有这些工具都需要预先选择的细胞类型特异性基因表达谱(GEP)或根据统计值(例如,均值和方差)为不同的基因分配不同的权重。相比之下,深度学习方法 Scaden 使用模拟的批量数据进行训练,无需依赖预定义的 GEP,它可以自动从 GEP 中提取特征。

尽管取得了这些进展,但这些方法忽略了运行时间成本,尤其是在处理大数据集的需求不断增长的情况下。此外,除了 CSx,其他方法,如 Scaden,无法预测关键的细胞类型特异性基因表达。这种限制导致 Scaden 和其他方法的可解释性差。即使对于 CSx,它也需要多个样本 (>15) 来纯化表达。

为了克服这些限制,香港中文大学的研究人员提出了一种使用深度神经网络(DNN)的准确、高效且可解释的深度学习算法 Tissue-AdaPtive autoEncoder(TAPE)。基本思想是编码器可以学习更高阶的潜在表示,解码器可以在自编码器的框架下实现输出的可解释性。

此外,他们引入了一种名为自适应训练的新训练方案,以自适应地优化 GEP 组织。研究人员表示,他们的方法可以实现比以前最先进的方法更好的整体性能。


图示:TAPE 工作流程和自适应阶段的说明。(来源:论文)

TAPE 作为数字组织解剖的深度学习算法,它与以前方法的主要区别包括(1)高度准确和敏感的反卷积,以捕捉临床数据的生物学显著变化;(2) 组织适应性细胞类型特异性基因表达谱预测,以识别细胞类型水平的潜在基因表达差异。TAPE 受益于自编码器的架构和自适应阶段独特的训练方法。编码器-解码器架构使可解释的解码器能够回答编码器做出此类预测的原因。

更有趣的是,解码器是一个自然的特定于细胞类型的签名矩阵,可以在训练阶段之后学习,然后在自适应阶段之后适应批量数据。TAPE 的特殊训练过程使其与其他方法有根本不同,其他方法仅预测细胞分数或需要大量队列批量 RNA 序列数据来计算细胞类型特异性 GEP,或很难推断细胞类型特异的GEP中不显著的基因表达。


图示:基准数据集上反卷积算法的比较。(来源:论文)

TAPE 的另一个优势是它在对大量样本进行反卷积时的超快速推理。TAPE 在常用的图形处理单元 (GPU) 上运行,其速度可与最快的统计方法相媲美,甚至比之前的深度学习方法还要快。

尽管已经证明 TAPE 的反卷积性能在许多场景中都相当不错,但它在「罕见」场景中表现不佳,因为它显示出较低的 CCC 值。但是,在基准测试过程中,结果表明其他工具的性能在「罕见」情况下也会下降。这种现象表明当前的方法没有很好地解决「罕见」的情况,需要在未来的工作中加以解决。

在临床数据预测的场景下,TAPE能够稳定地预测临床病例中大多数细胞类型的比值变化,具有统计功效,其结果与以往相关临床研究一致。在实际使用过程中,为了使研究更有针对性,研究人员建议用户根据现有的实验证据从 TAPE 输出中选择他们想要进一步分析的细胞类型。


图示:TAPE 和 CSx 的基因一致性。(来源:论文)

同时,TAPE 可以自适应地预测细胞类型特异性 GEP。但不可否认,它还可以进一步改进。首先,当使用「整体」模式研究基因水平的相关性时,大约 30% 的预测基因具有负相关性。尽管该方法的性能(中值 CCC 0.2127)优于 CSx(中值 CCC 0.0627),但仍有很大的改进空间。


图示:从批量 GEP 和推断的 GEP 计算的 DEG 火山图。(来源:论文)

其次,当用它来预测 DEGs 时,TAPE 很难预测适当的倍数变化,这部分是由归一化方法引起的,因为基因值在 0 和 1 之间归一化。然而,这种现象也可以在 CIBERSORTx 中观察到,这表明大样本和推断的细胞类型特异性 GEP 之间的信息丢失很难重建。在该研究的测试中,考虑到预测的 foldchange 不正确这一事实,研究人员仅使用 t 检验来查找 p < 0.05 的 DEG,并且可以从该标准获得合理的 DEG 结果。


图示:DEG 检测会受到相似细胞类型的影响(100 个随机选择的具有相似细胞类型的 DEG)。(来源:论文)

第三,研究人员注意到如果 DEG 不是特征基因,CIBERSORTx 和该方法都无法正确区分 DEG 和相似的细胞亚型,这意味着它们的分辨率仍然有限。但 CIBERSORTx 在区分特征 DEG 与相似细胞类型方面显示出其优势,因为结合了特征矩阵。


图示:在四种场景中对 TAPE 和 CIBERSORTx 进行综合测试。(来源:论文)

虽然该方法不能精确地预测来自细胞亚型的 DEG,或者如果所有特征基因都是可能不会出现在现实世界中的 DEG,则其性能比 CIBERSORTx 更好,但它仍然通过排除不相关的细胞类型来减少潜在的候选者。因此,他们的方法仍然有用,可以应用于现实生活场景以加速生物学研究。


图示:细胞特异性 GEP 的功能富集。(来源:论文)

受益于「高分辨率」模式下预测的细胞类型特异性 GEP,它可以识别每个样本的每种细胞类型中特定的激活功能通路,这可能是该算法的另一个潜在优势。根据测试结果,研究人员可以确定参与功能失调通路的细胞类型。结合 ssGSEA 和 TAPE 可以帮助使用大量 RNA-seq 数据识别特定细胞类型中的特定功能障碍途径,这将基本上利用以前的群体转录组数据集。

总之,TAPE 代表了一个广泛适用的框架,用于在细胞类型水平上破译组织的异质性,并为有监督的自动编码器执行域适应提供了一种实用的训练方案。考虑到它可以与其他工具无缝集成,相信 TAPE 将有助于研究单细胞数据与丰富的批量数据之间的联系。

论文链接:https://www.nature.com/articles/s41467-022-34550-9

  • 小说琅琊榜主要讲了什么?(小说琅琊榜简介)
  • 2024-11-25小说琅琊榜简介《琅琊榜》讲述的是南梁时期,大渝兴兵南下,赤焰军少帅林殊随父出征、率七万将士抗击敌军,不料七万将士因奸佞陷害含冤埋骨梅岭林殊从地狱之门拾回残命,历经削骨易容之痛,化身天下第一大帮江左盟盟主梅长苏十二年。
  • 禁毒宣传进学校主题活动(禁毒开学第一课)
  • 2024-11-25禁毒开学第一课远离毒品、珍爱生命,弘扬正气、振兴中华为进一步加大校园禁毒宣传教育工作力度,提高广大青少年学生自觉抵制毒品的能力,筑牢校园“防毒墙”,推动创建平安和谐校园,按照“百日行动”总体安排部署,会宁县禁毒办联。
  • 460是啥意思(460指的是什么)
  • 2024-11-25460指的是什么460的意思网络延迟王者荣耀游戏对局中当延迟达到460ms时,卡顿现象会十分严重,玩家就无法进行操作了而玩家发“460”的意思是指游戏太卡,请暂缓团战或者谅解自己的操作失误网络语言包括拼音或者英文字母。
  • 三国大时代6等级(三国大时代6越来越拉胯)
  • 2024-11-25三国大时代6越来越拉胯三国大时代6是一款3D技术打造的角色扮演rpg游戏,也是三国大时代系列的第六部三国大时代6是在三国大时代5的基础上全新改编而来,保留了原来备受好评的战斗系统,重点增强众多名人的3D形象,所有角色的造型。
  • 电影满江红戏曲配乐谁唱的(满江红摇滚版戏曲配乐走红)
  • 2024-11-25满江红摇滚版戏曲配乐走红记者田汝晔张琪今年春节档,电影市场迎来“开门红”作为春节档热度最高的影片之一,《满江红》电影中转场的戏曲背景音乐,节奏激烈、声音高亢,既霸气又魔性戏曲与摇滚的结合,再搭配上演员快速行走的镜头,引得观众。
  • 深圳玩乐好去处推荐(带您玩转深圳好玩么)
  • 2024-11-25带您玩转深圳好玩么#向广东出发#不少人说深圳除了看高楼就没啥可玩的,其实是未了解深圳尊称“国际旅行圣经”的《孤独星球》发布2019年度世界十大最佳旅行城市榜单,深圳位居全球第二意料之外吧?深度玩过,便知情理之中玩转深圳。
  • 冰箱结冰了 怎样快速除冰
  • 2024-11-25冰箱结冰了 怎样快速除冰步骤/方式1首先要拔掉冰箱插头,切断电源保证操作安全步骤/方式2清空冰箱,将食物移出冰箱,一些冷冻的食物我们可以集中放置在一起,这样有利于短时间之内保温步骤/方式3在冰箱中放上一碗热水(60摄氏度左右。
  • 外国人看见李小龙动作(李小龙功夫不是演的)
  • 2024-11-25李小龙功夫不是演的以无法为有法,以无限为有限,是中国功夫的最高境界!李小龙,一代功夫之王,他的双截棍和截拳道,开创了功夫新天地,手是两扇门,全凭脚赢人,李小龙的功夫口令,至今传颂不休,让一代又一代的武术爱好者,赞扬不止。
  • 新微信支付怎么推广收款码(号全面升级)
  • 2024-11-25号全面升级|微信支付成功页面可一键跳转商家视频号10月15日,微信支付商家助手消息,视频号和微信支付的联合打造“品牌视频号”,实现运营场景的打通微信支付成功页面可直接跳转至品牌视频号主页,并支持设置视频号直播预。
  • 资格证年审网上怎么审(道路运输从业资格证怎么年审)
  • 2024-11-25道路运输从业资格证怎么年审道路运输从业资格证不需要年审,但是每年需要考核《道路运输从业人员管理规定》里的规定如下:道路运输从业人员从业资格证件有效期为6年道路运输从业人员应当在从业资格证件有效期届满30日前到原发证机关办理换证。
  • 人生最难突破的三个瓶颈(所谓的瓶颈期就是不上不下)
  • 2024-11-25所谓的瓶颈期就是不上不下在我们的健身过程中,有很多人应该都会遇到这样的一种阶段,那就是感觉自己练得越来越没有感觉,并且感觉自己的训练效果也越来越差,甚至是几乎没有训练效果了对于这种情况,我们一般都会把这阶段,称之为健身训练的。
  • 聊斋志异胡四姐(从胡四娘到五女拜寿)
  • 2024-11-25从胡四娘到五女拜寿按作者简介:火烧彤云,湖南省长沙市人,建筑工程造价工程师,爱思考,爱写作,追求美好高尚的精神世界作者火烧彤云八十年代有一部著名的越剧电影,叫《五女拜寿》它并非传统戏剧,而是当代人根据《聊斋志异·胡四娘。