研究人员使用分散的单细胞数据集构建细胞图谱
想象一个虚拟人体,它具有丰富的复杂性和细节,使科学家能够模拟无法在体内或体外进行的实验。一组中国研究人员通过开发一个无缝的以细胞为中心的数据组装框架,使这一愿景更接近现实,并使用从分散的公共数据集中收集的数据构建了人类整体细胞图谱(hECA)。
他们在4月28日发表于iScience的一项研究中展示了他们的统一信息学框架。hECA还在整合来自多个来源的人类单细胞数据和执行下游分析方面做出了里程碑式的贡献,该成果于7月4日发表在《定量生物学》上。
“hECA的案例研究表明,这种以细胞为中心的集合细胞图谱可以为生物医学研究带来革命,”清华大学的研究作者张学功说。
单细胞测序技术的快速发展,尤其是被称为单细胞转录组学的RNA测序方法,使科学家能够分析单个细胞并检查哪些基因在不同类型的细胞中开启。
世界各地的科学家在人类细胞图谱(HCA)和人类生物分子图谱计划等项目中致力于构建所有不同细胞类型的单细胞分辨率“图谱”。但是关于如何定义和组装细胞图谱仍然存在一些不确定性。
“细胞图谱组装的关键是细胞信息的组织,”张说。
自2017年HCA项目启动以来,已经发表了许多关于细胞图谱的论文,其中大部分是按项目逐项记录和索引的大量单细胞数据的集合。先前的研究认为,细胞映射是关于创建人体的三维骨架,并将观察到的细胞简单地组装到相应的位置。然而,人体对于这种类型的组装来说太复杂了。
相反,“细胞图谱的组装应该传达数据的多方面性质,并允许用户在不同的索引方法中使用自定义条件进行搜索,”张说。
与此同时,大量的单细胞转录组数据正从多机构合作中涌入公共领域,产生了PB级的数据,涵盖所有主要的成人人体器官以及关键的发育或病理阶段。
对于Zhang的团队来说,这些分散的公共单细胞数据提出了另一种构建细胞图谱的方法:从自下而上开始,组装来自多个来源的数据。
为了将来自多个来源的这种规模的数据组装成一个整体图谱,研究人员开发了一个统一的信息学框架,其中包括一个用于存储具有超高维度和体积的单细胞数据的特殊数据库基础设施,以及一个统一的层次注释框架使来自不同数据集的细胞类型标签具有可比性和一致性。研究人员还设计了一个应用程序编程接口来高效地检索图谱中的细胞。
借助这些技术,该团队开发了三种应用组装图集的新方案。首先,他们启用了数据细胞分类,使用逻辑表达式的灵活组合从组装细胞的虚拟人体中选择细胞。他们创建了一个“定量肖像”系统来表示基因、细胞类型和器官的完整信息。他们还为用户构建了一个可定制的参考创建,以定制他们对细胞类型注释任务的参考。
研究人员进行了一系列实验,以验证和说明组装数据在多个应用场景中的质量和可用性。案例包括对全身药物脱靶(药物的意外生物学后果)的调查,这证明了整体细胞图谱在生物医学研究中开辟新可能性的能力。
根据这项研究,这种类型的数据细胞分选可以揭示重要的器官特异性模式,并帮助科学家确定更容易受到靶向药物治疗副作用影响的器官。
研究人员已经开发出策略和技术来整合来自其他综合数据集的更多高质量数据,并将继续改进和更新hECA的未来版本。
推荐阅读
- 怎么设置qq背景,如何设置手机qq的聊天背景为默认的背景
- 2021醉酒驾车的处罚标准是什么,醉酒驾驶怎么处罚2022年,醉酒驾车的处罚标准是什么
- 夏普空调维修服务(夏普空调维修)
- 笔记本电脑聚合物电池和锂电池哪个好,修复笔记本聚合物电池的方法与技巧
- 欧冠欧联杯分配名额,欧冠 欧联杯 欧协杯区别(中超积分榜总排名)
- 2020特岗教师报名时间(2020特岗教师报名时间表)
- 树莓派2和树莓派3的区别(树莓派2和树莓派3对比评测)
- 电脑版qq音乐有没有听歌识曲,电脑版QQ音乐如何听歌识曲
- Intel 酷睿2双核 T6570(intel 酷睿2双核 t6500)
- 自动挡的车怎么开详细教程,自动挡的车怎么开
- 经常刷机会对手机硬件有损害吗文章,经常刷机会对手机硬件有损害吗
- 东京奥运会田径破纪录有哪些选手,东京奥运会田径破纪录有哪些
- 2021安徽省农村信用社联合社招聘100人公告(安徽农村信用社招聘网站)
- 中国中药控股有限公司营销中心是骗子吗(国药集团是骗子)
- 如何更改电脑密码设置,电脑如何更改电脑键盘设置
- 三星安卓系统手机推荐(三星安卓系统手机)
- 铃木吉姆尼改装,吉姆尼改装
- 葛优老婆是谁,葛优老婆个人资料介绍
- 4种催熟香蕉的方法介绍,家庭用催熟生香蕉的方法
- 手机一边充电一边玩是否有害健康,手机一边充电一边玩是否有害