发布时间:2022-01-15
1月6日,中国科学院广州生物医药与健康研究院陈捷凯课题组开发的单细胞数据IO软件“scDIOR”于BMC Bioinformatics杂志在线发表。该软件统一了多种单细胞分析工具的数据结构,使单细胞数据能够在不同平台间快速转换,减少存储和内存消耗,将显著提升单细胞研究的效率。
单细胞测序应用极广,其数据具有样本量大、信息量大、统计和挖掘极为复杂等特点,科学家往往需要不断切换不同软件,不同平台来满足分析需求。然而,单细胞数据在不同平台之间的传输存在技术障碍,导致科学家将大量的时间花费在数据转换上,严重影响研究效率。
为了解决上述问题,陈捷凯课题组开发了软件scDIOR,统一了R和python平台的三种主流的数据结构,即Seurat,SingleCellExperiment和Scanpy。通过scDIOR,单细胞数据以统一的H5格式保存,无论从哪个平台开始,只需两行代码就可实现单细胞数据在不同工具包之间的快速转换,支持转录组和空间组等多种数据类型(可继续迭代增加),最大程度地保留了原始信息。因此,scDIOR可以快速比较一项分析任务在不同工具包的差异;依托H5文件格式的“组”,提供部分数据读取功能,大幅度减少内存消耗和时间消耗;设计了命令行指令,可实现批量数据转化。综上所述,scDIOR可以应用建立一个标准的单细胞数据结构,将不同工具的优势连接起来,帮助科学家更高效地完成单细胞的研究工作。
本研究在陈捷凯研究员和林立惠博士指导下,由生物岛实验室实习研究员冯辉坚完成。软件已经过大量用户使用优化,可在GitHub下载(链接 https://github.com/JiekaiLab/scDIOR),也欢迎提出宝贵意见(可发至feng_huijian@grmh-gdl.cn)。
单细胞数据IO软件scDIOR
scDIOR很方便地实现数据在平台间的转换,将不同工具的优势连接起来
附件下载: