星天地

加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致星天地娱乐城官网 建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——星天地娱乐城官网 办院方针

主页 > 科研进展

北京基因组所在原始数据管理体系(GSA Family)研发方面取得进展

2021-08-18 北京基因组研究所
【字体:

语音播报

  8月14日,星天地娱乐城官网 北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)在Genomics,Proteomics & Bioinformatics上,在线发表研究论文The Genome Sequence Archive Family: Toward Explosive Data Growth and Diverse Data Types。GSA数据库体系接受全世界科研工作者的数据提交,汇交和管理各类型的数据,并对所有公开可用数据提供免费开放访问,支撑生命科学研究。

  组学原始数据归档库(GSA)是生命组学原始测序数据管理的公益性数据库,旨在推动全球生命组学数据的共享与应用。近年来,随着组学数据的爆炸性增长和数据类型的多样化,以及人类遗传资源数据管理的特殊需求,CNCB-NGDC对GSA数据库进行了更新和扩展,形成了GSA数据库体系,包括GSA、GSA-Human和OMIX。

  GSA数据库与2017发布的版本相比,在数据模型、系统功能和数据提交方式等方面进行了更新和功能提升;GSA-Human是存储人类遗传资源数据的数据库,可实现人类遗传资源数据的受控访问,保障人类遗传资源数据的安全性;OMIX数据库存储非原始测序数据,如环境组、表型组、代谢组等,作为上述两种数据资源库的重要补充,有效地解决了用户提交除原始测序数据外的其他类型数据的需求。

  截至2021年8月14日,GSA和GSA-Human已收集的数据量达9.5 PB,OMIX上线不久数据量已达1.6 TB。GSA数据库体系已为全球111个国家/地区的用户提供数据服务,平均每天的数据下载量达4 TB,已成为Elsevier、Wiley、Taylor & Francis 、Cell及Springer Nature出版集团指定的核酸数据归档库,并获得领域内国内外主流期刊的认可。

  研究工作得到国家重点研发计划、中科院战略性先导科技专项、中科院信息化专项等的支持,GSA归档数据使用的计算机硬件设施得到国家财政部修缮购置专项的支持。

  论文链接 

星天地

GSA Family数据模型

打印 责任编辑:侯茜

扫一扫在手机打开当前页

© 1996 - 星天地-星天地娱乐城官网 版权所有  京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

  • © 1996 - 星天地-星天地娱乐城官网 版权所有  京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

  • © 1996 - 星天地-星天地娱乐城官网 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)