×

大数据发展

caijinling caijinling 发表于2020-08-25 01:19:03 浏览4814 评论0

抢沙发发表评论

随着大数据时代的来临以及大数据在各领域的广泛应用,科学发现的模式将发生重大变化。继实验科学、理论科学、计算科学之后出现了被称为“数据密集型科学”的第四种科学发现新模式,采集、存储、管理、分析和可视化数据成为科学研究的新手段和新流程。这一科学发现新模式强调数据作为科学发现的基础,并以数据为中心和驱动、基于对海量数据的处理和分析去发现新知识为基本特征。如中科院生物所破解埃博拉病毒入侵机制;海量DNA数据认识生命,在1万亿个事例中发现上帝粒子-希格斯粒子,全球碳监测网络,ARIGO海洋浮标,科研众筹(FOLDIT、GALAXYZOO、POLYMATH)等。 [2] 

科学大数据的发展

2001年底,中国启动科学数据共享工程,涉及24个领域。 [2] 
2004年7月,科技部启动国家科技基础条件平台建设。 [2] 
2007年,图灵奖得主、关系数据库的鼻祖JimGray提出“第四范式:数据密集型科学发现”。 [2] 
2010年6月,面向数据密集型负载的全球超算排名GRAPH500项目启动。 [2] 
2013年3月,国际研究数据联盟成立,推动全球研究数据共享交换。 [2] 
2014年,CODATA中国全国委员会举办首届科学数据大会。 [2] 
2015年3月,中科曙光发布“数据中国”战略,提出“让全社会共享数据价值的”愿景理念;8月,国家《促进大数据发展行动纲要》指出要大力发展科学大数据。 [2] 
2016年4月,中科曙光发布数据中国加速计划,布局科学大数据;7月,国家《十三五国家科技创新规划》发布;10月中科曙光科学大数据一体化引擎发布。 [2] 

科学大数据面临的问题

科学大数据的发展面临着科学数据中心建设薄弱、管理水平低、服务不规范、法规不完善、数据资源分散、数据质量参差不齐、全球影响力弱、数据流向国外、重复投资建设、核心技术受制于人、高水平复合型人才缺乏等问题。 [1] 

科学大数据对IT系统的需求与挑战

行业特点:

1、数据量大且变化快
2、分布式异构多源
3、数据多维关联
4、计算分析一体化
5、跨区域协作
6、学科领域差异大 [1] 

系统需求:

1、分布式异构多源数据存储管理
2、PB级/EB级数据处理能力
3、实时计算处理能力:亿级数据毫秒级查询
4、“高性能计算+数据分析挖掘”一体化融合
5、面向数据处理分析全流程提供服务接口
6、实现数据的多维度可视化
7、实现国际化分布式计算环境
8、灵活支持多种计算模式 [1]


群贤毕至

访客