大数据发展

随着大数据时代的来临以及大数据在各领域的广泛应用，科学发现的模式将发生重大变化。继实验科学、理论科学、计算科学之后出现了被称为“数据密集型科学”的第四种科学发现新模式，采集、存储、管理、分析和可视化数据成为科学研究的新手段和新流程。这一科学发现新模式强调数据作为科学发现的基础，并以数据为中心和驱动、基于对海量数据的处理和分析去发现新知识为基本特征。如中科院生物所破解埃博拉病毒入侵机制；海量DNA数据认识生命，在1万亿个事例中发现上帝粒子-希格斯粒子，全球碳监测网络，ARIGO海洋浮标，科研众筹（FOLDIT、GALAXYZOO、POLYMATH）等。 [2]

科学大数据的发展

2001年底，中国启动科学数据共享工程，涉及24个领域。 [2]

2004年7月，科技部启动国家科技基础条件平台建设。 [2]

2007年，图灵奖得主、关系数据库的鼻祖JimGray提出“第四范式：数据密集型科学发现”。 [2]

2010年6月，面向数据密集型负载的全球超算排名GRAPH500项目启动。 [2]

2013年3月，国际研究数据联盟成立，推动全球研究数据共享交换。 [2]

2014年，CODATA中国全国委员会举办首届科学数据大会。 [2]

2015年3月，中科曙光发布“数据中国”战略，提出“让全社会共享数据价值的”愿景理念；8月，国家《促进大数据发展行动纲要》指出要大力发展科学大数据。 [2]

2016年4月，中科曙光发布数据中国加速计划，布局科学大数据；7月，国家《十三五国家科技创新规划》发布；10月中科曙光科学大数据一体化引擎发布。 [2]

科学大数据面临的问题

科学大数据的发展面临着科学数据中心建设薄弱、管理水平低、服务不规范、法规不完善、数据资源分散、数据质量参差不齐、全球影响力弱、数据流向国外、重复投资建设、核心技术受制于人、高水平复合型人才缺乏等问题。 [1]

科学大数据对IT系统的需求与挑战

行业特点：

1、数据量大且变化快

2、分布式异构多源

3、数据多维关联

4、计算分析一体化

5、跨区域协作

6、学科领域差异大 [1]

系统需求：

1、分布式异构多源数据存储管理

2、PB级/EB级数据处理能力

3、实时计算处理能力：亿级数据毫秒级查询

4、“高性能计算+数据分析挖掘”一体化融合

5、面向数据处理分析全流程提供服务接口

6、实现数据的多维度可视化

7、实现国际化分布式计算环境

8、灵活支持多种计算模式 [1]

ZBlogIt

Nice to meet you, too!

caijinling 发表于2020-08-25 01:19:03 浏览4814 评论0

科学大数据的发展

科学大数据面临的问题

科学大数据对IT系统的需求与挑战

行业特点：

系统需求：

少长咸集

群贤毕至