人类社会正在逐步进入一个数据越来越难以处理的时代。而大数据的出现也为传统的科研方法带来了巨大的挑战,并带来了许多新的研究方法和技术手段。
1. 什么是大数据?
和许多迅速出现的概念一样,大数据的定义和运作方式也是多种多样的。从早期的定义——大数据是大到无法放入Execl表中或存储在一台电脑上的数据,到现在更为复杂的评价方式,大数据逐渐有了一些固有特征。
(1)体积非常巨大,一般为tb或pb的数据
(2)处理速度快,实时产生或者接近实时产生;
(3)种类多,有组织或者无组织;
(4)范围广,力求覆盖整个种群或系统;
(5)分辨率高,具有独特指标;
(6)在本质上具有关系,包含支持不同数据集链接的公共内容;
(7)灵活,可扩展(可以很容易的添加新字段),可伸缩性(可以快速扩展大小)。
因此,大数据不是简单地表示数据的体积很大。
2. 大数据时代科研方法的特征
数据是科学研究的重要基础。数据的不断膨胀与积累已经到了引起变革的程度。在科学研究领域,科研方法正在发生着极大的变化。与传统的科研方法相比,大数据时代的科研方法体现了一些新的特征。
(1)面向全体数据
过去由于采集、记录、存储和分析数据工具有限,统计学发明了抽样统计方法,通过对少量数据进行分析得出研究对象的全部特征。而随着大数据时代的到来,采集、记录、存储和处理数据都已不是难事。面对复杂的研究对象,充分利用大量数据甚至是海量数据来全面、完整的描述研究对象,可以发现研究对象的规律或本质。因此,大数据时代给传统科研方法带来的第一个变革就是面向全体数据并提供了具体的技术途径。
(2)重视相关关系
大数据由于其数量庞大,结构复杂,呈现出的往往都是非线性关系。因此大数据分析时一般将所有数据作为一个整体,运用大数据技术从宏观上把握数据之间的关联性。这与小数据时代对每个数据之间的因果关系进行探索是不同的。
(3)接受多样化
大数据技术的兴起打破了对数据统一性的要求,为实现数据多样性找到了具体的实践方法。为了扩大数据规模而接受多样性,运用快速的算法和高效的软件,可以获得以往未被关注到的细节和新发现。
(4)增强预测性
对已有的实验结果进行延伸是科学的主要目标。在大数据时代,将收集的数据建模评估,将会得到较好的预测。
大数据时代所带来的新的科研方法极大地提高了科学发现的概率,扩展了科学研究的事业,促进了不同学科之间的合作。现在,数据密集型科学将成为科学研究的第四种范式。未来,充分利用科研新方法所带来的有利条件,将促进科研活动的不断发展。
扫描下方二维码,关注【埃米编辑】公众号,获取更多SCI论文写作资料。
编译/冯瑶
校对/石珺怡
参考资料:
[1] https://journals.sagepub.com/doi/full/10.1177/2053951714528481
[2] 张峰, 张迪. 论大数据时代科研方法新特征及其影响[J]. 科学学研究, 2016, 33(2):166-170.
图片来源:
[1] https://stockphoto.com/
[2] Lynch C. Big data: How do your data grow?[J]. Nature, 2008, 455(7209):28-29.