大数据,又称巨量资料,其规模巨大到无法通过人脑,甚至主流软件工具来收集和处理,需要更新的处理模式(如Hadoop技术[ Hadoop,是由著名的Apache软件基金会开发的一个能够对海量数据进行分布式处理的软件架构,它可以通过高效、可靠、可伸缩的方式对海量数据进行存储与处理。Hadoop架构最核心的设计是HDFS(Hadoop Distributed File System,即“Hadoop分布式文件系统”)和MapReduce;其中,HDFS为海量数据提供了存储功能,MapReduce为海量数据提供了计算功能。]),才能实现对海量数据的收集、管理、内在价值挖掘与分析,并从对海量数据的处理中,获得更强的决策力、洞察发现力和流程优化能力。总之,大数据是一种海量、高增长率和多样化的信息资产。
可以说,大数据是人类科技发展到一定高度的产物。我们回顾大数据近几年的发展历程,可以看到,大数据在舆论层面开始备受关注的一个标志性事件,是在2011年5月,全球知名咨询公司麦肯锡(McKinsey Company)发布了一份报告《大数据:创新、竞争和生产力的下一个新领域》,这是专业机构第一次全方面地介绍和展望大数据。