大数据是一个比较抽象的概念,目前尚无确切、统一、公认的定义。小编带大家来看看不同权威对于大数据的定义。
维基百科对大数据的定义是:大数据是指所涉及的数据量规模巨大到无法通过目前主流软件工具,在合理时间内达到截取、管理、处理并整理成为帮助企业经营决策更积极目的的信息。
研究机构Gartner给出了这样的定义:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
涂子沛在《大数据》一书中这样定义大数据:指那些大小已经超出了传统意义上的尺度,一般的软件工具难以捕捉、存储、管理和分析的数据。中国工程院院士邬贺铨认为,大数据是指没有办法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。常规的办法要想把它分析出来是很难的。
总的来看,以上定义中都强调了大数据所涉及的资料量规模巨大,无法通过常规软件工具管理和处理的数据集合。基于此,我们认为:大数据是指基于海量、多样化的数据集合,通过云计算的数据处理与应用模式,快速获取、处理、分析等手段形成的智力资源和知识服务能力。
当前,较为统一的认识是大数据有四个基本特征:数据规模大(Volume)、数据种类多(Variet)、处理速度快(Velocity)、价值密度低(Value),即所谓的四V特性。
第一,数据规模大(Volume)。大型数据集,从TB级别,跃升到PB乃至ZB级别,其容量和规模远远超过传统数据;存储、计算和分析技术与工具的发展,尽可能地确保了数据集的完整性。
第二,数据种类多(Variety)。大数据包括不同来源、不同结构、不同媒体形态的各种数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,这些多类型的数据对数据的处理能力提出了更高要求。
第三,处理速度快(Velocity)。数据生成的速度基本呈指数级增长,而且需要快速、持续的实时分析与处理,以更快地满足实时性需求,即时处理已经成为趋势之一。
第四,价值密度低(Value)。价值密度的高低与数据总量的大小成反比,大数据本身的价值密度是相对较低的,需要对海量的数据进行挖掘分析才能得到真正有用的信息,形成用户价值。如何通过强大的机器算法更迅速地完成数据的价值“提纯”,成为目前大数据背景下亟待解决的难题。
以上就是对于大数据的定义。
转载自网络 不用于商业宣传 版权归原作者所有,侵权删。