在如今这个信息化的时代,到处都能听到“大数据”:医院通过大数据预测流感趋势、华尔街通过大数据抛售股票、社交平台通过大数据匹配用户、商家通过大数据精准营销……大数据到底是什么?能够这么全能吗?下面我们就来了解一下大数据。
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
从字面上解读,大数据的专业术语是“巨量数据集合”,这个“巨量”就是大数据中的“大”,如此大量又不规则的数据,是无法通过传统的数据采集以及处理方式分析、查看的。因此,在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中说:“大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。”这就需要更加先进的云计算技术来支持,技术上包括这些对海量数据的采集,过滤,清洗,储存,处理,查看等部分。从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
大数据不仅仅包括数字,还包括图片、文本、视频、交互记录等等。具有大量、高速、多样、价值等特点,主要应用于计算机。业界将其归纳为5个"V"——Volume(数据体量大)、Variety(数据类型繁多)、Velocity(处理速度快)、Value(价值密度低)、Veracity(真实性)。
大数据拥有以下几个特征:
(1)容量大(Volume):数据的大小决定所考虑的数据的价值和潜在的信息;大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。
(2)种类繁多(Variety):数据类型具有多样性; 包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。
(3)速度快(Velocity):指获得数据的速度快,时效高;这是大数据区分于传统数据挖掘最显著的特征。
(4)真实性(Veracity):数据的质量高
(5)价值高成本低(value):合理运用大数据,以低成本创造高价值。如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。
大数据的价值并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。
大数据在各行各业的应用十分广泛,比如在零售业中,企业利用相关数据和分析可以帮助它们降低成本、提高效率、开发新产品、做出更明智的业务决策等等。它的价值在于:
1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销;
2) 做小而美模式的中小微企业可以利用大数据做服务转型;
3) 面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值。
比如,做专业时装零售的企业,为了向客户提供差异化服务,从社交网络上收集了大量社交信息,参考各类时尚产品的营销模式,分析出最具有价值的两类客户:高消费者和高影响者。通过用户间的口碑宣传,从而达到交易数据与交互数据的完美结合。这家企业就是通过社交平台上的数据获得了客户的数据,使他们的业务服务更具有目标性。
零售企业也监控客户的店内走动情况以及与商品的互动。它们将这些数据与交易记录相结合来展开分析,从而在销售哪些商品、如何摆放货品以及何时调整售价上给出意见,此类方法已经帮助某领先零售企业减少了17%的存货,同时在保持市场份额的前提下,增加了高利润率自有品牌商品的比例。
既有的技术架构和路线,已经无法高效处理如此海量的数据,而对于相关组织来说,如果投入巨大采集的信息无法通过及时处理反馈有效信息,那将是得不偿失的。可以说,大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。
转载自网络 不用于商业宣传 版权归原作者所有,侵权删。