您现在的位置: 公务员期刊网 >> 论文范文 >> 工业论文 >> 数据挖掘论文 >> 正文

大数据挖掘的应用

摘要:大数据挖掘已经成为了一个热门话题,本文介绍了如何更好地收集和处理数据,如何改变大数据的形式来使其更好地应用于文献检索与分析.讨论了数据数据存储和存储的优点和缺点.分析了存在的问题,并提出了进一步研究的基础,对大数据的存储也进行了分析。

关键词:大数据;收集;作用

1“大数据”的定义

大数据(bigdata),是指在一定时间范围内没有办法用常规工具能够进行捕捉、管理和加工的数据集合,这种巨大数量而且数据呈现多样化的高速增长的信息资产需要一种新的处理模式才能具有更强的决策力、洞察力和流程优化的能力。[1]维克托•迈尔-舍恩伯格和肯尼斯•库克耶对于大数据有着不同的看法,在《大数据时代》一文中,他们发现大数据的定义是不能够运用像抽样调查这种捷径方法,而采用对所有数据进行分析处理。大数据具有五个特点,它们分别是:数量多、传播速度快、信息多样化、真实性高和低价值密度。在这里举个例子,有一家超市,将尿布和啤酒放在一起出售,这是从来没有出现过的景象,但是这个措施却使得啤酒和尿布的销量提升了许多。这是一个真实的故事,而是发生在美国沃尔玛连锁店超市的真实案例,这被别的企业一直作为案例来进行研究。众所周知,沃尔玛作为世界上一流的连锁超市,不是没有原因的,它们有着世界上最大的数据研究仓库,数据研究对沃尔玛研究消费者的消费倾向有着很大的好处。沃尔玛对于在其超市购物的消费者的消费原始数据进行集中,在集中原始数据后,对这些原始数据进行分析和挖掘,结果意外的发现,跟尿布一起购买最多的商品竟是啤酒!经过实地调查和分析,有关机构发现了这与美国人的行为方式有着很大的联系。在美国,很多年轻父亲为孩子进行采购尿布时,经?;嵊幸徊糠值娜嘶嵛约夯蛘呒胰瞬晒浩【?。所以将尿布和啤酒销量推高的原因是:美国人的太太催老公为孩子买尿布时,美国男人会为自己采购一定数量的啤酒。按照一般人的思维,谁也不会将尿布销量和啤酒的销量联系到一起,如果不是沃尔玛超市通过数据分析技术对消费者的原始数据进行集中分析挖掘,沃尔玛是不可能发现数据当中存在的秘密。[2]

2大数据对工程项目管理的作用

21世纪是网络时代,网络和信息通讯都得到了快速的发展,信息数据也不甘落后,但这一现象让各行各业都面临着巨大的挑战和珍贵的机遇,其中各种行业的竞争主要是在科技管理方面,这同样是工程中的中心任务,由于依赖着信息技术,将信息与资源作为处理对象。它提供了一个网络平台,这个平台可以收集、处理不同的资源?;诳蒲Ъ际豕芾淼恼庑┨氐?,我国相关的工程项目管理表现出了三种趋势,这三种趋势分别是数据多元化、动态化、信息化管理。众所周知,在传统的产业当中,工程产业是规格最高、规模最大的产业,主要表现在参与主体多,产业覆盖面广。大数据的盛行,肯定会为工程项目管理带来新的发展机遇和空间,还可以提高工程项目的效率和质量。由于项目本身的特点,工程管理可能会出现效率低下的这一现象,而大数据挖掘分析可以为工程管理的效率问题找出解决办法。许多公司对工程项目管理进行评估时,经?;岢鱿种副旯?、评价成本较高等问题,而大数据挖掘为这些问题找到了新的解决办法。将大数据挖掘技术带入到工程项目管理中去,可以从数据库当中找到与其项目管理最为相符的绩效指标,这不单单为公司减小了相应的工作量,还提高了管理效率,何乐而不为呢?在大数据管理中,数据库不仅仅可以将历史数据进行收集、管理、归纳,还能对单一数据进行转换和处理。这些相互关联的统一数据集为项目中的每个数据用户提供透明的信息平台,以减少信息流中的虚假信息和通信障碍的风险。

3数据存储

在获得有用的资源之后,有必要选择合适的数据库或其他存储方式,以便于将来的资源分析?;诖彻叵凳菘獾拇娲⑻匦?,在获取数据之前,没有办法很好的预测大数据的组成。现如今的数据库还不能满足大数据时代到来时对于数据库数据存储需求的要求。如今大数据处理技术面临着许多难题,比如:如何其研究性价比极高的数据存储软件,如何降低数据误差,这些问题都需要科研人员进行研究与解决。

4智能电网

现如今,我国经济发展迅速,我国的智能电网也不断完善,它的数据资源也在飞速增加。在这新一代的信息科技产业技术中,以云计算为代表,已经在电力系统中发挥了重要作用。智能电网的主旨是使用相关的信息来提高对电能的合理管理,从根本上说,智能电网的定义就是通过大数据来对电力系统进行优化。智能电网需要不同时段的全面数据,这些数据存在于智能电网运行、检修和管理等环节上,这些环节上会出现大量,不同结构和形态的数据,这些数据和大数据有着相同的特点,所以我们可以得出结论,大数据对于智能电网的发展有着很大的促进作用。我们通过收集在智能电网数据信息平台提供的信息和计算模型,利用大数据技术,充分调动先进的应用,解决检测领域所存在的问题。大数据技术也被稳定计算和智能报警充分利用,为它们提供精确的数据分析,从而提高效率。如今智能电网仍存在许多的问题,没有得到解决,与此同时,安全性也有了更高的需要,因此下一个阶段的主要任务就是加强电网数据基础架构和信息安全的建设,但是我们所需要知道的是如何加强。这就要求我们获取电网运行、维护和处理时所出现的数据,从这些数据中进行分析得出结论。随着智能电网的不断发展,与智能电网相关的大数据也将呈指数增长。如今的电网信息基础还不能满足未来的需要,所以现在科研人员所需要做的就是对结构进行优化,满足未来的需要,使其的平台基础能够满足未来的发展需求。

5总结

随着时代的发展,数据的量也迅速增长,我们应当正确的利用这些数据,使其发挥最大的价值,但总体来讲,大数据时代才刚刚到来,迎面而来的不仅仅是无限的可能,也有艰难的挑战,其魅力是无穷的,正是这样,我们才会在时代发展的道路上奋勇而前行。

参考文献:

[1]吕竹筠,张兴旺,李晨晖,等.信息资源管理与云服务融合的内涵即共性技术体系研究[J].情报理论与实践,2012,35(09):26-32.

[2]《中国电子科学研究院学报》编辑部.大数据时代[J].中国电子科技研究院学报,2013(01):41-43.

作者:翟天昊 单位:河北省唐山二中

阅读次数:人次