此页面上的内容需要较新版本的 Adobe Flash Player。

获取 Adobe Flash Player

大数据

大数据和数据分析不能混为一谈,有哪些区别呢?
作者:   来源:方平解数码   日期:2020-12-06

   提到大数据,现在搞IT的,甚至只要接触到网络的人,没有人不知道,没有人不向往,向往大数据所带来的医疗,交通,预警等方方面面技术的改善及提高。但是很多伙伴将大数据与数据分析理解成一样的东西,但实际上两者是有很大的差异的,下面我们一起来看看。

   大数据是指无法一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

   而数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在使用中,数据分析可帮助人们作出判断,以便采取适当行动。

   数据分析针对所有数据类型而言的,而不是大数据独有的特性。大数据通过数据挖掘以及数据分析实现其价值。数据分析是在数据挖掘的基础上进行的,需要前期通过数据挖掘收集数据以及清晰数据,而后通过数据分析实现数据的最终价值体现。数据分析是大数据的核心,所有数据通过数据分析输出最终的结论以及对企业发展等发展规划起到促进作用。大数据更加偏向于理论概念,也是目前创新思维,信息技术以及统计学技术的综合概述。而数据分析更偏向于数据的执行过程。

   就分析方法而言,两者并无本质区别。数据分析的核心工作是对数据指标的分析,思考和解释。人脑可以携带的数据量极为有限。因此,无论是“传统数据分析”还是“大数据分析”,都需要根据分析思路对原始数据进行统计处理,以获得汇总统计结果供人为分析。两者在此过程中相似,不同之处仅在于处理方法是由原始数据的大小引起的。

   两者之间在机器学习模型方面存在根本差异。“传统数据分析”大多数时候,知识使用机器学习模型作为黑匣子工具来协助分析数据。 “大数据分析”通常是两者的紧密结合。大数据分析不仅会产生分析效果评估,而且还会基于此进行产品升级。在大数据分析的背景下,数据分析通常是数据上墨的序幕,而数据建模是数据分析的结果。

   数据分析更侧重于以一个固定的模型去归纳影响事件结果的因素,分析的大多是已经发生的事情。最关键的不是数据,而是数据分析的方法。但是对于大数据来说却不是这样。有个很形象的比喻,把大数据比作自学的学生,通过对数据不断的应用,大数据系统会根据用户的选择和结果去完善自己,经过一段时间的沉淀,最关键的已经不是数据模型,而是那些积累下来的数据,比如客户行为数据,反馈数据,评价数据等等。系统的结论随着数据的积累而变换,即使可以复制一个相同的模型,但是数据却很难再还原了。

   在如今的大数据时代,即使你并不懂技术,无法参与到大数据的实际应用推广中,至少需要了解懂得相关大数据的一些概念。这样在工作的过程中,也都能起到极大的促进作用。